-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yon...
-
我们尝试用AI创作了一条圣诞动画(附ChatGPT+Pika等制作流程全记录)
:ChatGPT+Copilot+Midjourney 接下来,我们把各个镜头的文字描述,修改成易于大模型理解的提示词后,喂给了GPT4,发现最大的问题是它并不能很好的理解文本,生成的图片无论是准确度...
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: 图片 无论是中英文的大段文字: 图片 还是包含了公式的文档图片:...
-
LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention
上插入不同的插件小模型(1.2 M),用于处理不同场景任务,而不用对每个场景任务都准备一个 7B 的大模型 支持多模态输入:支持方式就是简单将图片的 tokens 加到 adaption prompt...
-
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。 那么,如果大模型可以在代码中「思考」,会如何呢? 最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了...
-
百度发布2023年度沸点榜单:生成式AI等入选科技热词
流行语,包括显眼包、i人e人、citywalk、尊嘟假嘟等。 具体来说,沸点年度科技热词包括了AI大模型、数字经济、中国空间站、量子计算机、生成式AI、数字孪生、提示词工程师、悬挂 根据百度发布的沸...
-
机器学习模型性能的十个指标
尽管大模型非常强大, 但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比,解释现实中的物理现象,未必要用到量子力学。有些相对简单的问题,或许一个统计分布就足够了。对机器学习而言, 也不用...
-
谷歌被打脸!Gemini Pro被证实和GPT3.5差距不大
个任务上的全面优势。Gemini Pro虽然在某些任务上稍显不足,但整体表现与GPT-3.5相近,为大模型领域的竞争增添了新的火花。 论文地址:https://arxiv.org/pdf/2312....
-
ChatGPT(小程序版)- 可AI绘画、内置各种功能
在此向各位安利一款名为“AI硅基小助手”的小程序,它采用了预训练的类chatGPT的大模型,希望各位小白能够提前感受到 AI的便利。 chatGP在网络上可...
-
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer...