-
大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好
齐和基础推理。 此外,以往工作主要将 ReST^??用于相对较小的模型(最高 70 亿参数),对于较大模型的可扩展性受限。因此,本文旨在探究模型生成的合成数据与人类生成的数据在以下两个具有挑战性但研究...
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: 图片 无论是中英文的大段文字: 图片 还是包含了公式的文档图片:...
-
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
思维链(CoT),最具开拓性和影响力的提示工程技术之一,能增强LLM在推理决策中的表现。 那么,如果大模型可以在代码中「思考」,会如何呢? 最近,谷歌DeepMind、斯坦福、UC伯克利团队联手提出了...
-
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer...
-
【AIGC】baichuan-7B大模型
百川智能|开源可商用的大规模预训练语言模型baichuan-7B大模型 概述 baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大...
-
深度解读 | 搭载谷歌最强大模型Gemini的Bard能否赶上ChatGPT
迎关注我的公众号,获取我的更多前沿科技分享 昨天早上看到了相关的报道,谷歌昨天发布了 "号称最强的大模型" Gemini,还是熟悉的字眼、还是熟悉的配方。之前谷歌一直在 AIGC 的竞争相对于微软的...
-
Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU,适配无GPU的场景)
一、模型简介 原子大模型Atom由Llama中文社区和原子回声联合打造,在中文大模型评测榜单C-Eval中位居前十(8月21日评测提交时间)。 ...
-
清华特奖焦剑涛大模型创业:突破GPT-4工具使用能力,搞开源种子轮融资七千万
sflow,今年9月刚刚亮相,并当即宣布千万美元级种子轮融资。 它在短短不到3个月的时间就发布了2代大模型NexusRaven,其中第二代直接单点突破GPT-4,引起开源社区大量关注。 NexusRa...
-
自研大模型上车双足机器人,西湖大学系具身智能曝光
双足机器人赛道,又迎来一名搭载AI大模型的玩家。 西湖机器人,西湖大学机器智能实验室的转化项目,被曝将重点涉猎双足机器人领域,并且是搭载GPT大模型的版本,以行为/轨迹为核心那种。 目前,该公司在市...
-
360智脑通过国家大模型标准符合性测试
12月22日,在全国信息技术标准化技术委员会人工智能分委会全体会议上,国内首个官方“大模型标准符合性评测”结果公布,360集团与百度、腾讯、阿里四家率先通过评测。 该测试由中国电子技术标准化研究院发起...