-
科普神文,GPT背后的Transformer模型
上次《解读AI大模型,从了解token开始》一文中,我从最基础的概念“token”着手,跳过了复杂的算法逻辑,相信已经让大家建立起对AI大模型工作原理的清晰认知。 但如果仅仅只是依靠对文本的编码与数...
-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
玑9300旗舰5G生成式AI移动芯片,采用4nm制程的芯片,具备高性能和低功耗特性,支持330亿参数大模型的AI应用,预计于2023年底上市。 学而思大模型MathGPT完成备案 学而思的大模型M...
-
微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
oT)推理的数学难题任务中都有不错的表现。 但例如 LLaMA-2 及 Baichuan-2 等开源大模型,在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力,研究团队提出了 Le...
-
OpenAI CEO:GPT-4周活用户数达1亿,仍是世界上能力最强AI大模型
的周活用户数达到1亿。奥特曼还特别提到“公司在今年3月发布的GPT-4,至今仍是世界上能力最强的AI大模型”。 自今年3月通过API(应用程序编程接口)发布ChatGPT和Whisper模型以来,该公...
-
百度百家号:度加创作工具平台“AI笔记”功能将下线
C端-首页【发布】-【动态】使用【AI创作】功能。 据了解,在此之前,百度百家号宣布基于百度AI 大模型上线「百家号 AI 助手」功能,创作者可体验基于热点内容一键生成优质文章,可登录百家号PC 后...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了 LLaMA-Rider,该方法赋予了大模型在开放世界中探索任务、收集数据、学习策略的能力,助力智能体在《我的世界》(Minecraft)...
-
北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界
北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
件压缩技术 NeuroPilot Compression,可以更高效地利用内存带宽,大幅减少 AI 大模型对终端内存的占用,支持终端运行10亿、70亿、130亿、最高可达330亿参数的 AI 大语言模...
-
独家|美团首个AI产品“Wow”亮相,押注交互伴聊
个月内,国内掀起了一股AI创业热潮,美团也参与其中。 据《豹变》报道,一位美团内部人士表示:“美团做大模型,几乎是与王兴投资王慧文的公司同步进行的。” 而王兴投资王慧文的AI公司时间节点则是3月,美团...
-
ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过
着科技圈里最好的关系: 我们负责做最好的基础设施,你们负责做最好的模型。 与此同时,刚刚连发了两大大模型产品的马斯克,在联机打暗黑四。...