-
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理跨模态内容。 本周五,Goog...
-
高德将落地首个时空智能城市:开放云睿大模型
快科技5月20日消息,据媒体报道,高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境AI三维重建平台,打造时空智能体应用生态。 据悉,高德云睿时空大模型是业界首个以地图点、线、面、体等时空类数...
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
得到了开源社区的广泛关注。 甚至有人猜测,GPT-4可能也使用了MoE技术实现了超过一万亿参数的超大模型。 对于Transformer架构的语言模型,MoE主要有两个元素: 一是使用参数更为稀疏的M...
-
从“天价”到“骨折价”,大模型要变天了
十年后,国内云厂商又打起来了! 近一个月,国内云厂商掀起了新一轮的大模型降价潮。这意味着AI竞争已经不仅仅是一场军备技术竞赛这么简单,各头部厂商也在考虑如何赚钱了。 在这场价格战中,包括火山引擎、阿里...
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~ 截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。 图片 然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时, 人家竞技场背后的组织LMS...
-
谷歌数学版Gemini解开奥赛难题,堪比人类数学家!
研究生水平的Ai2D测试上甚至达到了94.4%,1.5 Flash也有91.7%的高分。 对于多模态大模型,图表和文档的理解比较有挑战性,因为需要对图像信息进行准确的解析和推理。 Gemini 1.5...
-
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3
Falcon 2不仅具备多语言能力,而且支持多模态,可以将视觉输入无缝转换为文本输出,这种功能是当今大模型市场中的首创。 只需要在用户界面上传一张图片并输入提示,就可以得到一段关于图片的文字描述 多...
-
AI日报:viva发布类Sora视频生成模型;Open AI 宫斗第二季详解;索尼禁止未授权使用其音乐“炼丹”:Coze上线Web SDK
警告,禁止使用其音乐数据训练AI模型 索尼音乐集团警告700多家公司禁止未经许可使用音乐数据训练AI大模型,强调尊重歌曲作者和唱片艺术家的知识产权。该举措体现了对知识产权的重视和对AI模型在音乐数据使...
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,Meta 发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 SOTA 模型,并在代码生成任务上全面领先。 此后,开发者们便开始了本地部署和实现,比如 llama3 的中文...
-
GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4
。 针对前两个LLM, 研究者通过改编GPT-4和GPT-3.5探索性研究中表现最佳的提示,来指示大模型如何去响应消息。 研究人员称,解释图灵测试的一个核心挑战是,系统表现出色可能源于两种原因: -...