-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务 在OpenAI首届开发者大会DevDay活动上,OpenAI发布了GPT-4Turbo模型和自定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态AP...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
昨日晚间,联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片,采用台积电第三代4nm 制程。该芯片预计于2023年底上市。 这款芯片采用全大核架构设计,提供高智能、高性能、高能效、低功耗的特性,为用户带来卓越的生成式 AI 体验。 天玑9300采...
-
认知计算机如何帮助人工智能减少能耗
我们都听说过人工智能如何让我们的生活变得更加高效,但真正的问题是,是什么让人工智能变得高效?人工智能的灵魂是数据,在全球范围内,数据中心每年消耗约200太瓦时的电力。这些能源足以支持国家每年2000万个家庭的生活,并可为3.33亿辆汽车提供一年的动力。...
-
李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。 ht...
-
元象XVERSE开源650亿参数通用大模型XVERSE-65B
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。 模型通过训练了2....
-
国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练
国内规模最大的开源大模型来了: 参数650亿、基于2.6-3.2万亿token训练。 排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能无条件免费商用。 它就是来自深圳元象公司的XVERSE。 根据算力、资源限制和具体任务需求的不同,我们能对...
-
研究称:向GPT-4等AI模型添加“情感提示词”会提高性能
最新研究发现,当用户表达紧急感或压力等情感时,AI模型如GPT-4可以表现得更好。这一发现对于在其AI应用中的开发者和企业家具有重要意义,提示了一种引入情感语境的新方法,以提高AI性能。 这项研究发现,添加情感因素的提示,被称为“情感提示”,可以提高AI在...
-
大模型: 模型大了难在哪里?
大家好,我是Tim。 自从GPT模型诞生以来,其参数规模就在不停的扩大。但模型并非简单的直接变大,需要在数据、调度、并行计算、算法和机器资源上做相应的改变。 今天就来总结下,什么是大模型,模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...
-
GPT手把手教你你回答百度面试
写在前面 大家好, 我是小牛,最近GPT让人打开眼界,我最近会出一系列利用GPT回答面试官后端面试的系列文章,希望对大家有所帮助!下面开始面试题和回答 简述Semaphore Semaphore 是一种用于控制并发访问的机制,它可以限制同时访问某个资源的...
-
使用Llama index构建多代理 RAG
检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。 但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...
-
八张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍
随着GPT-4的架构被知名业内大佬「开源」,混合专家架构(MoE)再次成为了研究的重点。 GPT-4拥有16个专家模型,总共包含1.8万亿个参数。每生成一个token需要使用大约2800亿参数和560TFLOPs 然而,模型更快、更准确的代价,则是巨大...
-
海洋工程中的生成式AI:专有数据集不足正限制其实际应用
现代计算正显著改进造船与海洋工程的设计与建造流程,但相当数据集的捉襟见肘正在阻碍其进一步融合。 造船与海洋工程(NAME)这一学科名称可能只有几百年的历史,但其起源却可以追溯至几千年之前的古代文明,当时人类就已经在建造船只来探索世界、开展商业活动。包括...
-
比Transformer更好,无Attention、MLPs的BERT、GPT反而更强了
从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型,Transformer 正以锐不可当之势席卷这个世界,但人们也不禁会问:Transformer 是唯一选择吗? 斯坦福大学和纽约州立大学布法...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
OpenAI将组建新团队 以评估和减轻与人工智能相关的灾难性风险
10月27日消息,据外媒报道,当地时间周四,美国人工智能研究公司OpenAI宣布,它将组建一个名为Preparedness的新团队,以评估和减轻与人工智能(AI)相关的“灾难性风险”。 OpenAI表示,该团队将由麻省理工学院可部署机器学习中心主任亚历山大...
-
OpenAI 宣布成立新团队以评估和防范人工智能模型可能带来的「灾难性风险」
OpenAI 今天宣布,已成立一个名为「准备组」(Preparedness)的新团队,由麻省理工学院可部署机器学习中心的主任亚历山大·马德里(Aleksander Madry)领导,以评估、检测并预防人工智能模型可能导致的「灾难性风险」。 据 Linke...
-
清华光电计算新突破:芯片性能提升万倍,研究登顶Nature
随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。 中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。 近日,清华大学团队在超高性能计算芯片领域取得新...
-
AI初创公司CentML融资2700万美元 用于解决AI模型高成本问题
AI初创公司CentML最近成功完成了一轮扩展种子融资,募得2,700万美元,旨在开发能够降低机器学习模型部署成本并提高性能的工具。这次融资得到了Gradient Ventures、TR Ventures、Nvidia以及微软Azure AI副总裁Mish...
-
LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证
「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」 一直以来,图灵奖得主 Yan...
-
突发!英伟达H800/A800禁令竟提前生效,但4090意外豁免
芯片禁令发布六天后,美国政府突然变卦——宣布新规提前生效,比原计划整整提前了24天。 也就是说,美国撤回了30天的豁免期。即日起,中国无法再获得任何英伟达尖端AI芯片。 而根据钛媒体报道,腾讯、字节跳动等赶在禁令生效前大量采购的H800,至今尚未拿到现...
-
元象 XVERSE 与腾讯音乐推出 lyraXVERSE 加速大模型
元象 XVERSE 与腾讯音乐合作推出 lyraXVERSE 加速大模型,将应用于音乐助手 “AI 小琴” 中。 用户可以通过点击 QQ 音乐上的 “AI 一起听” 按键来与升级版的 “AI 小琴” 互动,她将根据用户的提问、播放习惯和心情提供闲聊、推歌、...
-
骁龙8 Gen3正式发布:8K240手游成真!AI无处不在性能飙升98%
快科技夏威夷高通骁龙技术峰会2023现场报道: 一年一度,它又来了!但是今年,它来得更早一些! 北京时间10月24日,高通正式发布了新一代旗舰移动平台骁龙8 Gen3”(第三代骁龙8 ,安卓旗舰手机一年一度的新平台登场。 在激烈的残酷竞争下,在AI时代浪潮...
-
高通发布第三代骁龙8移动平台,为下一代旗舰智能手机带来生成式AI
在今日凌晨的骁龙峰会期间,高通技术公司正式推出全新旗舰移动平台——第三代骁龙®8,它是一款集终端侧智能、顶级性能和能效于一体的强大产品。作为Android旗舰智能手机SoC领导者,高通技术公司的全新平台将在全球OEM厂商和智能手机品牌的终端上得到广泛采用,...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...
-
自动驾驶传感器融合面临的三大挑战
随着越来越多的自动驾驶汽车难题出现,挑战的难度越来越大。 汽车工业正在将传感器融合作为应对日益增加的自动驾驶汽车所需的复杂性和可靠性的最佳选择,为汽车内部如何管理和利用来自多个设备的数据的另一转变奠定了基础。 事实证明,向更大的自治迈进比起初所期望的要复...
-
一文读懂全新深度学习库Rust Burn
一、什么是Rust Burn? Rust Burn是一个全新的深度学习框架,完全使用Rust编程语言编写。创建这个新框架而不是使用现有框架(如PyTorch或TensorFlow)的动机是为了构建一个适应多种用户需求的通用框架,包括研究人员、机器学习工程...
-
DeepMind:大模型又曝重大缺陷,无法自我纠正推理,除非提前得知正确答案
大语言模型又一项重大缺陷被DeepMind曝光! LLM无法纠正自己推理中的错误。 「Self-Correction」作为一种让模型修正自己回答的技术,在很多类型的任务中都能明显改进模型的输出质量。 但是最近,谷歌DeepMind和UIUC的研究人员却发...
-
Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动
今天开始,人类离帮忙做家务的机器人,又近了一步! Meta宣布推出Habitat 3.0,目的是开发出社会化的AI智能体,这意味着社交智能机器人已经进入新的里程碑阶段。 这些具身智能背后的关键,当然就是AI Agent。有了它们,机器人可以和人类协作...
-
老黄最新专访:时间倒流30岁,我绝对不会创办英伟达!
华裔企业家凡尔赛圈又有一位大咖加入——Jensen黄。 在最近的一次公开采访中,黄老板被问到,「如果现在你回到30岁的时候,再次走进当初决定创立英伟达的那家餐厅,你还会做出同样的选择吗?」 黄老板斩钉截铁地说「不,我不会!」。 听到黄老板出人意料的回答...
-
参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了
如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能,因此更倾向于通用模型。 不过如果想要在某一领域(如医学、金融或科学)内最大限...