-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
ChatGPT现在允许用户直接从 Google Drive、Microsoft OneDrive 导入文件
OpenAI 本周宣布,其标志性大型语言模型(LL)ChatGPT 已更新,用户现可直接从外部云盘 Google Drive 和 Microsoft OneDrive 导入文件。该功能适用于 ChatG Plus、Team 和 Enterprise 用户,...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、李彦宏:百度搜索已有11%结果...
-
李彦宏:百度11%的搜索结果都由AI生成
快科技5月17日消息,百度创始人、董事长兼首席执行官李彦宏在2024年第一季度财报电话会议上透露,目前百度搜索结果中已有11%由AI生成。 李彦宏认为,尽管百度搜索的AI重构工作仍处于早期阶段,但搜索服务最有可能成为AI时代的杀手级应用”。 百度在AI领...
-
又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
前言 该模型结合了 SigLIP 视觉模型和 Gemma 语言模型,这两种模型都是开放组件,使得PaliGemma在处理视觉与语言结合的任务上表现出色。 PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemm...
-
AI日报:抖音测试AI购物小助手;GPT-4o再秀神操作惊呆网友;华为“天生会画”App发布;小米大模型通过备案
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 1、抖音试水AI电商 测试AI购物小助手 抖音电商正在测试首款面向C端的AI电商服务“AI购物小助手”,...
-
红帽用RHEL AI和OpenShift AI塑造开源AI的未来
发展至今,AI技术对工作方式、决策过程乃至商业模式的重塑已经逐渐具象化。 红帽,作为开源解决方案的领军企业,在近日的在Red Hat Summit上,红帽展示了从RHEL AI的推出到InstructLab模型对齐工具的集成,再到OpenShift AI...
-
知识图与大型语言模型的协同作用
从非结构化文本中提取有价值的见解是金融行业的关键应用。然而,这项任务往往超出了简单的数据提取,需要高级推理能力。 一个典型的例子是确定信贷协议中的到期日,这通常涉及破译一个复杂的指令,如“到期日应在生效日期三周年之前的最后一个工作日”。这种级别的复杂推...
-
小米大语言模型MiLM正式通过大模型备案:将应用于汽车、手机、智能家居等产品
快科技5月16日消息,小米官方宣布,小米大语言模型MiLM正式通过大模型备案。 据了解,通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋...
-
WOT大会日程上线:我们找来数十位大模型实践企业现身说法
这两天的技术圈里,估计大家都在摩拳擦掌等待体验OpenAI的GPT-4o(o为Omni缩写,意为“全能”)有多“全能”吧。 我们无意给市场泼冷水,只是要提醒大家,想要让大模型真正落地,市场的热,并不意味着应用实践的成熟。尤其在企业级场景中,为什么大模型落...
-
一文读懂主流领先的 SLM(小型语言模型)
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - SLM(小型语言模型 。 在 AI 狂卷的浪潮中,LLM(大型语言模型 无疑成为了整个互联网乃至科技界的焦点所在。以 GPT-3、BERT 等为代表的 LL...
-
小米AI大模型MiLM通过备案 将应用于手机、汽车产品中
5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。 5月15日,北京市生成式人工智能服务新增已备案信息正式公布。此次19家企业新增备案,包括了北京小米科技有限责任公司“小米”、腾讯...
-
Ollama如何构建自己的Llama3中文模型
Ollama Ollama 是一个开源的大型语言模型(LLM)服务工具,它允许用户在本地机器上运行和部署大型语言模型。Ollama 设计为一个框架,旨在简化在 Docker 容器中部署和管理大型语言模型的过程,使得这一过程变得简单快捷。用户可以通过简单的...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
思维链被推翻!纽约大学新研究:大模型推理步骤或可省略
纽约大学的最新研究对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,该技术原本被认为能够提升大模型的推理能力。研究显示,使用省略号代替具体的推理步骤,模型的推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是提升性能...
-
Android即将推出基于AI的诈骗电话检测功能
在 Google 的 I/O 开发者大会上,Google 宣布正在测试一项新的通话监测功能,以提醒用户正在与可能试图欺诈他们的人进行通话,并鼓励他们结束此通话。Google 表示,该功能利用了 Gemini Nano 技术,这是公司为 Android 设备...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
HPE Aruba Networking的前瞻视角:构建AI赋能的安全融合网络
数字化时代,网络不仅是连接世界的纽带,更是推动商业和社会进步的关键力量。随着移动设备、物联网(IoT 和云服务的爆炸性增长,用户对网络的依赖达到了前所未有的水平。一个能够随时随地提供安全、高效接入的网络环境,无论对个人还是企业,都已成为刚需。然而,这一需...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
刚刚,Ilya官宣离职OpenAI,“下一个项目意义重大”
刚刚,久未露面的Ilya Sutskever突然发声! 官宣离开OpenAI,已经有了下一个计划,但目前还不能透露细节。 近十年后,我决定离开OpenAI。 公司的发展轨迹堪称奇迹,我相信,在Sam Altman、Greg Brockman、Mira...
-
突发!OpenAI首席科学家Ilya官宣离职,GPT-4负责人接任
今天,OpenAI 联合创始人、首席科学家 Ilya Sutskever 发推宣告离职。 在 OpenAI 工作近 10 年后,我做出了离开的决定。OpenAI 的发展轨迹可以称得上是奇迹,我相信 OpenAI 会在 Sam Altman、G...
-
OpenAI 推出 Mac 版 ChatGPT 应用,今年晚些时候推出 Windows 版
IT之家 5 月 14 日消息,OpenAI 终于推出了 ChatGPT 桌面版应用程序,该公司在官方公告中表示:“从今天开始,我们将首先向 Plus 用户推出 macOS 应用,并在未来几周内向更广泛的用户开放。我们还计划在今年晚些时候推出 Wind...
-
分析师警告,AI 热潮将导致高端内存芯片供应紧张
根据分析师的预测,由于爆炸性的人工智能需求推动了高端内存芯片的短缺,高性能内存芯片在今年很可能仍然供不应求。全球两大内存芯片供应商 SK Hynix 和 Micron 表示,他们的高带宽内存芯片已经售罄,2025年的库存也几乎售罄。晨星的股权研究主管 Ka...
-
保护生成式人工智能前沿:人工智能防火墙的专用工具和框架
在本文将介绍用于提示检查和保护或人工智能防火墙的专用工具和框架。 生成式人工智能的崛起和新兴的安全挑战 生成式人工智能(AI 的飞速发展带来了一个前所未有的创造力和创新时代。与此同时,这种变革性的技术也带来了一系列新的安全挑战,需要迫切关注。随着人工智...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
OPPO 下一代大数据 AI 一体架构实践
一、技术架构 OPPO 大数据场景丰富,拥有海外的 AWS 功能云,国内自建机房,机器规模超过万台,在印度则是使用混合云模式。 首先来介绍一下 AWS 上功能云 EMR 的实践。 1. 云原生计算架构 OPPO 早期全部采用 EMR,其存在以下一些问题...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
看红帽如何在RHEL与OpenShift中玩转生成式AI
市场上有很多生成式AI平台的选择,为什么要选择红帽? 红帽总裁兼CEO Matt Hicks直言红帽的不同之处在于运行位置的核心灵活性。企业既可以对小型开源模型进行混合部署,也可以在公有云或自有数据中心训练模型,同时支持主要的GPU供应商。 最近在R...
-
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。 与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。 以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。 黑客“光头哥”Tib...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司
关于大模型分词(tokenization),大神Karpathy刚刚推荐了一篇必读新论文。 主题是:自动检测大模型中那些会导致“故障”的token。 图片 简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少...
-
小心!最新AI看一眼照片就定位你在哪里,精确到经纬度
有点恐怖。 现在,AI只需随意一张照片,就能知道你在哪里,而且是可以精确到经纬度的那种! 例如下面这张随便到不能再随便的自拍,你能猜到小姐姐在哪里吗? 这事交给现在的AI来处理,它只需要“看”一眼,就能把照片里的“底裤都给扒出来”: 美国,加利福尼亚...
-
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
Meta FAIR 联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。 众所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例,其训练总共需要 1,720,320 GPU hours。由...
-
OpenAI 部署新功能,ChatGPT 将具备电话通话能力
OpenAI 正在为其流行的语言模型 ChatGPT 部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。 为了实现这一功能,OpenAI 已经部署了必要的 WebRTC(Web Real-Time Com...
-
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024
遇到一个问题用不同表达方式prompt时,大模型往往会给出两种不同的答案。 比如,「秘鲁的首都是什么」,「利马是秘鲁的首都吗」。 对于这种回答不一致的问题,科学家们纷纷为大模型的「智商」担忧起来。 正如了LeCun所言: LLM确实比狗积累了更多的事实知...
-
生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 当前,RAG(检索增强生成 系统的新评估似乎每天都在发布,其中许多都集中在有关框架的检索阶段。然而,生成方面——模型如何合成和表...
-
ChatGPT之父OpenAI CEO:iPhone是最伟大的技术产品
快科技5月12日消息,据国外媒体报道,ChatGPT之父、OpenAI首席执行官山姆奥特曼日前参加了播客节目All-inPodcast”。 在访谈中奥特曼表示,iPhone是人类历史上制造出的最伟大的技术产品之一。 当被问及语言模型在设备端的情况如何呢”时...
-
Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索
Siri Ultra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。 Siri Ultra利用Cloudflare Wo...
-
奥特曼"剧透"OpenAI发布会:不是GPT-5,也不是搜索引擎 媒体爆料:是语音助手
5月11日消息,美国时间周五,人工智能初创公司OpenAI CEO萨姆·奥特曼(Sam Altman)在社交媒体X上发布了一条推文,调侃称将在本周一揭晓的“新产品”“感觉像魔法一样”。 【图注】 萨姆·奥特曼: 不是GPT-5,也不是搜索引擎,但我...
-
图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
这几天,AI届的盛会——ICLR在维也纳举办。 OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。 现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。 毫无意外地,ICLR 2024展厅也变成了追星现场。热闹的气氛...
-
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?
2023-2024年,以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型(Multimodal LLMs)已经在文本和图像等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。 然而,对于这些模型的评测多集中于语言上的任务,...
-
AI游戏“换你来当爹”在哪玩 “换你来当爹”网页入口地址
在人工智能技术的推动下,游戏行业正在经历一场革命。最近,一款名为《换你来当爹》的AI游戏引起了广泛关注。这款游戏利用了最新的大型语言模型(LLM)技术,通过AI实时生成剧情和对应图片,为玩家提供了一种全新的游戏体...
-
扩散模型与文生视频
一、快速发展的文生视频 在当前的人工智能领域,文生视频技术有着引人注目的进展。该技术的核心任务非常明确,就是利用文本指令来控制视频内容的生成。具体而言,用户可以输入特定文本,系统则根据这段文本生成相应的视觉画面。这一过程并不局限于单一的输出,相同的文本可...
-
研究人员发现了针对云托管AI模型的“LLM劫持”计划
据网络安全研究人员透露,他们发现了一种新颖的攻击方式,利用窃取的云凭证针对云托管的大型语言模型(LLM)服务,目的是向其他威胁行为者出售访问权限。该攻击技术被 Sysdig 威胁研究团队命名为 LLMjacking。 研究人员 Alessandro Br...
-
人工智能正在摧毁互联网内容生态系统
苹果公司的新iPadPro的广告展示了一台巨型工业液压机如何将人类文化艺术的标志性器具(乐器、书籍、绘画材料等 无情碾压成粉末。该广告一经播出引发了全球文化界的广泛声讨。 美国电影制片人贾斯汀·贝特曼在X上写道:“为什么苹果要做一则碾压艺术的广告?科技...
-
LLM 评估新纪元:Arthur Bench 全方位解读
一、传统文本评估面临的挑战 近年来,随着大型语言模型(LLM)的快速发展和改进,传统的文本评估方法在某些方面可能已经不再适用。在文本评估领域,我们可能已经听说过一些方法,例如基于“单词出现”的评估方法,比如 BLEU,以及基于“预训练的自然语言处理模型”...
-
研究称 AI、ChatGPT 和社交媒体可能加剧气候危机
一项发表在《全球环境政治》期刊上的论坛文章指出,生成式人工智能(AI)包括像 OpenAI 的 ChatGPT 这样的大型语言模型,以及社交体可能会削弱应对气候变化的努力。 来自英属哥伦比亚大学(UBC)的研究人员出,人们普遍认为 AI、社交媒体和其他技术...
-
太酷了!手机上部署最新AI大模型!只需两步!
在当前的AI革命中,大模型扮演着至关重要的角色,而这背后的基础便是Scaling Law。简而言之,随着数据、参数和计算能力的不断提升,大模型的能力也随之增强,展现出小规模模型所无法比拟的“涌现能力”。越来越多的AI企业纷纷推出开源大模型,按照扩展定律实...
-
法国AI初创公司 Mistral AI 估值 60 亿美元
法国初创公司 Mistral 致力于开源大型语言模型的研发,已在本轮融资中估值达到60亿美元,这一消息吸了投资界的广泛关注。据悉,DST、General Catalyst 和 Lightspeed Venture Partners 等投资机构均有意参与本轮...