-
Open AI 宫斗第二季时间线及各方观点梳理
Open AI近期的内部矛盾和人员变动引起了业界的广泛关注。这场被称为"宫斗"的事件主要围绕两个核心议题:AI模型的安全性和AI技术的发展速度。 5.15Ilya离职:Ilya Sutskever是Open AI的联合创始人之一,他主张加大对模型安全性的...
-
人工智能将影响科学未来
人工智能是有史以来最具变革性和最有价值的科学工具之一。通过利用大量数据和计算能力,人工智能系统可以发现模式,产生见解,并做出以前无法实现的预测。 当我们发现正处于人工智能革命的风口浪尖时,科学家们开始质疑如何才能最好地将这项技术用于他们的研究工作。美国...
-
研究发现英国 AI 聊天机器人的安全措施容易被绕过
英国政府的 AI 安全研究所(AISI)发现,防止聊天机器人背后的人工智能模型发出非法、有毒或露骨回应的保护措施可以被简单的技术绕过。AISI 表示,他们测试的系统 “极易受到攻击”,这些系统很容易被 “越狱”,即用文字提示来引发模型本应避免的回应。 图...
-
AI如何使机器人更具自主性和适应性?
在工业自动化技术领域,最近有两个热点很难被忽视:人工智能(AI 和英伟达(Nvidia 。 毫不意外,这两者密切相关,因为英伟达现在不仅仅局限于其最开始的图形处理单元(GPU ,正在将其GPU技术扩展到数字孪生领域,同时紧密连接着新兴的AI技术。 最近...
-
美国配音演员指控AI音频公司Lovo窃取其声音并非法使用
近日,两位知名配音演员保罗·斯凯·莱尔曼和林尼·塞奇起诉人工智能公司Lovo,指控该公司以虚假借口委托他们录制语音样本,随后却将这些样本用于创建和销售人工智能生成的声音版本。 图源备注:图片由AI生成,图片授权服务商Midjourney 据悉,莱尔曼在2...
-
加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 为了在复杂的真实世界场景中安全导航,自动驾驶汽车必须能够适应各种道路条件并预测未来事件。基于世界模型的强化学习(RL)已经成为一种有前景的方法,通过学习和预测各种环境...
-
国产大模型的价格已经卷出网约车大战和百亿补贴的味儿了
登录就送500w tokens! 1 块钱 100w tokens!一降再降!!仅需0. 0008 元/千tokens! 没错,互联网价格战熟悉的“味”,已经悄无声息的打到了大模型的战场。 技术狂飙了一年,大模型公司们早就按捺不住要搅弄商业风云的心, 5...
-
自动驾驶场景中的长尾问题怎么解决?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。 自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
GPT-4o团队引发OpenAI组织创新热议,应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
谷歌定义了新搜索,杀死了Perplexity?
编辑 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 谷歌大会刚过去,做AI搜索的创业公司,如Perplexity是不是要被干掉了? 回答这个问题之前,不妨先回顾下,谷歌是如何怎么重新思考并革新自己的。 1.ChatGPT和Perp...
-
索尼向700多家公司发出警告,禁止使用其音乐数据训练AI模型
索尼音乐集团发出警告,禁止未经许可的公司使用其音乐数据训练大型 AI 模型。 这一警告涉及到700多家公司,索尼明确表示未经许可不得使用其音乐数据进行文本挖掘、网络爬取以及其他形式的数据搜集,包括录音、音乐作品、封面艺术作品和元数据等。这是因为 AI 模型...
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI在发布会上官宣GPT-4o之后,各路大神也开始了对这个新模型的测评,结果就是,GPT-4o在多项基准测试上都展现了SOTA的实力。 别家发布会都在画饼,OpanAI却总能开出一种「欲扬先抑」的效果,惊喜全在发布会之后。 基准测试结果 首先...
-
百度推荐资源冷启动实践
一、内容冷启动概念及挑战 百度 feed 推荐是一个月活数亿的综合信息流推荐平台。该平台涵盖了图文、视频、动态、小程序、问答等多种内容类型。它不仅提供类似于单列或双列的点选式推荐,还包括视频沉浸式等多种推荐形式。同时,推荐系统是一个多利益方的系统,不仅...
-
周鸿祎:大模型不会摧毁每一个行业 将打造大模型工厂
快科技5月20日消息,周鸿祎最近回到家乡武汉,参加第六届全国青年企业家大会”,分享了自己对AI的思考。 周鸿祎认为,新质生产力的核心是科技创新。在数字化领域,人工智能和大模型无疑是当前最热门的话题。 有人担忧大模型会摧毁每一个行业,但我却认为它会重塑每个行...
-
腾讯 PCG 搜广推机器学习框架GPU 性能优化实践
一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点 最开始的时候,腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入,以及深度学习模型的发展,PCG 算力集群在做下一代推荐模型时会遇到各种问题: 首先,系统网络带宽...
-
一文读懂常见的几种 LangChain 替代品
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 开发框架 。 在 LLM (大规模语言模型 应用开发领域,开源框架扮演着至关重要的角色,为广大开发者提供了强大的工具支持。作为这一领域的领军者,Lan...
-
OpenAI CEO下场回应「封口协议」,争议还是到了股权利益上,奥特曼:我的锅
自从 Ilya 和 超级对齐负责人 Jan 离职后,OpenAI 内部还是心散了,后续也有越来越多的人离职,同时也引发了更多的矛盾。 昨天,争议的焦点来到了一份严格的「封口协议」。 OpenAI 前员工 Kelsey Piper 爆料,任何员工的入职文...
-
OpenAI澄清离职条款争议:从未回收员工股权
快科技5月19日消息,OpenAI的首席执行官山姆奥特曼(Sam Altman)近日在社交平台X上针对此前关于封嘴”离职条款的传闻进行了明确回应。 奥特曼明确指出,OpenAI公司自成立以来,从未有过追回员工既得股权的先例。他强调,即使员工在离职时未签署离...
-
GPT-4o团队引发OpenAI组织创新热议!应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
GPT-4o亮相没两天,背后Omni团队就被扒了个底朝天: 领衔者,是DALL·E2/3研究团队成员、Scaling Law共同提出者。 更深层次的,团队组成和Sora有着类似的规律:不怕启用新人,并且狠狠重任新人。 这里的“新人”,可能是本科or硕博刚毕...
-
微博已接入阿里云通义大模型 覆盖AI评论、明星陪聊等功能
站长之家(ChinaZ.com)5月18日 消息:据阿里云官方消息,微博宣布已成功将阿里云的大模型技术融入其核心业务,开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型,更在信息流广告创意生成等领域展现出了显著...
-
突发!OpenAI再失一名高管,安全主管辞职
5月18日凌晨,OpenAI安全主管、超级对齐负责人Jan Leike在社交平台宣布,离开OpenAI。 这也是本周三OpenAI联合创始人兼首席科学家Ilya Sutskever辞职之后,又有一名高管辞职。 相信随着二人的离开,后续还会有不少人离开Ope...
-
GPT-4o预告中的语音助手“Her”真的很惊艳,但问题是我们还有多久才能够真正上手?网友:PR鬼才奥特曼都坐不住了
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI 发布会中的GPT-4o给所有人都看眼馋了! 谁不想第一时间体验下传说中的“Her”呢? 图片 在发布会上,GPT-4o展示了自己的“magic”:高超的语音理...
-
阿里云:微博已接入通义大模型 应用于AI评论、AI明星陪聊等
快科技5月17日消息,根据阿里云”官方消息,微博已成功将大模型技术融入其业务中,包括AI评论、AI明星陪聊、虚拟角色帐号、星座大模型以及信息流广告创意生成等多个方面,且已初显成效。 据悉,微博是阿里云的长期合作伙伴,双方的合作历史已近十年。在面对突发的热点...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型
ChatGPT更强了... 刚刚,OpenAI再次放出大招——ChatGPT可以直接打开线上数据文件,完成实时数据分析。 图片 全新的增强功能,具体包括: - 直接从Google Drive和Microsoft OneDrive上传最新版本的文件 - 在...
-
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱
曾经创造出Stable Diffusion系列模型的Stability AI,目前面临前所未有的财务危机。 这个曾经有10亿美元估值,却只有180名员工的明星初创公司正在考虑出售,并积极与潜在买家接触。 有知情人士表示,Stability AI曾私下联系...
-
ChatGPT现在允许用户直接从 Google Drive、Microsoft OneDrive 导入文件
OpenAI 本周宣布,其标志性大型语言模型(LL)ChatGPT 已更新,用户现可直接从外部云盘 Google Drive 和 Microsoft OneDrive 导入文件。该功能适用于 ChatG Plus、Team 和 Enterprise 用户,...
-
恒生电子首席科学家白硕:长文本和多模态是生成式AI落地金融的两大利器
嘉宾丨白硕 采访/撰稿丨张洁 编辑丨千山 出品 | 51CTO技术栈(微信号:blog51cto) 在千行百业中,金融业一贯是新技术的早期采用者。无论是在数字化水平,还是在关于产业AI化的探索上,都走在了前列。因此,金融业也被视为生成式AI应用落地的潜力...
-
OpenAI与Reddit 合作,将用户生成独特内容整合至ChatGPT
Reddit 与 OpenAI 宣布战略合作,旨在整合先进的 AI 功能和用户生成的独特内容,彻底改变在线社区互动体验和推动 AI 创新。这一合作是 Reddit 近期与谷歌达成每年6000万美元内容许可协议之后的又一重要举措,旨在充分发挥双方的优势,提供...
-
发布会对比惨烈,奥特曼发文暗讽谷歌!谷歌被曝疯狂重组迎击OpenAI
现在,OpenAI和谷歌的互怼,已经是摆在明面上了。 两天硝烟弥漫的发布会后,Sam Altman显然对OpenAI压过谷歌一头的表现非常满意。 就在刚刚,他在x上发文表示:「我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学...
-
微软向云计算客户提供 AMD 替代 Nvidia AI 处理器
微软于周四表示,计划为其云计算客户提供平台的人工智能芯片,以与由 Nvidia 制造的组件竞争。微软将在下周的 Build 开发者大上公布更多细节。此外,微软还将在会议上推出新 Cobalt100定制处理器的预,该处理器的性能预计比其他基于 Arm Hol...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
纽约诉讼案件称:AI 语音公司被控窃取配音演员声音
两名声优 Paul Skye Lehrman 和 Linnea Sage 在周四在纽约联邦法院对人工智初创公司 Lovo 提起了诉讼,指控该公司在其 AI 配音技术中非法复制和使用他们的声音。 他们声称 Lovo 欺骗他们提供声音样本后,未经许可销售他们声...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
云开发工具初创公司Replit在推动生成式AI的同时裁员20%
云开发工具初创公司 Replit Inc.,作为推动生成式人工能编码的先锋,宣布裁减30名员工,约占其总员工数的20%。 Replit 首席执行 Amjad Masad 在公司员工间发送的一封电子邮件中宣布了这一消息,该邮件今日发布在 X(原 Twitte...
-
Stability AI与Facebook前总裁等投资人进行筹款谈判
一位直接参与交易谈判的人士透露,包括 Facebook 前总裁 Sean Parker 在内的一组投资者正与 Stability AI 进行筹款谈判。Stability AI 是一家开发基于开源图像生成器 Stable Diffusion 的产品的初创公司...
-
谷歌Gemini AI 计划为学校提供额外的数据保护和隐私
Google 即将向学校提供 Gemini AI,并专门针对教育工作者和年满18岁的学生提供服务,承诺会将他们的数据用于 AI 模型训练或与他人分享。 Google 将在 Workspace for Education 账户上提供额外的 Gemini 隐私...
-
《2024 中国 AIGC 应用全景报告》发布
APP 下载地址:https://www.oschina.net/app...
-
Hugging Face承诺免费提供1000万美元GPU计算资源,帮助小型开发者对抗大型AI公司
机器学习公司 Hugging Face 承诺投入1000万美元的 GPU 计算资源,帮助开发者和初创公司对抗大型人工智能公司。 Hugging Face 的首席执行官 Clem Delangue 表示:“我们很幸运能够投资社区。” 该公司最近筹集了2.35...
-
首席人工智能官的基本技能和特质
首席人工智能官(CAIO)需要多维的技能来推动创新、建立和领导AI就绪的文化,并且利用复杂且快速发展的技术取得切实的组织性成果。 AI(尤其是生成式AI)的快速崛起促使许多组织雇用或晋升了首席人工智能官(CAIO)。 迄今为止,很多类似职位都是集中在技术...
-
AI日报:百度搜索11%结果由AI生成;腾讯混元支持生成16s视频;谷歌发布开源视觉语言模型PaliGemma;Hugging Face承诺免费提供1000万美元GPU计算资源
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、李彦宏:百度搜索已有11%结果...
-
腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
(图:腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生) 5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级,并推出知识引擎等多个智能工具和场景应用。 会上,基于混元大模型的一站式AI智...
-
美国媒体公司 Gannett 开始在文章中添加 AI 生成的摘要
美国媒体公司 Gannett 拥有数百家报纸,在其内部备忘录中透露,他们正在推出一个新的项目,将 AI 生成的要点添加到记者的文章开头。 根据 The Verge 所见的内部备忘录,这一 AI 功能被标注为 “要点”,用自动化技术生成了在标题下方的摘要。文...
-
腾讯混元升级模型矩阵,云上推出256k长文模型
大模型落地加速,“产业实用”成为发展共识。 2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。 腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyua...
-
腾讯混元大模型支持生成16s视频 并推出AI智能体平台腾讯元器
在腾讯云生成式AI产业应用峰会上,腾讯公司展示了其最新的AI创新成果——腾讯元器。这是一个一站式的AI智能体创作与分发平台,它基于腾讯的混元大模型构建,为企业提供了一个全新的解决方案。 通过腾讯元器,企业和开发者现在可以直接创建智能体,并利用腾讯官方提供的...
-
单次支持38万字输入!腾讯混元推出256k长文模型,通过腾讯云向企业和个人开发者开放
AI大模型技术正成为推动高质生产力发展的关键力量,在与千行百业的融合中发挥着重要作用。腾讯混元大模型通过采用混合专家模型 (MoE 结构,已将模型扩展至万亿级参数规模,增加“脑”容量提升预测性能的同时,推动了推理成本下降。作为通用模型,腾讯混元在中文表...
-
腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行...
-
基于深度学习的实时视频处理 | 入门指南
近来,整个机器学习领域似乎被大型语言模型(LLM)和检索增强生成(RAG)所掩盖。虽然许多用例可以从这些新的基础模型中受益,但在非文本数据方面仍存在差距。我常把当前的机器学习阶段比作汽车工业中从燃油车向电动车的转变。燃油车已经有完善的基础设施(如汽车服务...
-
多模态GPT-4o来了,最先嗨起来的是一波女性用户
整场发布会最为重磅的发布之一,莫过于 OpenAI 团队成员对于新模型语音能力的演示,搭载了 GPT-4o 的 ChatGPT,不仅真正实现了实时响应,可以任意打断,更重要的是,ChatGPT 第一次拥有了“察言观色”的能力,它能看到用户表情,理解用户语气...