-
突发!英伟达H800/A800禁令竟提前生效,但4090意外豁免
芯片禁令发布六天后,美国政府突然变卦——宣布新规提前生效,比原计划整整提前了24天。 也就是说,美国撤回了30天的豁免期。即日起,中国无法再获得任何英伟达尖端AI芯片。 而根据钛媒体报道,腾讯、字节跳动等赶在禁令生效前大量采购的H800,至今尚未拿到现...
-
LLM一句话瞬间生成3D世界,未公布代码已获141星!或将引发3D建模行业革命
继火爆全网的AI文生图,文生视频之后,文生3D场景的技术也来了! 只要不到30个字的提示词,瞬间就能生成这样的3D场景。 场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面,倒映出无云的天空,周围的山和水鸟的倒影呈现在湖中。」 「烈日照耀在无垠...
-
苹果“套娃”式扩散模型,训练步数减少七成!
苹果的一项最新研究,大幅提高了扩散模型在高分辨率图像上性能。 利用这种方法,同样分辨率的图像,训练步数减少了超过七成。 在1024×1024的分辨率下,图片画质直接拉满,细节都清晰可见。 苹果把这项成果命名为MDM,DM就是扩散模型(Diffusion...
-
联想杨元庆展示首款AI PC:让每个人拥有自己的大模型
快科技10月25日消息,联想集团杨元庆在Tech World上公布了联想AI PC,并表示智能设备好比是赛车,它是人工智能触达终端用户的终极载体。 杨元庆表示,联想的大模型压缩技术能让用户自己的智能终端和设备拥有运行个人级大模型的能力。未来的个人电脑将是A...
-
穆迪推出由 Google Cloud 驱动的生成式 AI 新技术:旨在加速数据分析与报告编写流程
Moody’s (穆迪)正在推出一项新技术,该技术由生成式人工智能支持,旨在帮助员工在分析大量数据和编写报告的过程中节省时间。 图源备注:图片由AI生成,图片授权服务商Midjourney 该公司为员工提供了来自 Google Cloud 的大型语言模型...
-
Humane AI Pin:AI辅助设备搭载GPT-4,引入“信任灯”技术
Humane的首款AI Pin设备将于11月9日发布,尽管尚未正式发布,但它已经被列为Time杂志“2023年最佳发明”之一。该AI Pin搭载了GPT-4,采用磁性附着在衣物上,并利用专有软件和OpenAI的GPT-4来提供多种功能,包括通话、语音翻译和...
-
联想CEO:未来每个智能设备都将有个人化AI
联想CEO杨元庆在2023年的联想科技世界大会上表示,他认为下一代生成式人工智能将以“个人基础模型”的形式呈现,这个模型将仅了解用户并植入在其智能设备中。 他表示:“未来,你的PC可能会成为AI PC。你的手机可能会成为AI手机,你的工作站可能会成为AI工...
-
Brilliant Labs融资300万美元,开发基于生成式AI的AR眼镜
Brilliant Labs最近成功融资300万美元,用于开发其基于生成AI技术的增强现实眼镜。此次融资将帮助公司推动生成AI技术的发展,并加强其作为AR设备提供商的地位,同时为寻求可靠个人AI助手的开发人员和消费者构建开源生态系统。 该公司还宣布了一款重...
-
马斯克也曾被骗,AI虚假内容太“真实”了
随着巴以冲突的发展,社交媒体平台上出现了大量反映当地现场画面的视频,但这些内容真实性到底几何,恐怕不容乐观。 在推特上, 自巴以冲突以来便产生了相关大量虚假内容,比如有看起来效果逼真的游戏视频被篡改成哈马斯发动袭击的录像、阿尔及利亚人放烟花庆祝的照片被充...
-
Humane 的首款创新产品 AI Pin 即将亮相,荣获 Time 杂志「2023 年度最佳发明」称号
Humane 的首款智能产品 AI Pin 计划于 11 月 9 日正式上市,但由于一个意料之外的消息来源,我们已经提前得到了对它最清晰的一瞥。 图片来自Humane 在正式公布前,AI Pin 已经被 Time 杂志评为「2023 年度最佳发明」之一,...
-
多模态神经网络SALMONN 能够理解声音世界的AI模型
SALMONN是一个多模态神经网络,能够直接处理和理解包括语音、音频事件和音乐在内的一般音频输入,并在多种语音和音频任务上取得竞争性表现。 论文地址:https://arxiv.org/pdf/2310.13289v1.pdf SALMONN采用了两个互...
-
Google Photos即将允许用户自定义AI生成视频亮点
Google Photos即将推出一项更新,允许用户更灵活地自定义其AI生成的视频亮点。目前,Google Photos可能随机生成带有通用标题的幻灯片式视频,有时包括一些不太理想的照片。但Google即将发布一项更新,让用户能够选择视频的参数,而不仅仅...
-
Meta推大模型记忆增强方法MemWalker 靠prompt就能完成,无需额外训练
一项名为MemWalker的新技术,使大型语言模型能够克服其窗口长度的限制,从而可以处理更长的文本并回答相关问题,而无需进行额外的训练。这一技术的开发团队使用了一种树形记忆策略,该策略的工作原理包括两个主要阶段:记忆树构建和导航检索。 图源备注:图片由A...
-
UniPAD:自动驾驶通用预训练范式来了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 UNIPAD:自动驾驶通用预训练范式 原标题:UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接:https:/...
-
讯飞星火和文心一言有什么区别?讯飞文心一言哪个厉害
讯飞星火和文心一言是两个不同的产品,各自有其特点和优势。那么讯飞星火和文心一言有什么区别哪个更厉害呢?下面就给大家带来讯飞星火和文心一言的特点介绍。 1. 讯飞星火: 讯飞星火认知大模型可用于语言理解、知识问答、代码编写、逻辑推理、数学解题等场景。讯飞星火...
-
高通正式发布骁龙 8 Gen 3 旗舰芯片:为 2024 年安卓旗舰手机带来生成式 AI 革命
在今天的 2023 年夏威夷 Snapdragon 峰会上,高通公司正式发布了其最新的顶级芯片组 Snapdragon 8 Gen 3。借助于这款新芯片,预计 2024 年的 Android 旗舰手机将迎来备受期待的生成型人工智能(AI)革命。 Sna...
-
元象 XVERSE 与腾讯音乐推出 lyraXVERSE 加速大模型
元象 XVERSE 与腾讯音乐合作推出 lyraXVERSE 加速大模型,将应用于音乐助手 “AI 小琴” 中。 用户可以通过点击 QQ 音乐上的 “AI 一起听” 按键来与升级版的 “AI 小琴” 互动,她将根据用户的提问、播放习惯和心情提供闲聊、推歌、...
-
微软砍掉工业元宇宙项目Project Airsim 将人工智能战略转向OpenAI
10月25日消息,据外媒援引知情人士透露,本周一微软负责开发“工业元宇宙”Project Airsim的团队成员都收到了一份“团队更新”的通知,并被告知公司将解雇整个团队并终止项目。微软也证实,将于今年12月15日终止该项目。 微软在一份声明中表示:“...
-
最高20倍!压缩ChatGPT等模型文本提示,极大节省AI算力
在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。 据悉,LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩,同时又可以准确评估...
-
OpenAI首批投资者科斯拉:大多数AI创企价值都被高估了
10月25日消息,当人工智能初创公司OpenAI在2019年从非营利组织转变为“利润上限(caped-profit)”公司时,硅谷风险投资家维诺德·科斯拉(Vinod Khosla 大胆地迈出了第一步。他旗下的科斯拉风投公司向OpenAI投资了5000...
-
骁龙8 Gen3正式发布:8K240手游成真!AI无处不在性能飙升98%
快科技夏威夷高通骁龙技术峰会2023现场报道: 一年一度,它又来了!但是今年,它来得更早一些! 北京时间10月24日,高通正式发布了新一代旗舰移动平台骁龙8 Gen3”(第三代骁龙8 ,安卓旗舰手机一年一度的新平台登场。 在激烈的残酷竞争下,在AI时代浪潮...
-
GameGPT:使用AI实现游戏开发自动化
译者 | 布加迪 审校 | 重楼 如今,从事游戏开发如同走钢丝。游戏行业处于一种怪异的境地:游戏变得越来越酷,越来越有开创性,但同时也变得越来越让人头疼:更大的团队、更长的工作时间以及巨额预算。相信我,我知道从事这个行当有多难:我和好友Jim花了两年多...
-
高通推出骁龙XElite——AI赋能的强大平台将为PC带来变革
在骁龙峰会期间,高通技术公司宣布推出公司迄今为止面向PC打造的最强计算处理器:骁龙XElite。这款开创性平台将开启顶级计算新时代,凭借一流的CPU性能、领先的终端侧AI推理和支持多天续航的高能效PC处理器,显著提升PC体验。AI正在变革人们与PC的交互方...
-
高通发布第三代骁龙8移动平台,为下一代旗舰智能手机带来生成式AI
在今日凌晨的骁龙峰会期间,高通技术公司正式推出全新旗舰移动平台——第三代骁龙®8,它是一款集终端侧智能、顶级性能和能效于一体的强大产品。作为Android旗舰智能手机SoC领导者,高通技术公司的全新平台将在全球OEM厂商和智能手机品牌的终端上得到广泛采用,...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
微软CEO纳德拉:我经历过四次重大转变 AI是第五次
10月23日消息,近日,微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在媒体专访中表示,其经历过四次重大转变,目前正在经历第五次重大转变,即人工智能。 纳德拉还表示,如果不能适应新的技术转变,那么可能会失去一切。 此外,纳德拉在采访中称,完...
-
八款旨在窃取数据的假冒ChatGPT恶意应用
译者 | 陈峻 审校 | 重楼 目前,人们已开始逐渐习惯于借助ChatGPT开展各种日常工作,包括:搜寻答案、生成图文内容、解释复杂概念、以及编写程序代码等。不过,相对付费版本,免费版聊天机器人的局限性,往往体现在答复的准确性和时间延迟上。而恶意行为者已...
-
ChatGPT与DALL·E 3之间的行业「黑话」被人发现了
上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。 DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 p...
-
陶哲轩疯狂安利Copilot:它帮我完成了一页纸证明,甚至能猜出我后面的过程
继给GPT-4“代言”之后,Copilot也被陶哲轩疯狂安利。 他直言,在编程时,Copilot能直接预测出他下一步要做什么。 有了Copilot之后,研究做起来也更方便了,陶哲轩也用它辅助自己完成了最新的研究成果。 陶哲轩说,这次的论文中,有关这一部...
-
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%
大模型“识图”能力都这么强了,为啥还老找错东西? 例如,把长得不太像的蝙蝠和拍子搞混,又或是认不出一些数据集中的稀有鱼类…… 这是因为,我们让大模型“找东西”时,往往输入的是文本。 如果描述有歧义或太偏门,像是“bat”(蝙蝠还是拍子?)或“魔鳉”(Cy...
-
首个多视角自动驾驶场景视频生成世界模型 | DrivingDiffusion: BEV数据和仿真新思路
笔者的一些个人思考 在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面: 不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中...
-
深度学习科研,如何高效进行代码和实验管理?
回答一 作者:叶小飞 链接:https://www.zhihu.com/question/269707221/answer/2281374258 我之前在北美奔驰落地时,曾有段时间为了测试不同的结构和参数,一周能训练一百来个不同的模型,为此我结合公司前...
-
明年IT投资前景看好:增速比GDP高三倍!75%的CIO要为AI多花钱
如今全球复苏依旧缓慢,根据国际货币基金组织(IMF)最近发布的《世界经济展望报告》,预计全球经济增速将从2022年的3.5%放缓至2023年的3.0%和2024年的2.9%。然而,Gartner的IT支出数据却与此呈现出鲜明的对比:2024年全球IT支...
-
「解释一切」图像概念解释器来了,港科大团队出品
你是否好奇当一个黑盒深度神经网络 (DNN 预测下图的时候,图中哪个部分对于输出预测为「击球手」的帮助最大? 香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。 论文:https://arxiv.org/abs/2305....
-
IBM 推出 AI 芯片 NorthPole:内置存储器,号称可“模拟人脑运行”
▲ 图源 IBM 10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,该芯片灵感号称“来自人类大脑的运作”,推论性能据称超越 4nm GPU,适用于边缘计算等范畴。 IT之家经过查询得知,NorthPole 芯片是...
-
英伟达被曝入局PC端CPU!网友:眼馋苹果M1打开市场
GPU狂魔英伟达,突然盯上笔记本CPU了! 据路透社爆料,英伟达已经开始悄悄设计基于Windows系统的PC端CPU,对标苹果ARM架构芯片。 最早在2025年,我们就可能看到英伟达的笔记本芯片。 要知道,之前在Windows操作系统这块,PC市场的主...
-
4k窗口长度就能读长文,陈丹琦高徒联手Meta推出大模型记忆力增强新方法
只有4k窗口长度的大模型,也能阅读大段文本了! 普林斯顿的华人博士生的一项最新成果,成功“突破”了大模型窗口长度的限制。 不仅能回答各种问题,而且整个实现的过程全靠prompt就能完成,不需要任何的额外训练。 研究团队创建了一种名为MemWalker的...
-
数据分析和机器学习的11个高级可视化图表介绍
可视化是一种强大的工具,用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用,提供了通常难以从原始数据或传统数字表示中辨别出来的见解。 可视化对于理解复杂的数据模式和关系至关重要,我们将介绍11个最重要和必须知道的图表,...
-
美国码农疯狂求职,狂投250份简历!揭秘潜规则:网申填完就战胜92%对手
经济下行,科技行业各大公司降薪的降薪,裁员的裁员。 但是就业市场中最惨的却永远是那些还在找工作的人。 美国的一名软件工程师Shikhar Sachdev因为自己在找工作时被连续不断拒绝,却激发出了他不断尝试找各种工作的兴趣。 在他找到工作已经入职之后,...
-
清华新研究解密信息茧房!全新信息动力学理论,登Nature子刊
新一代信息与智能技术的迅猛发展推动着人类逐步迈入智能社会。在数字技术和智能推荐算法的加持下,媒体和平台越来越贴心,总是能最快最准的地契合人们的个性化偏好和需求。 然而,与此同时,智能精准推荐致使「信息茧房」现象不断发酵,观点相似的人群在网络空间组成团体,...
-
50张图“毒倒”Stable Diffusion,汽车和牛都分不清了
艺术家对AI侵权的反击来了—— 在画作里“投毒”,AI用了就会“中毒”出故障。 投毒工具由芝加哥大学团队打造,名为Nightshade,可以对画中像素添加隐形更改。 被下毒的画一旦被非法抓取成为训练数据被AI吃掉,模型就会生成混乱。 甚至还可能会破坏DA...
-
4K画质3D合成视频,渲染速度提升30多倍,论文作者带你解读新研究
来源:˃责任编辑:张燕妮 来源: 机器之心...
-
口型几乎完美、还能卡点,霉霉说地道中文的视频火了,背后AI工具原来是它
这两天,美国女歌星霉霉(泰勒・斯威夫特)一则说中文的短视频在各社交平台火了起来。有的播放量已经达到了 600 多万。 在视频里,霉霉操着一口流利、地道的中文,神情自若,几乎没有早期译制片女主角的那种腔调,口型也能对得上。 图源:微博 @会火 还没有看过...
-
你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测
在算力为王的时代,你的 GPU 可以顺畅的运行大模型(LLM)吗? 对于这一问题,很多人都难以给出确切的回答,不知该如何计算 GPU 内存。因为查看 GPU 可以处理哪些 LLM 并不像查看模型大小那么容易,在推理期间(KV 缓存)模型会占用大量内存,例...
-
仅五个字符的新绘图语言火了,ChatGPT都学会了
只用五个字符,就能完成一幅像素画的绘制了。 这是一种新的绘图语言,一共支持8种颜色,画幅可达256*256。 它包含了“CFR[]”这五个符号,因此名字也就叫CFR[]了,主打的就是一个直观。 而且CFR[]免费开源,无需部署安装,在线就能体验。 虽然...
-
物流领域高效利用GenAI的关键是理解用例
虽然一开始可能并不清楚GenAI如何应用于主要运输货物的功能,但我们的研究指出了将GenAI功能应用于物流目标的机会。在采用时,不要让你的团队一头扎进GenAI试点,企业领导今天应该把他们的注意力集中在用例的构思和优先级上。 构思和优先顺序 首先,...
-
首个软件专利获得者离世,享年93岁,他为软件争得知识产权法保护
拥有世界上第一个软件专利的人,离世了。 他叫马丁·格茨(Martin Alvin Goetz),被誉为“第三方软件之父”。 他将软件从硬件“捆绑销售”的状态中解放出来,并创办了第一家软件产品公司,开发出第一个商业软件产品。 曾经不受任何知识产权法保护的软...
-
AIGC时代的视频扩散模型,复旦等团队发布领域首篇综述
AI 生成内容已经成为当前人工智能领域的最热门话题之一,也代表着该领域的前沿技术。近年来,随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布,AI 图像生成和编辑领域实现了令人惊艳的视觉效果,并且在学术界和工业界...
-
AI设计工具Stockimg.ai 可生成海报、徽标等高质量素材图片
Stockimg AI 是一款基于人工智能技术的图片生成工具,旨在为团队提供便捷的设计解决方案。无论是需要生成 AI 徽标、AI 书籍封面、AI 海报等,Stockimg AI 都能轻松满足您的需求。节省时间和金钱,提高设计流程效率。 通过 Stockim...
-
AI算法可检测针对军用无人驾驶车辆的中间人攻击
研究人员研发的人工智能算法,可检测到针对军用无人驾驶车辆的中间人攻击。 机器人操作系统(ROS)是高度网络化的,机器人之间需要协作,其中的传感器、控制器等需要通信并通过云服务交换信息,因此极易受到数据泄露和电磁劫持攻击等网络攻击。中间人攻击(MitM)是...