-
ChatGPT可以开车吗?分享大型语言模型在自动驾驶方面的应用案例
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人工智能技术如今正在快速发展和应用,人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型...
-
百度:AI专利申请量、授权量国内第一
快科技4月26日消息,在第24个世界知识产权日来临之际,百度昨日举办专利运用赋能AI产业高质量发展”论坛。 在论坛上,百度首席技术官透露,百度在以大模型为核心的人工智能领域,其专利申请量和授权量在国内均位居第一,且在全球范围内处于领先地位。 特别是在深度学...
-
为人工智能改变建筑行业做好准备
第一代人工智能,即ANI或狭义人工智能,从汽车的制动系统到飞机的导航以及自动驾驶仪,第一代人工智能都无处不在。 这些工具已经改变了我们的生活方式以及我们与世界和彼此互动的方式。还记得30年前的世界吗?那是一个没有互联网、没有电子邮件、没有社交媒体、没有...
-
在线地图还能这样?MapTracker:用跟踪实现在线地图新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 太强了,在线高精地图还能用跟踪的方式来做!!!本文提出了一种矢量HD建图算法,该算法将在线高精建图公式化为跟踪任务,并使用memory latents的历史来确保随着时...
-
Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
Nvidia CEO 黄仁勋亲自将首个 Nvidia DGX H200交付至旧金山的 OpenAI 办公室,这一举动彰显了人工智能行业两大巨头之间紧密的联系。OpenAI 总裁兼联合创始人 Greg Brockman 在推特上发布了一张照片,展示了这一事件...
-
超越BEVFormer!CR3DT:RV融合助力3D检测&跟踪新SOTA(ETH)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文介绍了一种用于3D目标检测和多目标跟踪的相机-毫米波雷达融合方法(CR3DT)。基于激光雷达的方法已经为这一领域奠定了一个高标准,但是其高算力、高成本的缺陷制约了...
-
CVPR 2024 | 面向真实感场景生成的激光雷达扩散模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Towards Realistic Scene Generation with LiDAR Diffusion Models 论文链接:https://hancyran.github.io/a...
-
人工智能可以帮助识别门牌号吗?
人工智能(AI 是一项进步,使计算机和机器能够复制人类的知识和解决问题的能力。如今,人们正在使用人工智能识别门牌号码。人工智能可以单独或与其他技术相结合来执行任务,如传感器、地理定位、机器人技术,无需人类参与。 人工智能在识别门牌号码方面的作用 在计算...
-
借势大模型,科大讯飞走出低谷了吗?
AI1.0公司想靠大模型打个漂亮的“翻身仗”,似乎还差一口气。 4月23日,科大讯飞发布2023年年度及2024年Q1业绩报告。全面 All in大模型的一年,科大讯飞交出了首份成绩单,2023年营业收入为196.5亿元,同比增长4.41%;归属于上市公司...
-
马斯克:可能在明年年底前出售特斯拉人形机器人 Optimus
IT之家 4 月 24 日消息,特斯拉 CEO 马斯克在财报电话会议上表示,预计在今年底之前,特斯拉的 Optimus 人形机器人将拥有完成“有用的”工厂任务的能力,该公司可能会在 2025 年底前将其对外销售,特斯拉计划今年年底前在其自家工厂率先使用...
-
对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
蚂蚁集团代码大模型CodeFuse负责人李建国说道。 当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。 李建国是谁? 清华大学博士,机器...
-
一文了解大语言模型(LLM)
人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备,激光雷达可以实现自动驾驶。当2023年,OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时,大语言模型的概念出现在我们面前。 在自然语言处理领域的大语言模型(La...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多,工业界和学术界非常希望一个理想的感知算法模型,可以同时完成如3D目标检测以及基于BEV空间的语义分...
-
时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选
刚刚,《时代》周刊发布了 2024 年度最具影响力的 100 人名单。 在这份名单中,我们看到了很多熟悉的学者和企业家。 微软公司 CEO、董事长萨蒂亚・纳德拉,比亚迪创始人王传福,英伟达创始人兼首席执行官黄仁勋,图灵奖得主 Yoshua Bengio...
-
到2032年,汽车AI市场规模预计将达到311.1亿美元
据报告分析,汽车人工智能市场的估值在2024年为41.4亿美元,预计到2032年将达到311.1亿美元,2024年至2032年的复合年增长率为29%。 人工智能是汽车行业迈向新价值未来的新垫脚石,人工智能在汽车行业的应用不仅限于汽车行业本身,还远远超出...
-
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管神经辐射场(NeRFs)在图像新视角合成(NVS)方面取得了成功,但激光雷达NVS的发展却相对缓慢。之前的方法follow图像的pipeline,但忽略了激光雷达...
-
如何利用Transformer有效关联激光雷达-毫米波雷达-视觉特征?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人理解 自动驾驶的基础任务之一是三维目标检测,而现在许多方法都是基于多传感器融合的方法实现的。那为什么要进行多传感器融合?无论是激光雷达和相机融合,又或者是毫米波雷达和相机融合,其最主要的目的就是...
-
LiDAR仿真新思路 | LidarDM:助力4D世界生成,仿真杀器~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:LidarDM: Generative LiDAR Simulation in a Generated World 论文链接:https://arxiv.org/pdf/2404.02903....
-
轨迹预测系列 | HiVT之进化版QCNet到底讲了啥?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 HiVT的进化版(不先看HiVT也能直接读这篇),性能和效率上大幅提升。 文章也很容易阅读。 【轨迹预测系列】【笔记】HiVT: Hierarchical Vector Transformer for...
-
福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜
福布斯发布了备受瞩目的第六届人工智能50强榜单,从1900家申请公司中精选出顶级的人工智能企业,展现了该行业的蓬勃发展和创新活力。评选过程严格,结合了算法分析和专家评审,突显了人工智能在提升生产力、推动创意应用和改善实体运营方面的日益重要性。 完整榜单点...
-
等等我还没上车!LLM赋能端到端全新范式LeGo-Drive,车速拉满
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者个人理解 这篇论文介绍了一种名为LeGo-Drive的基于视觉语言模型的闭环端到端自动驾驶方法。该方法通过预测目标位置和可微分优化器规划轨迹,实现了从导航指令到目标位置的端到端闭...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验
一、ROCm加持出图效率翻倍!AMD RX 7900 XT Linux系统 AI性能体验 ROCm:一个可移植、高性能的GPU计算平台 随着AI时代的来临,显卡的作用不再仅仅只局限于游戏,特别是在Stable Diffusion火爆全网之后,越来越多的玩家...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
强化学习(RL)通过与环境交互的试错反馈来优化顺序决策问题。 虽然RL在允许大量试错的复杂电子游戏环境中实现了超越人类的决策能力(例如王者荣耀,Dota 2等),但很难在包含大量自然语言和视觉图像的现实复杂应用中落地,原因包括但不限于:数据获取困难、样本...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
探讨2030年人工智能的发展趋势
1、人类级别的人工智能能力 到2030年,人工智能有望达到人类的智力水平,这是该领域的一个巨大飞跃。这一里程碑将为人工智能系统带来前所未有的机会,使其能够以与人类相当的认知水平执行任务。各行业将见证人工智能驱动的决策、问题解决和创造力创新,从而...
-
智能百科 | 多模态人工智能及其应用
多模态人工智能概述 多模态人工智能是一种人工智能技术,其能够处理和理解多种类型的输入数据,例如文本、图像、语音和视频等。与传统的单一模态人工智能相比,多模态人工智能能够更全面地理解和处理信息,因为其能够同时考虑多种输入源的信息。 多模态人工智能通常利用...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
马斯克造大模型,从特斯拉连挖高管
当全球首富埃隆・马斯克(Elon Musk)建立 xAI,准备与 OpenAI、谷歌竞争大模型时,他必须与众多科技巨头、初创公司争夺人才。 不过,他使用了一些取巧的办法:从自家的特斯拉挖来了几名优秀工程师。 该初创公司的网站显示,上个月,机器学习...
-
马斯克:将提高特斯拉AI工程师薪酬 防止OpenAI挖角
快科技4月5日消息,据媒体报道,特斯拉首席执行官马斯克在面临激烈的人才争夺战中,果断采取行动,不断提高人工智能工程师的薪酬水平。 他在自己的社交媒体平台X(前身为推特)上发帖透露:特斯拉正根据进展里程碑,逐步提升人工智能工程团队的薪酬待遇。” 马斯克指出,...
-
人工智能是否被高估了?
毫无疑问,人工智能已经成为近年来最热门的话题之一,吸引着技术专家、企业家和公众的想象力。然而,在围绕人工智能的炒作和兴奋中,关于人工智能是否被高估的争论越来越多。一些批评人士认为,人工智能只是一种先进的曲线拟合,而不是所描绘的革命性技术。 人工智能的核...
-
在线建图与轨迹预测如何紧密结合?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Producing and Leveraging Online Map Uncertainty in Trajectory Prediction 论文链接:https://arxiv.org/...
-
神经矩阵:数字进化的新生命形式
译者 | 李睿 审校 | 重楼 随着人工智能技术的快速发展,有些人害怕机器人的崛起,有些人担心人工智能将会接管世界。但是人们需要了解人工智能的未来发展,以及电子生命形式将会如何诞生。 本文不仅介绍电子生命形式将如何诞生,而且还将详细描述神经矩阵的关键元...
-
RV融合性能拉爆!RCBEVDet:Radar也有春天,最新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 这篇论文关注的主要问题是3D目标检测技术在自动驾驶进程中的应用。尽管环视相机技术的发展为3D目标检测提供了高分辨率的语义信息,这种方法因无法精确捕获深度信息和在恶劣天...
-
3D视觉绕不开的点云配准!一文搞懂所有主流方案与挑战
本文经自动驾驶之心公众号授权转载,转载请联系出处。 作为点集合的点云有望在3D重建、工业检测和机器人操作中,在获取和生成物体的三维(3D)表面信息方面带来一场改变。最具挑战性但必不可少的过程是点云配准,即获得一个空间变换,该变换将在两个不同坐标中获取的...
-
“真假难辨”!巧用NeRF生成的自动驾驶仿真数据
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的有前途的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式...
-
DriveCoT:全面的开环端到端驾驶数据集和Benchmark
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,端到端自动驾驶技术取得了显著进展,表现出系统简单性和在开环和闭环设置下竞争性驾驶性能的优势。然而,端到端驾驶系统在驾驶决策方面缺乏可解释性和可控性,这阻碍了其在真实世界中的部署。本文利用CAR...
-
量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一,现有的算法在远距离范围下的感知表现依然较差。为此,我们提出了P-MapNet,其中的“P”强调我们专注于融合地图先验以...
-
到2030年可以依靠人工智能运行的主要行业
随着人工智能(AI 继续快速发展,其在各个领域的潜在应用日益明显。到2030年,人工智能预计将彻底改变众多行业,改变企业运营方式,提高效率、生产力和创新。本文将探讨一些准备在未来十年利用人工智能力量的顶级行业。 医疗保健:到2030年,医疗保健行业将从...
-
一文尽览!相机内参标定的工具有哪些?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机标定任务是很多高级功能的上游,无论是深度学习方案或是传统方案都非常依赖相机标定精度,今天就为大家盘点下相机内参标定常用的工具箱。 1)OpenCV标定工具箱 opencv这个不用多说了,支持多种相机...
-
马斯克:人形机器人成本不到汽车的一半
3 月 27 日消息,特斯拉 CEO 埃隆・马斯克周二表示,制造人形机器人 Optimus 的成本仅为特斯拉电动汽车的一半。 马斯克在社交平台表示,“人形机器人虽然单位质量的复杂程度更高,但最终的制造成本我认为仍然会低于特斯拉汽车的一半。” 马斯克的...
-
DifFlow3D:场景流估计新SOTA,扩散模型又下一城!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based...
-
TrajectoryNAS:一种用于轨迹预测的神经结构搜索
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2403.11695.pdf 本文介绍了TrajectoryNAS:一种用于轨迹预测的神经结构搜索。自动驾驶系统是一项快速发展的技术,其可以实现...
-
CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做...
-
AIGC时代,软件测试智能化到底会怎样?
AI技术在软件测试领域的应用比软件开发早。早在上个世纪七、八十年代,软件测试就开始应用采用遗传算法生成测试数据,到九十年代,其研究和应用逐渐增多,从单元测试、接口测试到GUI的系统测试, 提供自动化的测试用例生成、自动化的测试执行和评估等功能,取得了不少成...
-
继电动汽车之后,下一次汽车转型是否已经发生?
随着从内燃机汽车向电动汽车的转变从未消失,停在街边的汽车连接充电线如何迅速成为一种常见景象。而且似乎一些汽车制造商已经度过了过渡阶段。汽车数字化和计算机化是另一个重大转变,它拥有约1亿行代码和1,000多个半导体芯片,而且这一趋势还在持续增长。据估计,...
-
「量子大军」出动,中国实验室破解世界级算法难题!MRD码微秒级加密防窃听,6G无人机爆炸性飞跃
近期,「新质生产力」成为备受市场关注的热词,不仅被写入2024政府工作报告,更被列为十大任务之首。 从古至今,人类社会的发展离不开生产力的变革,每一次生产力的变革都让人类社会发生天翻地覆的变化。从工业革命、电气革命到信息革命,生产力与生产关系的变化深刻影...
-
关于新的AI法案 每位CEO都需要了解的事
具有潜在危险的AI应用程序已被指定为“不可接受的”,除非在特定条件下用于政府、执法和科学研究,否则将是非法的。 与欧盟的一般数据保护条例一样,这项新立法将增加在27个成员国内开展业务的任何人的义务,而不仅仅是总部设在那里的企业。 负责撰写这份报告的人表...