-
DriveCoT:全面的开环端到端驾驶数据集和Benchmark
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,端到端自动驾驶技术取得了显著进展,表现出系统简单性和在开环和闭环设置下竞争性驾驶性能的优势。然而,端到端驾驶系统在驾驶决策方面缺乏可解释性和可控性,这阻碍了其在真实世界中的部署。本文利用CAR...
-
量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一,现有的算法在远距离范围下的感知表现依然较差。为此,我们提出了P-MapNet,其中的“P”强调我们专注于融合地图先验以...
-
到2030年可以依靠人工智能运行的主要行业
随着人工智能(AI 继续快速发展,其在各个领域的潜在应用日益明显。到2030年,人工智能预计将彻底改变众多行业,改变企业运营方式,提高效率、生产力和创新。本文将探讨一些准备在未来十年利用人工智能力量的顶级行业。 医疗保健:到2030年,医疗保健行业将从...
-
一文尽览!相机内参标定的工具有哪些?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机标定任务是很多高级功能的上游,无论是深度学习方案或是传统方案都非常依赖相机标定精度,今天就为大家盘点下相机内参标定常用的工具箱。 1)OpenCV标定工具箱 opencv这个不用多说了,支持多种相机...
-
马斯克:人形机器人成本不到汽车的一半
3 月 27 日消息,特斯拉 CEO 埃隆・马斯克周二表示,制造人形机器人 Optimus 的成本仅为特斯拉电动汽车的一半。 马斯克在社交平台表示,“人形机器人虽然单位质量的复杂程度更高,但最终的制造成本我认为仍然会低于特斯拉汽车的一半。” 马斯克的...
-
DifFlow3D:场景流估计新SOTA,扩散模型又下一城!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DifFlow3D: Toward Robust Uncertainty-Aware Scene Flow Estimation with Iterative Diffusion-Based...
-
TrajectoryNAS:一种用于轨迹预测的神经结构搜索
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://arxiv.org/pdf/2403.11695.pdf 本文介绍了TrajectoryNAS:一种用于轨迹预测的神经结构搜索。自动驾驶系统是一项快速发展的技术,其可以实现...
-
CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后,才能让自动驾驶系统中的下游规控模块做...
-
AIGC时代,软件测试智能化到底会怎样?
AI技术在软件测试领域的应用比软件开发早。早在上个世纪七、八十年代,软件测试就开始应用采用遗传算法生成测试数据,到九十年代,其研究和应用逐渐增多,从单元测试、接口测试到GUI的系统测试, 提供自动化的测试用例生成、自动化的测试执行和评估等功能,取得了不少成...
-
继电动汽车之后,下一次汽车转型是否已经发生?
随着从内燃机汽车向电动汽车的转变从未消失,停在街边的汽车连接充电线如何迅速成为一种常见景象。而且似乎一些汽车制造商已经度过了过渡阶段。汽车数字化和计算机化是另一个重大转变,它拥有约1亿行代码和1,000多个半导体芯片,而且这一趋势还在持续增长。据估计,...
-
「量子大军」出动,中国实验室破解世界级算法难题!MRD码微秒级加密防窃听,6G无人机爆炸性飞跃
近期,「新质生产力」成为备受市场关注的热词,不仅被写入2024政府工作报告,更被列为十大任务之首。 从古至今,人类社会的发展离不开生产力的变革,每一次生产力的变革都让人类社会发生天翻地覆的变化。从工业革命、电气革命到信息革命,生产力与生产关系的变化深刻影...
-
关于新的AI法案 每位CEO都需要了解的事
具有潜在危险的AI应用程序已被指定为“不可接受的”,除非在特定条件下用于政府、执法和科学研究,否则将是非法的。 与欧盟的一般数据保护条例一样,这项新立法将增加在27个成员国内开展业务的任何人的义务,而不仅仅是总部设在那里的企业。 负责撰写这份报告的人表...
-
AI和6G:构建自给自足的安全网络
在技术快速进步的时代,人工智能(AI 和即将推出的第六代(6G 无线通信技术的融合,有望彻底改变我们感知网络和与网络交互的方式。随着互连设备的激增,以及对高速、低延迟连接的需求不断增加,自我维持和安全网络的发展已成为首要关注的问题。本文将深入探讨人工智能...
-
AI模型训练:强化算法与进化算法
强化学习算法(RL 和进化算法(EA 都属于机器学习领域的子集,但它们在解决问题的方法和思想上有所不同。 强化学习算法: 强化是一种机器学习范式,它主要关注的是智能体(agent 在与环境进行交互的过程中,通过尝试和错误来学习最优的行为策略,以使其在某...
-
CUDA之通用矩阵乘法:从入门到熟练!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 通用矩阵乘法 (General Matrix Multiplication,GEMM 是各种模型和计算中的核心部分,同时也是评估计算硬件性能 (FLOPS 的标准技术。本文将通过对 GEMM 的实...
-
Stable Diffusion中的UNet是什么?
UNet的论文 U-Net: Convolutional Networks for Biomedical Image Segmentation | SpringerLink 首先,U-Net的卷积神经网络架构,最早它被用于生物医学图像分割任务。U-Ne...
-
UniPAD:一种通用的自动驾驶预训练模式
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 UniPAD研究了一个关键问题:如何有效地利用大量未标记的3D点云数据进行自监督学习,以增强其在3D目标检测和语义分割等下游任务中的应用效率。这个问题之所以重要,是...
-
相机与激光雷达是怎么标定的?一览行业所有主流的标定工具
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机与激光雷达的标定是很多任务的基础工作,标定精度决定了下游方案融合的上限,因为许多自动驾驶与机器人公司投入了较大的人力物力不断提升,今天也为大家盘点下常见的Camera-Lidar标定工具箱,建议收...
-
深度估计SOTA!自动驾驶单目与环视深度的自适应融合
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 多视图深度估计在各种基准测试中都取得了较高性能。然而,目前几乎所有的多视图系统都依赖于给定的理想相机姿态,而这在许多现实世界的场景中是不可用的,例如自动驾驶。本工作提出了一...
-
人工智能如何发展到AIGC?解密一份我四年前写的机器学习分享材料
正文共:777 字 26 图,预估阅读时间:2 分钟 我第一次参与到人工智能中,还是在H3C的时候,当时H3C搞领航者峰会,准备了一个智能问答机器人——吱吱答。当时的吱吱答,是真的“人工”智能,实现机制就是传统的关键词识别、系统问题匹配等,...
-
小米汽车超级工厂正式揭幕 人工智能汽车AI应用有哪些?
在「小米汽车超级工厂正式揭幕」的消息中,我们看到了小米在汽车领域的雄心和实力。小米创办人,董事长兼CEO雷军的这一宣布,不仅标志着小米汽车产业的正式启动,也预示着AI技术在汽车制造和管理领域的进一步应用和发展。小米汽车超级工厂的揭幕,是小米公司多元化战略的...
-
端到端大一统前夕?GenAD:LLM和轨迹规划全搞定
今天汽车人和大家分享一篇自动驾驶领域中第一个大规模视频预测模型。为了消除高成本数据收集的限制,并增强模型的泛化能力,从网络获取了大量数据,并将其与多样化和高质量的文本描述配对。由此产生的数据集累积了超过2000小时的驾驶视频,涵盖了世界各地具有多样化天气...
-
12 分钟内部会结束了苹果十年造车梦,转攻 AIGC
1苹果叫停十年造车项目,团队成员有人转岗,有人被裁 据知情人士透露,苹果在一次时长约 12 分钟的内部会议上决定叫停长达十年的电动汽车研发尝试,放弃公司有史以来最具野心的重大项目之一。 知情人士称,苹果公司于本周二在内部放出了上述消息,令参与电车项目的...
-
DualBEV:大幅超越BEVFormer、BEVDet4D,开卷!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致...
-
旷视实战大模型:把多模态扎进行业
距离ChatGPT、GPT-4等引爆新一轮人工智能变革的时刻,已经过去了整整一年的时间。在这一年里,国内外大量公司涌入大模型的“斗兽场”,加速大模型技术的迭代与跃迁。 大模型前所未有的通用任务处理能力,让所有人看到了解锁更多应用场景的可能性。各行各业开始...
-
为自动驾驶而生,Lightning NeRF:速度提升10倍
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 最近的研究强调了NeRF在自动驾驶环境中的应用前景。然而室外环境的复杂性,加上驾驶场景中的视点受限,使精确重建场景几何体的任务变得复杂。这些挑战往往会导致重建质量下降...
-
全球首个基于大语言模型的自动驾驶语言控制模型
Arxiv论文链接:https://arxiv.org/abs/2312.03543项目主页:https://github.com/Petrichor625/Talk2car_CAVG 近年来,工业界和学术界都争先恐后地研发全自动驾驶汽车(AVs)。尽...
-
优于所有方法!HIMap:端到端矢量化HD地图构建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 矢量化高清(HD)地图构建需要预测地图元素的类别和点坐标(例如道路边界、车道分隔带、人行横道等)。现有技术的方法主要基于点级表示学习,用于回归精确的点坐标。然而,这种pipeline在获得elemen...
-
DECO: 纯卷积Query-Based检测器超越DETR!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标题:DECO: Query-Based End-to-End Object Detection with ConvNets 论文:https://arxiv.org/pdf/2312.13735...
-
机器学习:Github上排名前19个强化学习 (RL)项目
强化学习 (RL 是一种机器学习,使代理能够通过反复试验来学习。强化学习算法用于各种应用,包括游戏、机器人和金融。 RL 的目标是找到一种最大化预期长期回报的策略。强化学习算法通常分为两类:基于模型的算法和无模型的算法。基于模型的强化学习算法构建环境模...
-
华为云张平安:矢志打造中国 AI 算力的沃土
今天,AI 重塑一切,“人工智能+”首次被写入政府报告,AI 产业机遇加速涌现,AI 创新大有可为。 “所有的行业必须拥抱 AI,我们必须要有澎湃的 AI 算力,华为云矢志要将技术扎到根,做 AI 算力的沃土,推动行业智能应用创新,携手伙伴构建核心技术...
-
进一步加速落地:压缩自动驾驶端到端运动规划模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:On the Road to Portability: Compressing End-to-End Motion Planner for Autonomous Driving 论文链接:ht...
-
直接干到未来!DriveDreamer-2:世界首个自定义驾驶场景流生成,提升50%!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 世界车型在自动驾驶方面表现出了优势,尤其是在多视图驾驶视频的生成方面。然而,在生成自定义驾驶视频方面仍然存在重大挑战。在本文中,我们提出了DriveDreamer-2...
-
实时加SOTA一飞冲天!FastOcc:推理更快、部署友好Occ算法来啦!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在自动驾驶系统当中,感知任务是整个自驾系统中至关重要的组成部分。感知任务的主要目标是使自动驾驶车辆能够理解和感知周围的环境元素,如行驶在路上的车辆、路旁的行人、行驶过...
-
图片采集卡:数字影像世界的关键纽带
在数字影像技术日新月异的今天,图片采集卡作为连接模拟与数字世界的桥梁,发挥着越来越重要的作用。它不仅是专业影像处理的核心组件,也日渐成为普通消费者追求高质量数字生活的一部分。本文将深入探讨图片采集卡的原理、应用及其对数字影像技术发展的推动作用。一、图片采集...
-
端到端没有数据怎么办?ActiveAD:面向规划的端到端自动驾驶主动学习!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 自动驾驶的端到端可微学习最近已成为一种突出的范式。一个主要瓶颈在于其对高质量标记数据的巨大需求,例如3D框和语义分割,这些数据的手动注释成本是出了名的昂贵。由于AD中样本内的行为往往存在长尾分布这一...
-
3DGStream:快速训练,200 FPS实时渲染逼真场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从多视角视频构建动态场景的照片逼真的自由视角视频(FVV)仍然是一项具有挑战性的工作。尽管当前的神经渲染技术取得了显著的进步,但这些方法通常需要完整的视频序列来进行离线训练,并且无法实时渲染。为了解决...
-
探索数据科学对机器人的影响
数据驱动的感知: 数据科学彻底改变机器人技术的关键领域之一是感知。配备了传感器、摄像头和其他数据收集机制的机器人会产生大量有关其环境的数据。数据科学技术,包括计算机视觉、传感器融合和深度学习,使机器人能够解释和理解这些数据,促进强大的感知能力。从物体识...
-
AI和大数据正在改变汽车行业的六种方式
预测未来 每个车主都明白定期更换机油和刹车检查的价值,希望避免未来更昂贵的维护,现在,大数据和人工智能正在为主动的车辆健康提供涡轮增压。 预测性维护使经销商能够远程和连续地监控车辆性能数据,集成的车载传感器收集任何给定汽车的健康数据,并利用人工智能和大...
-
RAG和AGI以及AIGC,你知道多少?
RAG(Retrieval-Augmented Generation): RAG是一种模型架构,结合了检索(retrieval)和生成(generation)的方法。它使用检索模块从大规模的知识库中检索相关信息,然后使用生成模块生成响应或回答。这种结合...
-
LimSim++:多模态大模型在自动驾驶中的新舞台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文名称:LimSim++: A Closed-Loop Platform for Deploying Multimodal LLMs in Autonomous Driving 项目主页:https:...
-
不再性感的谷歌将成下一个IBM?老龄化严重,不再支持创新,失去员工信任人才外流
在Gemini引发舆论的轩然大波之后,「劈柴下课」的呼声不绝于耳。 回想最近一个月,谷歌一直很狼狈。 在华丽丽地推出Gemini后两个月后,Gemini 1.5 Pro重磅登场。 2月15日的1600字博文中,Gemini 1.5 Pro被称为「更大、更...
-
无线通信的AI和6G技术
随着技术的变化,人工智能(AI 和6G技术的结合——无线通信的下一件大事,可能会改变我们连接、交谈和生活的方式。根据一些专家的说法,未来6G网络的潜力可能使互联网设备的最高速度达到每秒1太比特(Tbps 。这一速度将比目前最快的1 Gbps速度快100...
-
浅析人工智能对各行业的影响
这一全面的探索将深入探究人工智能对各个领域的多方面影响。通过仔细研究现实世界的例子,我们将说明人工智能的影响不仅仅是一种渐进的变化,而是一种革命性的浪潮,从根本上改变了从医疗保健到金融、教育到娱乐等行业。我们的旅程将展示人工智能如何提高效率,个性化体验...
-
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究
OpenAI又迎来一位AI大将。 最近,华人科学家程博文官宣离职特斯拉,即将加入OpenAI专攻多模态模型的研究。 图片 今天是我在特斯拉自动驾驶部门的最后一天,这一年半的经历真的很棒:有机会与才华横溢的同事们共事,学习了如何开发出色的产品等等。但我向通...
-
李彦宏:程序员会消失;拜登谈TikTok撤离;李想终就MEGA风波表态;英伟达紧急处理全球范围故障;刘作虎:AI手机非噱头
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.阿里包揽中国估值最高的5家大模型独角兽 在对AI大模型初创企业的投资竞赛中,阿里巴巴已成为中国互联网巨头中最大的投资者目前,中国一级市场上估值最高的5家A大模型初创公司,阿里均参与投...
-
理解世界,最新综述开启自动驾驶新时代~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在快速发展的自动驾驶领域,准确预测未来事件并评估其影响的能力对安全性和效率至关重要,对决策过程至关重要。世界模型已经成为一种变革性的方法,使自动驾驶系统能够合成和解释大...
-
OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 对3D场景的全面理解在自动驾驶中至关重要,最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3D占用预测方法在很大程度上依赖于全景相机图像,这使得它们容...
-
CLRNet:一种用于自动驾驶车道检测的分层细化网络算法
车道是具有高级语义的交通标志,特别是在视觉导航系统中尤其重要。检测车道可以使许多应用受益,例如自动驾驶和高级驾驶员辅助系统(ADAS)中的视觉导航就是一个典型的应用,它可以帮助智能车辆更好地进行自车定位并更安全地行驶。 然而,车道检测拥有特定的局部模式,...
-
ADMap:抗干扰在线高精地图新思路
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大家好,很开心能够受邀来到自动驾驶之心分享我们的在线重建矢量化高精度地图的抗扰动方法ADMap。我们的代码已经发布在https://github.com/hht199...