-
ADMap:抗干扰在线高精地图新思路
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大家好,很开心能够受邀来到自动驾驶之心分享我们的在线重建矢量化高精度地图的抗扰动方法ADMap。我们的代码已经发布在https://github.com/hht199...
-
开环端到端自动驾驶中自车状态是你所需要的一切吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? 论文链接:https://arxiv.org/a...
-
马斯克打算为特斯拉量身定制一个ChatGPT
编译 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) ChatGPT在互联网上引起轰动后不久,2022年12月,特斯拉的帕洛阿尔托总部也在进行类似的开发。该公司自动驾驶系统的工程师达瓦尔·施罗夫向首席执行官埃隆·马斯克提出了一个概念...
-
一个关于BEV车道线落地的点点滴滴
本文经自动驾驶之心公众号授权转载,转载请联系出处。 21年 埋下了一颗种子 看过BEV障碍物故事的同学应该清楚,我们组是在21年10月左右开始做BEV 障碍物的。那个时候不敢想着去做BEV 车道线,因为没有人力。但是我记得在12月左右的时候,我们面到了...
-
Gen AI对下一代交通领域的影响
下一代交通依赖于电子、可持续性和体验作为其设计的核心,Gen AI对设想的下一代交通生态系统的每种模式都有影响。市场有五个特定的重点领域:EV(电动汽车 、AV(自动驾驶汽车 、Micro mobility(第一英里连接 、Hyperloops(超高...
-
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
没人怀疑,OpenAI开年推出的史诗巨作Sora,将改变视频相关领域的内容生态。 但Google DeepMind、UC伯克利和MIT的研究人员更进一步,在他们眼里,「大视频模型」也许能够像世界模型一样,真正的做到理解我们身处的这个世界。 论文地址:h...
-
逆天UniVision:BEV检测和Occ联合统一框架,双SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
惊艳!!!特斯拉端到端演示视频分析
本文经自动驾驶之心公众号授权转载,转载请联系出处。 外网有用户放了一段特斯拉FSD v12的视频,有人搬运到b站上了: https://www.bilibili.com/video/BV1Z6421M797www.bilibili.com/video/...
-
人工智能如何影响汽车行业
汽车行业正在经历快速的技术变革,从传统机械转向电气化和自动驾驶。汽车已经发展成为复杂、可持续的系统,为乘客提供安全、数字化、互联且娱乐性的系统。该行业向软件定义汽车的转变要求汽车软件开发人员调整他们的方法。质量管理在数字基础设施中至关重要,要求在保持消...
-
2024年自动驾驶标注行业是否会被世界模型所颠覆?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.数据标注面临的问题(特别是基于BEV 任务) 随着基于BEV transformer 任务的兴起,随之带来的是对数据的依赖变的越来越重,基于BEV 任务的标注也变得越来越重要。目前来看无论是2D-...
-
Think2Drive:首个用于自动驾驶的基于模型的RL方法(上海交大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在CARLA v2中以专家级的熟练程度运行。 题目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World...
-
人工智能引发新的网络威胁,你准备好了吗?
我们可以利用人工智能的优势,同时防范其潜在的陷阱,从人工智能驱动的网络钓鱼计划,到超逼真的深度伪造。因此,保护企业的关键是了解这些新威胁。 人工智能的网络威胁和挑战 虽然人工智能的好处可以为企业提供帮助,但也为组织必须承认的额外网络挑战和风险打开了大门...
-
苹果十年造车梦碎!2000人大裁员或转岗AI,烧光近百亿美元引马斯克狂喜
苹果十年造车,彻底梦碎——泰坦计划终结! 也就是说,这十年里苹果投的数十亿美元,彻底打了水漂。 就在刚刚,这一消息在苹果内部传开了,员工错愕。 摆在2000名员工面前的命运,是要么转岗,要么走人。 而苹果押注的下一个风口,就是生成式AI。 据悉,许多特...
-
了解一下CPU 、TPU、GPU、DPU、QPU
随着AI的火爆,CPU 、TPU、GPU、DPU、QPU这些缩略词整天在各种媒体里面飞来飞去。本文主要解释这些处理器,以及他们的优缺点。 CPU(中央处理器) CPU就像计算机的“大脑”。它能够处理计算机工作的所有基本任务,例如:运行程序、管理文件和执行...
-
苹果取消电动车计划,转向聚焦生成式AI
在近期的一份内部声明中,苹果首席运营官Jeff Williams和电动车项目负责人Kevin Lynch宣布取消自动驾驶电动车计划,将大部分从事该项目的2,000名员工调往生成式AI项目。这一决定意味着苹果将把重心转向生成式人工智能领域。 据悉,苹果的AI...
-
集成将成为技术领域的一个强大趋势
人工智能、边缘计算和动态数据的集成代表了一种强大的技术趋势,有可能改变各个行业并增强计算系统的能力。让我们探讨一下每个元素以及它们是如何相交的。 集成的组成部分 每一项都在技术如何塑造工业的未来方面发挥着作用。 人工智能(AI 人工智能是指能够执行通...
-
百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。 在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAA...
-
拥抱未来:塑造 2024 年的顶尖技术
在充满活力的技术创新领域,每一年都会带来一系列进步,重新定义我们的生活、工作以及与周围世界互动的方式。 步入 2024 年,大量突破性技术有望彻底改变我们生活的各个方面,从医疗保健、交通到通信和娱乐。 让我们深入研究今年将产生重大影响的顶级技术。 人...
-
直接干上车!DriveVLM:首个Orin部署的快慢双系统智驾大模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 在目前自动驾驶领域,传统的感知(perception)-预测(prediction)-规划(planning)的常规端到端自动驾驶在处理常规场景时表现尚可,但在面对复...
-
苹果将终止十年电动汽车计划“泰坦” 团队转向生成式AI
据外媒报道,苹果公司本周在内部宣布,将终止代号“泰坦”的电动汽车计划,团队将专注于研究生成式AI。 苹果暂未对此做出评论。马斯克在社交媒体上以敬礼和抽烟表情包评价这一传闻。 据悉,该项目由近2000名员工参与,历时十年之久,目的是为苹果进入汽车行业。然...
-
自动驾驶与轨迹预测看这一篇就够了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈...
-
VAD v2端到端SOTA | 远超DriveMLM等方法(地平线)
从大规模驾驶演示中学习类似人类的驾驶策略是很有前途的,但规划的不确定性和非确定性本质使得这一任务充满挑战。在这项工作中,为了应对不确定性问题,作者提出了VADv2,一个基于概率规划的端到端驾驶模型。VADv2以流方式输入多视角图像序列,将传感器数据转换为...
-
南大俞扬深度解读:什么是「世界模型」?
随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是「world simulator」,世界模型这个词又进入视野,但很少有文章来介绍世界模型。 这里回顾一下什么是世界模型,以及讨论Sora是不是world simulator。 什么是world...
-
英伟达市值超越俄罗斯GDP 「英伟达」人工智能AI应用有哪些?
最近关于「英伟达市值超越俄罗斯GDP」的报道显示出英伟达在市场上的强大地位和价值。这一数字的背后反映了英伟达在人工智能领域的重要地位,以及市场对其未来发展的信心。英伟达AI技术的广泛应用将继续推动其市值的增长,同时也开启了更多创新和合作的机会。 英伟达A...
-
「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统
在普渡大学数字孪生实验室的最新成果中,研究人员引入了一种革命性的技术——利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。 该技术的核心为Talk2Drive框架,旨在通过理解人类的自然语言来控制自动驾驶汽车,从而实现了一种前所未有的人车交互...
-
边缘人工智能:让智能更接近源头
随着人工智能的发展,不是把数据交给算法,而是算法去处理数据,从而实现一个全新的洞察力水平。 如今,人工智能 (AI 无处不在,使组织能够预测系统中断的可能性,推动自动驾驶汽车,并为聊天机器人或虚拟助手提供语言功能。 这些类型的人工智能用例主要依赖于...
-
动手实践丨轻量级目标检测与分割算法开发和部署(RK3568)
本文分享自华为云社区《自动驾驶(AIOT - 轻量级目标检测与分割算法开发和部署(RK3568 【玩转华为云】》,作者:HouYanSong。 本文将在ModelArts平台上开发轻量级目标检测与分割算法,并使用ModelBox框架在RK3568开发板...
-
YOLOv9官网体验入口 AI目标检测深度学习工具下载地址
YOLOv9是一款目标检测深度学习模型实现工具,通过使用可编程梯度信息来学习用户想要学习的内容。这个开源项目具有高效和准确的优势,主要用于目标检测任务。 点击前往YOLOv9 官网体验入口 谁可以从YOLOv9中受益? YOLOv9适合需要进行图像识别、...
-
YOLO不死!YOLOv9出炉:性能速度SOTA~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 如今的深度学习方法专注于设计最适合的目标函数,以使模型的预测结果与实际情况最接近。同时,必须设计一个合适的架构,以便为预测获取足够的信息。现有方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换...
-
ai毕业论文开题报告(开题报告ai写作免费)
宝子们在论文撰写过程中,研究背景的阐述在学术写作的引言部分扮演着非常重要的角色。很多宝子们在撰写引言时常遇到一个难题——如何有效、有逻辑地构建研究背景。这个问题通常源于对于如何撰写研究背景不是很明确,以及缺乏清晰的写作框架。很可能导致收集到的相关信息被杂乱...
-
人工智能、机器学习、深度学习,到底是个啥?
说到近些年的火热名词,“人工智能”必须榜上有名。随着去年ChatGPT爆火出圈,“AI(Artificial Intelligence,人工智能)”屡次霸屏热搜榜,并被英国词典出版商柯林斯评为2023年的年度词。 除了“人工智能”,我们还经常听到“机器学...
-
黄仁勋身家一年暴增4倍: 英伟达AI人工智能软件应用有哪些?
最近报道显示,英伟达公司首席执行官黄仁勋的身家在 2023 年飙升至 440 亿美元,这一数字较年初增长了 302 亿美元,使他成为今年收入最高的企业家之一。这一成就得益于英伟达股价在今年飙升了近246%。投资者对英伟达在人工智能领域的领先地位和引领力的信...
-
鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接:https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...
-
EgoGen官网体验入口 微软AI合成数据生成自我感知工具使用指南
EgoGen是一个用于生成以自我为中心的合成数据的系统,它能够模拟头戴设备(HMDs)的相机装置,并从相机佩戴者的视角渲染多种传感器数据。该系统提供了丰富的多模态数据和准确的注释,适用于自我感知任务。 点击前往EgoGen官网体验入口 谁可以从EgoGe...
-
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。 现有的自动驾驶系统通常包括...
-
爆火Sora的背后 | 聊聊什么是world models!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 随着媒体狂炒Sora,OpenAI的介绍材料中称Sora是 “world simulator”,世界模型这个词又进入视野,但很少有文章来介绍世界模型。这里回顾一下什么是世界模型,以及讨论Sora是不是...
-
都在搞端到端,试问端到端自动驾驶的基石到底是什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基础模型的出现彻底改变了自然语言处理和计算机视觉领域,为其在自动驾驶(AD)中的应用铺平了道路。这项调查对40多篇研究论文进行了全面回顾,展示了基础模型在增强AD中的...
-
YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址
YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。相比之前版本,YOLOv8在检测速度和精确度上都有很大提升,同时支持多种额外的计算机视觉任务,如实例分割、姿态估计等。YOLOv8可通...
-
四个优秀AI Agent开源项目,谈一谈大模型、人工智能代理
什么是AI Agent? 现在我们与大模型的互动,一般的过程是先输入一个提示词,之后,大模型根据输入内容进行计算并响应。每次想要得到一个新的输出,我们就必须再提供一个提示词。这个过程有点麻烦,因为总是要有人来驱动。 AI Agent(人工智能代理)则以不...
-
逆天了!UniVision:BEV检测和Occ联合统一框架,双任务SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&个人理解 最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处,但在特征表示、数据格式和目标方面仍存在差距,这对统一高效的3D感知...
-
AI驱动的超自动化如何提高业务效率
人们对AI和超自动化感到兴奋,这是有充分理由的,AI具有自动化涉及人类思维和相关行为的复杂企业任务的潜力。 AI驱动的企业超自动化看起来就像自动驾驶汽车的现状,我们有特斯拉可以按需送人们去地方,Waymo在旧金山和凤凰城的街道上漫游,根本没有司机!这是...
-
人工智能如何为未来智能大众出行解决方案铺平道路
预计到2030年,60%的人口将居住在城市地区。现在和未来的必要条件是大量人员进出城市中心的高效流动。城镇化的进步很大程度上依赖于此。在各种公共交通方式中,铁路在每乘客公里的能源消耗方面是最高效、最有效的。 然而,要使铁路成为首选,它必须安全、可靠且可用...
-
SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving 论文链接...
-
NeRF成为过去?三维重建迈向3D GS新时代!(复旦大学最新综述)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D Gaussian Splatting(3D-GS)已成为计算机图形学领域的一个重大进步,它提供了明确的场景表示和新颖的视图合成,而不依赖于神经网络,如神经辐射场...
-
『拯救』开放异构场景 | HEAL:最新可扩展协作感知框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 协同感知技术能够有效解决自动驾驶车辆单体感知中存在的障碍物遮挡、视角受限、以及远距离感知能力弱等问题。然而,现有的工作都做了一个过分简单的假设,即参与协作的智能体使用相同的传感器,部署相同的感知模型。...
-
AI自动化标注崛起,数据标注员要失业了?
在数据标注行业流行着一句话:“有多少智能,就有多少人工”。 由于需要标注的数据规模庞大且成本较高,一些互联网巨头及一些AI公司很少自己设有标注团队,大多交给第三方数据服务公司或者数据标注团队来做。 这也衍生出了专为AI而生的人力密集型的数据标注产业链。...
-
马斯克:特斯拉早已掌握视频生成技术 更胜过OpenAI
快科技2月19日消息,据媒体报道,OpenAI发布的首个文生视频模型Sora最近热度十分高,用户通过一句话,就能生成长达1分钟的高清视频。 特斯拉CEO埃隆马斯克在社交媒体平台X上发帖,吹捧了自家模拟现实和视频生成技术是最好的”。 马斯克称,特斯拉在一年前...
-
2024年应该关注的十大人工智能创新
人工智能(AI 不再只是一个流行词,它已成为我们日常生活的重要组成部分。人工智能在去年深入地融入我们社会的各个方面,改变我们的生活方式、工作方式以及与技术互动的方式。 今年是大年初一,我们将探讨2024年可能出现的十大人工智能创新,拥抱这些即将到来的人...
-
周鸿祎谈Sora模型:中美AI差距可能还在加大
2月17日消息,近日,OpenAI 发布了 Sora 模型,该模型可根据用户输入的文本提示词描述,生成一段60秒钟的视频内容。从OpenAI公开的演示视频来看效果非常超现实。 昨日,360董事长周鸿祎在微博发文,谈到OpenAI的文字转视频模型Sora。他...
-
万元预算打造高质量13B私有模型,Colossal-AI LLaMA-2 开源方案再升级
几个月前,Colossal-AI 团队仅利用8.5B token数据、15小时、数千元的训练成本,成功构建了性能卓越的中文LLaMA-2 7B 版本模型,在多个评测榜单性能优越。 在原有训练方案的基础上,Colossal-AI 团队再次迭代,并通过构建更...