-
Thoughtworks肖然:大模型走向大众,需要新的应用开发逻辑
嘉宾 | 肖然 采访 & 撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 新年伊始,AI大佬们频繁被问及一个话题:“什么时候有杀手级AI应用”。几个月过去,诸如AI Pin、Rabbit R1、Devin等AI产品一闪...
-
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多...
-
报道称,马斯克将数千个AI芯片从特斯拉转移到了X
根据CNBC获得的芯片制造商的电子邮件,埃隆·马斯克(Elon Musk)订购了数千个运往特斯拉的英伟达制造的AI芯片,这些芯片将被转移到他的社交媒体公司X。据该媒体报道,此举有可能将特斯拉收购价值5亿美元的处理器的时间推迟数月。 图源备注:图片由AI生...
-
黄仁勋:下一波浪潮是物理AI 将进入全新机器人时代
站长之家(ChinaZ.com)6月5日 消息:在最近的一次演讲中,英伟达公司的CEO黄仁勋描绘了一个引人注目的未来愿景——物理AI,这一新的技术浪潮正在悄然改变我们的世界。他提出,物理AI,或称为实体AI,是指那些能够模拟智能生物体在控制、形态、动作执行...
-
AI信任问题:你需要知道的事情
随着AI在我们的日常生活和商业运营中的快速发展和整合,AI信任已经成为人类体验和体验经济运行中更加关键的元素。AI技术具有提高效率、个性化体验和管理复杂任务的能力。 然而,它们也带来了挑战,特别是在维护和促进信任方面。 AI对系统的信任 AI系统正越来...
-
理解老司机,超越老司机!LeapAD:具身智能加持下的双过程自驾系统(上海AI Lab等)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文信息 论文题目:Continuously Learning, Adapting, and, Improving: A Dual-Process Approach to Autonomous Dr...
-
港科大最新!Vista:一种具有高保真度和多功能可控的世界模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...
-
【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比
MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析,包括性能、应用场景和技术特点。 从性能角度来看,MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色,实现了开源模型的性能SOTA...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
武汉市民点赞无人驾驶,市交通运输局:与头部企业共创智能网联汽车产业新蓝图
“武汉市注重智能网联汽车产业发展,已陆续开放智能网联汽车开放道路超千公里,鼓励智能网联汽车头部企业入驻武汉,携手共创武汉智能网联汽车产业发展新蓝图。百度萝卜快跑作为自动驾驶行业中的领军企业,重视武汉智能网联汽车产业发展,从2022年8月落户武汉经开区以来...
-
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响...
-
AI大牛karpathy点赞SEAL榜单,LLM评估的状况过去是非常糟糕的!
lmsys.org的一个严肃的竞争对手已经加入了对LLMs(大型语言模型)评估的讨论中:SEAL Leaderboards——对领先前沿模型进行的私密、专家评估。 SEAL Leaderboards的设计原则: ?私密 + 无法被利用。在评估上不会过度拟...
-
比PID更丝滑的控制算法&卡内基梅隆大学
本文经自动驾驶之心公众号授权转载,转载请联系出处。 MPC控制算法,全称Model Predictive Control(模型预测控制),是一种基于系统动态模型的控制技术。它的工作原理是通过数学模型预测系统的未来行为,并基于这些预测结果来优化系统的控制...
-
腾讯云存储面向AIGC全面升级,搭载全面自研存储引擎
云厂商继续为大模型加速落地铺路架桥。 4月8日,腾讯云宣布云存储解决方案面向AIGC场景全面升级,能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训...
-
自动驾驶系统架构转变思考
本文经自动驾驶之心公众号授权转载,转载请联系出处。 自动驾驶系统架构转变思考 从事辅助驾驶系统架构一段时间后,感觉到了疲惫和无力感,更加深刻的理解到道德经,道生于有,有生于无,有无相生,难易相承,.....是以圣人处无为之事,行不言之教,万物作焉而不辞...
-
AIGC在汽车软件开发的应用举例
AIGC(人工智能生成内容)在汽车软件开发领域的应用主要体现在以下几个方面: 个性化和定制化车辆的创造:通过分析大型数据集并生成新内容,AIGC技术使得创造更加个性化和定制化的车辆成为可能。这不仅提高了车辆的安全性和用户体验,还推动了自动驾驶汽车的发展。...
-
最猛AI独角兽:一年估值1700亿,再造一个OpenAI!马斯克LeCun却吵起来了
马斯克搞大模型又融到60亿美元(约435亿元)! 这是xAI最大的一轮融资,目前估值已来到240亿美元(约1738亿元),一举超过Anthropic,成为OpenAI之下第二位。 借着这个势头,老马也亲自下场发起招聘广告: 如果你相信我们理解宇宙的使命,...
-
人工智能AI和数字化世界走向何方
2024 年 5 月 23 日,美国众议院外交事务委员会以压倒性多数投票提交了一项法案,该法案将使拜登政府更容易限制 AI 系统的出口。该法案还将赋予美国商务部明确的权力,禁止美国人与外国人合作开发对美国国家安全构成威胁的 AI 系统。 路透社本月报...
-
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。 早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI...
-
马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o
前段时间,OpenAI、谷歌、微软相继开大会,AI圈子的竞争如火如荼。 这么热闹的时候,怎么能少得了马斯克。 前段时间忙着特斯拉和星链的他,最近好像开始腾出手,而且不鸣则已、一鸣惊人,直接放出一个大消息——自己要造世界上最大的超算中心。 今年3月,他旗下...
-
目标检测新SOTA,端侧实时识别,沈向洋罕见转发点赞
目标检测领域,迎来了新进展—— Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。 这一进展获得AI大佬沈向洋转发,他一般都是一年一转的节奏。 此次发布主要有两个版本:Pro和Edge。Pro版更强,Edge版更快。...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
PVTransformer: 可扩展3D检测的点到体素Transformer
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:PVTransformer: Point-to-Voxel Transformer for Scalable 3D Object Detection 论文链接:https://arxiv.org...
-
综述!全面概括基础模型对于推动自动驾驶的重要作用
写在前面&笔者的个人理解 近年来,随着深度学习技术的发展和突破,大规模的基础模型(Foundation Models)在自然语言处理和计算机视觉领域取得了显著性的成果。基础模型在自动驾驶当中的应用也有很大的发展前景,可以提高对于场景的理解和推理。...
-
CVPR 2024|多模态场景感知,小红书高保真人体运动预测方法来了!
设想一下,你在家中准备起身,前往橱柜取东西。一个集成 SIF3D 技术的智能家居系统,已经预测出你的行动路线(路线通畅,避开桌椅障碍物)。当你接近橱柜时,系统已经理解了你的意图,柜门在你达到之前就已自动打开,无需手动操作。 视频中,左边为 3D 场景...
-
开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 车路协同的同步驾驶数据 车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aided autonomous driving)在提供更安全的驾驶策略方面具有巨大潜力。研...
-
大模型数据标注平台Scale AI融资10亿美元,估值达138亿美元
日前,大模型领域著名数据标注平台 Scale AI 宣布完成10亿美元的 F 轮融资,公司估值达138亿美元,成为该领域独角兽。 此轮融资由 Accel 领投,亚马逊、英特尔、AMD、思科、Meta、ServiceNow、老虎全球基金等全球知名公司跟投。...
-
案例分享|Alluxio在自动驾驶模型训练中的应用与部署
分享嘉宾: 杨林三-辉羲智能 关于辉羲智能: 辉羲智能是一家做自动驾驶芯片的初创公司,成立于2022年。致力打造创新车载智能计算平台,提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案,助力车企实现优质高效的自动驾驶量产交付,构建低成本、大规...
-
自动驾驶第一性之纯视觉静态重建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如...
-
走进数字时代:采集图片的艺术与科技
在数字化飞速发展的今天,图片采集已成为我们日常生活和工作中不可或缺的一部分。从拍摄美丽的风景照,到记录重要的历史时刻,再到科学研究中的数据分析,采集图片这一行为所蕴含的意义和内涵越来越丰富。接下来,就让我们一起走进这个充满魅力的领域,探索采集图片背后的艺术...
-
加州大学最新!CarDreamer:全面、灵活的自动驾驶算法测试开源平台
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 为了在复杂的真实世界场景中安全导航,自动驾驶汽车必须能够适应各种道路条件并预测未来事件。基于世界模型的强化学习(RL)已经成为一种有前景的方法,通过学习和预测各种环境...
-
自动驾驶场景中的长尾问题怎么解决?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。 自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原...
-
路径规划概述:基于采样、搜索、优化全搞定!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1 决策控制与运动规划概述 目前决策控制方法可以分为三类:sequential planning、behavior-aware planning、和end-to-end planning。 seq...
-
魅族21系列首发!Flyme AIOS发布
快科技5月16日消息,今天下午,全新的Flyme AIOS正式发布。 Flyme AIOS的升级重点是AI”,带来了桌面AI搜索、AI生成壁纸、AI游戏超清、AI连麦对话、AI智能打码、AI笔记创作、AI全局录音、AI客服对话等等功能。 并且Flyme A...
-
重塑生成式 AI 时代的云上「构建」体验
生成式AI时代下的云计算行业变革在全面加速,新的云上构建的时间已经到来,作为一位开发者,如何才能游刃有余地应技术革新?如何快速抓住新技术机遇快速上手和成长?加入开发者开发者必去的 2024 年亚马逊云科技中国峰会,可以帮您答疑解惑并获得回报!亚马逊云科技...
-
大模型真要取代程序员了?最危险的岗位是......
如今,随着大模型在编程、代码生成、自动化测试等领域展现出越来越强大的能力,一个引人深思的问题浮现出来:大模型会不会最终取代程序员的工作? 有些人认为,世界上本就没有哪项工作是绝对安全的,机器取代人工本就是迟早的事。从 GitHub Copilot...
-
DenserRadar:基于密集LiDAR点云的4D毫米波雷达点云检测器
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DenserRadar: A 4D millimeter-wave radar point cloud detector based on dense LiDAR point clouds 论...
-
AI风投基金OpenAI Startup Fund额外筹集500万美元资金
OpenAI Startup Fund 是一家早期投资于人工智能公司的风投基金,最近从美国证券交易委员会提交的文件中可以看到,该基金已额外融资500万美元。 这笔新资金来自两位投资者,他们将资金转入了 OpenAI Startup Fund 关联的特殊目的...
-
OpenAI 创投基金继续扩大规模 支持多家人工智能初创公司
根据向美国证券交易委员会提交的文件,OpenAI Startup Fund 是一家投资早期人工智能公司的风险基金。最近,该基金已成功额外筹集了500万美元,并将法律控制权从 Sam Altman 移交给 Ian Hathaway。 新资金由两名投资者...
-
超越ORB-SLAM3!SL-SLAM:低光、严重抖动和弱纹理场景全搞定
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 今天我们探讨下深度学习技术如何改善在复杂环境中基于视觉的SLAM(同时定位与地图构建)性能。通过将深度特征提取和深度匹配方法相结合,这里介绍了一种多功能的混合视觉SLAM系统,旨在提高在诸如低...
-
外媒曝光苹果放弃造车真实原因!高管体验ChatGPT后担心掉队
快科技5月12日消息,近日,有国外媒体报道了苹果公司放弃自动驾驶汽车项目的原因。 报道称,苹果高层在体验了OpenAI推出的聊天机器人ChatGPT后,对其背后的强大生成式人工智能技术感到震惊。 苹果担心新兴AI技术可能威胁到iPhone的市场主导地位,甚...
-
SIGGRAPH'24 | 太逆天了!利用分层3D GS,实时渲染超大规模场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,新视角合成取得了重大进展,3D Gaussian splatting提供了出色的视觉质量、快速训练和实时渲染。然而,训练和渲染所需的资源不可避免地限制了可以以良好视觉质量表示的场景大小。本文引入...
-
DriveWorld:一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注,而预训练对于提取通用表示至关重要。然而,当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务,忽视了自动驾驶作为4D场景理解...
-
LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 这篇论文致力于解决当前多模态大语言模型 (MLLMs 在自动驾驶应用中存在的关键挑战,尤其是将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆 (AVs ...
-
LidaRF:研究用于街景神经辐射场的激光雷达数据(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 光真实感模拟在自动驾驶等应用中发挥着关键作用,其中神经辐射场(NeRFs)的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而,由于街道上相机运动的高度共线性和在高速下的稀疏采样,街景的重建质...
-
2024年,端到端自动驾驶在国内是否会有实质性的突破和进展?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 毫不意外,随着Tesla V12在北美大范围推送以及凭借其良好的表现开始获得越来越多用户的认同,端到端自动驾驶也成为了自动驾驶行业里大家最为关注的技术方向。最近有机会和很多行业中的一流工程师,产品经理,...
-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
美国空军高调展示首个AI战斗机!部长亲自试驾全程未干预,10万行代码试飞21次
最近,军事圈被这个消息刷屏了:美军的战斗机,已经能由AI完成全自动空战了。 是的,就在最近,美军的AI战斗机首次公开,揭开了神秘面纱。 这架战斗机的全名,是可变稳定性飞行模拟器测试飞机(VISTA),由美空军部长亲自搭乘,模拟了一对一的空战。 5月2日...
-
LeCun哈佛演讲PPT放出:唱衰自回归LLM,指明下一代AI方向
机器如何能像人类和动物一样高效地学习?机器如何学习世界运作方式并获得常识?机器如何学习推理和规划…… 当一系列问题被提出时,有人回答自回归 LLM 足以胜任。 然而,知名 AI 学者、图灵奖得主 Yann LeCun 并不这么认为,他一直唱衰自回归 LL...
-
OmniDrive: 一个关于大模型与3D驾驶任务对齐的框架
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从一个新颖的3D MLLM架构开始,该架构使用稀疏查询将视觉表示提升和压缩到3D,然后将其输入LLM。 题目:OmniDrive: A Holistic LLM-Agent Framework for...