-
Gemini vs GPT-4V到底哪家强?视觉-语言模型的全面比较和结合使用
概括 大家好,我是戚张扬,目前就读于香港大学,今天和大家分享一篇我们关于视觉语言模型最新的研究,这篇论文提供了对谷歌的Gemini和OpenAI的GPT-4V(ision 两个SOTA模型的深入定性比较研究。我们的研究涉及到对这两个模型在视觉语言能力、与...
-
数据闭环!DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 北大王选计算机研究所的最新工作,提出了DrivingGaussian,一个高效、有效的动态自动驾驶场景框架。对于具有移动目标的复杂场景,首先使用增量静态3D高斯对整个...
-
大模型被偷家!CNN搞多模态不弱于Transfromer(腾讯&港中文)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。 切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越SO...
-
机器人技术的当前趋势与未来前景
机器人技术,对未来有什么影响? 机器人的设计、开发和使用,是被称为机器人技术的工程和计算机科学学科的重点。机器人是一种通常可以自己执行各种任务的机器,通常是通过与环境相互作用并从感官输入中得出结论。计算机科学、电气工程、机械工程和人工智能是机器人技术的一...
-
什么?NeRF还能提升BEV泛化性能!首个BEV跨域开源代码并首次完成Sim2Real!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人总结 鸟瞰图(Bird eye's view, BEV 检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测,这导致了这些算法过...
-
超越BEVFusion!Lift-Attend-Splat:最新BEV LV融合方案
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文:Lift-Attend-Splat: Bird’s-eye-view camera-lidar fusion using transformers 链接:https://arxiv.org/pd...
-
2022最火科技~AIGC
2022年最火的信息科技~AIGC 人工智能内容生成 趣讲大白话:输入几个词,立刻生成机器创造的内容 ************** 从人工智能决策 走向 人工智能生成 人工智能决策:自动驾驶、抖音推荐算法 人工智能生成内容:即AI Generated...
-
到2027年,汽车人工智能市场将达到70亿美元
全球汽车人工智能市场规模预计将从2022年的23亿美元增长到2027年的70亿美元。 MarketsandMarkets最近的一份报告预测,到2027年,全球汽车人工智能市场将以24.1%的复合年增长率(CAGR 从目前的23亿美元飙升至惊人的70亿美...
-
DrivingGaussian:逼真环视数据,驾驶场景重建SOTA
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes...
-
马斯克“超级高铁”梦碎美国!明星创业公司公告倒闭,成立10年一单没接
很突然,“超级高铁”明星公司Hyperloop One宣布即将倒闭,解雇了大部分员工,12月31日彻底结束。 一时间马斯克又成了话题焦点,出现两种不同声音:马斯克重塑交通的梦想破碎或马斯克又一个谎言失败了。 这家公司一直与马斯克绑定在一起,其实它既不...
-
Tracking Any Object Amodally :让AI像人一样可以追踪任何对象
Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体,即使在部分遮挡或不完全可见的情况下也能理解其完整结构。 在这个项目中,计算机被训练成能够“理解”并追踪到部分遮挡物体的完...
-
Point Transformer V3:更简单、更快、更强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Point Transformer V3: Simpler, Faster, Stronger 论文链接:https://arxiv.org/pdf/2312.10035.pdf 代码链接:h...
-
纯小白入门,开山之作NeRF学习笔记!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 神经辐射场究竟是什么 辐射场:由光源发出的光线在场景中的传播和反射过程中所形成的能量分布。通俗来说就是一个函数,记录了空间某个位置处向某个方向的辐射信息,辐射信息(或者说能量分布)其实就是颜色、亮度、...
-
清华特奖焦剑涛大模型创业:突破GPT-4工具使用能力,搞开源种子轮融资七千万
两位清华校友打造,在GPT-4核心优势之一使用工具上实现超越。 连HuggingFace CEO都来帮它造势: 它的名字叫“NexusRaven”,参数只有130亿。 出色的函数调用能力连网友都忍不住称赞,既可以并行也可以嵌套。 背后团队则更令人瞩目...
-
23年生成式AI全球投资超360亿!开发者预测2024年LLM应用进入大爆发
2023年11月30日,ChatGPT庆祝了它的生日,Similarweb发布了下面这张精美的信息图来纪念这一时刻。 从ChatGPT诞生,到2023年5月,它的访问量一直在迅速增长,峰值达到了每月18亿次的访问量。 随后,客流量在6月有所下降,但自9...
-
AIGC专题报告:生成式人工智能人人可用的新时代
今天分享的AIGC系列深度研究报告:《AIGC专题报告:生成式人工智能人人可用的新时代》。 (报告出品方:埃森哲) 报告共计:21页 人工智能发展迎来新拐点 ChatGPT 正在唤醒全球对人工智能(AI) 变革潜力的认知,激发起前所未有...
-
前OpenAI首席科学家Ilya: 只要能够预测下一个token,人类就能达到AGI
近日,Nature将前OpenAI首席科学家Ilya Sutskever评为「2023年10大科学人物」。 这位刚刚因为OpenAI巨变而远离聚光灯的「AI技术灯塔」,似乎并没有做好准备回到公众视野之中。 Nature在介绍他的长文中说「Ilya拒绝了N...
-
斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置
斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序,可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置,其准确率令人印象深刻。 根据预印本论文的数据,PIGEON 可以以92%的准确率预测所拍摄国家,并且在40%的猜测中可以将位置定...
-
PillarNeSt:如何进一步提升基于Pillar的3D目标检测性能?
写在前面 && 笔者的个人理解 目前在自动驾驶领域中,一辆自驾汽车会配备多种传感器,如:激光雷达传感器采集点云数据、相机传感器采集图像数据等。由于激光雷达传感器可以更加准确的获取待检测物体的几何和位置信息,所以基于点云的感知算法模型在快速...
-
逆天!真实可控、可拓展,自动驾驶仿真平台LightSim上新
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
深度学习之目标检测中的常用算法
随着深度学习的不断发展,深度卷积神经网络在目标检测领域中的应用愈加广泛,现已被应用于农业、交通和医学等众多领域。 与基于特征的传统手工方法相比,基于深度学习的目标检测方法可以学习低级和高级图像特征,有更好的检测精度和泛化能力。 什么是目标检测? 目标检测...
-
用生物脑机制启发持续学习,让智能系统适者生存,清华朱军等团队研究登Nature子刊封面
在开放、高动态和演化环境中的学习能力是生物智能的核心要素之一,也是人类以及大多数动物在「适者生存」的自然选择过程中形成的重要优势。目前传统机器学习范式是在静态和封闭的数据集上学习到一个模型,并假设其应用环境和之前训练数据的属性相同,因而无法适应动态开放环...
-
人工智能有能力彻底改变科学研究
人工智能(AI 是一门涉及计算机科学、数学、心理学、语言学等多个学科的交叉学科,它旨在创造能够模拟或超越人类智能的系统和应用。AI的发展经历了几个阶段,从早期的符号主义、联结主义,到近年来的统计学习、深度学习等,不断地突破了理论和技术的限制,实现了许多令...
-
人工智能教程(四):概率论入门
在本系列的 上一篇文章 中,我们进一步讨论了矩阵和线性代数,并学习了用 JupyterLab 来运行 Python 代码。我们也会简要介绍一些其它有用的库。稍后,我们将讨论概率、理论以及代码。和往常一样,我们先讨论一些能拓宽我们对人工智能的理解的话题...
-
AIGC参数量节节攀升,对存储带来的挑战如何解决?
引言 近期,AIGC 相关产品如同雨后春笋一般不断涌现。但在技术层面,大家普遍的关注点更多集中在性能方面,却经常忽略了存储对推理和训练效率的影响,以及 AIGC 内容可能带来的合规风险。我们特邀腾讯云存储的产品负责人 崔剑老师和益企研究院创始人、腾讯云 ...
-
AIGC/ChatGPT这么火,相关的AI产品岗,真的有变多吗?_最新AI产品经理求职动态(28)...
最近咱们社群的“AI产品经理求职季”活动里,有些特别的发现和感触,近期求职的AI产品经理或AI企业需求方,值得看看—— 目录 一、最近AIGC/ChatGPT这么火,相关的AI产品岗,真的有变多吗? 二、还有哪些方向的招聘需求,相...
-
尊嘟假嘟?2023年人工智能行业新诞生10家独角兽,AIGC竟占近一半
今年的 AIGC 持续热了一年,从王慧文等大佬的入局,到百度发布「文心一言」,各大巨头纷纷发布大模型产品,切实地给中国人工智能赛道的融资添了一把浓烈的火。 回顾这即将过去的一整年,虽然 2023 年投融资整体行业遇冷,各种坏消息不断,但总体而言,AI 行...
-
AIGC|AGI究竟是什么?为什么大家都在争先入场?
一、AI大语言模型进入爆发阶段 2022年12月ChatGPT突然爆火,原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式,但是它的内容化水平非常强大,甚至在某些方面已经超过人类了,这是人工智能...
-
下一代自动驾驶系统,少不了大模型,系统调研来了
随着大语言模型 (LLM 和视觉基础模型 (VFM 的出现,受益于大模型的多模态人工智能系统有潜力像人类一样全面感知现实世界、做出决策。在最近几个月里,LLM 已经在自动驾驶研究中引起了广泛关注。尽管 LLM 具有巨大潜力,但其在驾驶系统中的关键挑战...
-
真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了
最近,来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。L...
-
QTNet:最新时序融合新方案!点云、图像、多模态检测器全适用(NeurIPS 2023)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解 时序融合能够有效提升自动驾驶3D目标检测的感知能力,然而目前的时序融合方法由于成本开销等问题难以在实际自动驾驶场景中应用。NeurIPS 2023的最新研究文章 《Qu...
-
六大赛道十项技术:智能体、3D生成引爆AI,空间计算开启终端变革
两千年前的古人穿越到一千年前后,需要适应的东西可能不多。而一千前的古人穿越到一百年前,变化也不至于大到难以适应。但如果一百年前的古人穿越到现在,甚至只是有人“冬眠”10年、20年,面对的现实世界的变化,恐怕会是天翻地覆。日新月异的技术进步,正不断带来颠覆...
-
AI网络比以前想象的更容易受到攻击
人工智能 (AI) 工具有望应用于从自动驾驶汽车到医学图像解释等各种应用。然而,美国北卡罗来纳州立大学研究人员的一项研究发现,这些AI工具比以前认为的更容易受到有针对性的攻击,这些攻击有效地迫使AI系统做出错误的决定。 所谓的“对抗性攻击”是指有人操纵...
-
你的工厂需要部署边缘AI吗?
随着更多的制造企业希望利用人工智能(AI 工具访问数据并实时响应,预计将不断推动边缘AI市场的增长。通过采用边缘AI技术,企业可以获得更高的性能,如实时数据处理、效率和准确性,减少工作时间,并实现更好的能源管理和性能优化。 边缘AI市场预计将迎来强劲增...
-
AIGC快速入门体验之虚拟对象
AIGC快速入门体验之虚拟对象 一、什么是AIGC 二、AIGC应用场景 2.1 代码生成 2.2 图片生成 2.3 对象生成 三、AIGC虚拟对象 3.1 AIGC完全免费工具 3.2 快速获取对象 3.3 给对象取名 3.4 为对象写...
-
欧盟人工智能法案批准规则
欧盟人工智能法案(AI Act)朝着成为法律迈出了一大步,政策制定者成功地为这项具有里程碑意义的法规制定了规则。人工智能法案在成为法律之前仍需要议会和欧洲理事会的投票,之后它将在12至24个月内生效。 《人工智能法案》(AI Act)自2018年以来一...
-
创新技术彻底改变交通运输业
由于创新技术的出现,交通运输行业正在经历重大变革。这场技术革命正在彻底改变货物和人员的运输方式,重点是提高效率、安全性和可持续性。自动驾驶汽车是交通运输行业主要的改变游戏规则的技术之一。这些车辆依靠人工智能和传感器系统进行自我导航和驾驶,减少人为错误并...
-
首次超过70% mAP!GeMap:局部高精地图SOTA再次刷新
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性...
-
RayDF:实时渲染!基于射线的三维重建新方法
本文经自动驾驶之心公众号授权转载,转载请联系出处。 图片 论文链接:https://arxiv.org/pdf/2310.19629 代码链接:https://github.com/vLAR-group/RayDF 主页:https://vlar-gro...
-
面对AI灭世主义:智能并非全部
AI灭世主义者早就迷失在一种伪装成贝叶斯分析的宗教当中。这是Oxide公司CTO在接受TNS采访时说的。 图片 译自Bryan Cantrill on AI Doomerism: Intelligence Is Not Enough,作者 David C...
-
研究人员薪酬最高的13家人工智能公司:OpenAI居首
人工智能显然是目前最热门的行业。在 OpenAI 或 DeepMind 等世界顶级人工智能公司工作是很多人梦寐以求的事情。但你有没有想过,在这些公司工作的年薪有会是多少呢?? Rora公布了薪资协商报告,给出了各家AI公司给其研究人员的薪资情况。以下是13...
-
2024年云和人工智能未来趋势
当我们站在新技术时代的风口浪尖时,云计算和人工智能(AI 的融合必将深刻重塑行业。 2023年:技术进步的一年 在未来的一年里,我们预计在技术创新的推动下,各行业将取得重大进展。在超低延迟的推动下,边缘计算有望卷土重来,彻底改变实时数据处理。这种复苏将...
-
现代仓储正在为第五次工业革命让路
作为一个整体,世界正在看到技术的进步和越来越多的接受。仓储也不例外。随着现代仓储实践融入创新技术,该行业正在向第五次工业革命过渡。自动化、新兴趋势和变革性技术的进步正在导致人类与技术或机器之间的协作最大化。 例如,人工智能(AI 和机器人技术等技术的集...
-
纸质二维码也能隔空篡改:百米之外无痕攻击,秒变恶意网站入口
现在,打印好的纸质二维码,可能也不安全了! 通过激光照射,攻击者在一百米开外就能分分钟实施篡改。 更可怕的是,这种激光用肉眼根本无法察觉,正常的二维码在无意之间就有可能变成恶意网站的入口。 最近,日本东海大学的研究人员开发出一种远距离、超隐蔽的二维码篡...
-
现代技术能解决供应链危机吗?
通过利用先进技术,企业可以更好地了解和控制其供应链。 物联网、人工智能(AI 、区块链和数据分析可以帮助解决当前的供应链危机。 作为消费者,我们并不经常看到“无形”的供应链——所有人和移动部件背后的简单动作,点击购买产品,并能在家门口找到。然而,健康的...
-
把检测器加进来,YOLOv8部署实战!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0 把检测器加进来 本文是我在学习韩博《CUDA与TensorRT部署实战课程》第六章的课程部分输出的个人学习笔记,欢迎大家一起讨论学习! 1 导出onnx需要注意的地方 不要pip instal...
-
人均6万美元:2024英伟达奖学金名单公布,五位华人入选
本周五,备受期待的英伟达奖学金公布了入选者名单。 二十多年来,英伟达研究生奖学金计划(NVIDIA Graduate Fellowship Program)一直为研究生提供与英伟达技术相关的杰出工作支持。英伟达迄今为止已向近 200 名学生提供了 600...
-
自动驾驶大模型论文调研与简述
最近关于大模型(LLMs, VLM 与自动驾驶相关文献调研与汇总: 适合用于什么任务?答:目前基本上场景理解、轨迹预测、行为决策、运动规划、端到端控制都有在做。 大家都怎么做的? 对于规控任务,LLM型基本是调用+Prompt设计,集中在输入和输出设计...
-
【AIGC实习急招!】联想数字化转型 GenAI 实习生
题解 | #字符串最后一个单词的长度# #include <iostream>#include <string>#include <algorithm>using 题解 | 利用with as拆解题目 ---...
-
AIGC 汇总
人工智能给我们的生活带来了巨大的影响!它像魔术师一样,帮我们解决问题、提供建议,甚至预测未来。从智能手机到智能家居,人工智能让我们的生活变得更便捷、更智能。它是我们生活中的得力助手,让我们感受到科技的魅力! 人工智能的领域 人工智能应用领域包括智...