-
LightGBM实战+随机搜索调参:准确率96.67%
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...
-
Neuralink劲敌破纪录,4096个电极微创植入人脑!脑机接口有望进入「5G」时代
提到脑机接口,你第一时间想到的肯定是Elon Musk创建的公司Neuralink,他们在今年1月刚刚将首个芯片植入人脑。 但Neuralink绝不是唯一发力脑机接口的公司。 5月28日,Precision Neuroscience发布公告,他们成功在人...
-
MonoDETRNext:下一代准确高效的单目3D检测方法!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 基于单目视觉的3D目标检测在各个领域都至关重要,但现有方法在准确性和计算效率方面面临着重大挑战。在2D检测和深度估计的成功策略的基础上,本文提出了MonoDETRNe...
-
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响...
-
LightGBM算法背景、原理、特点+Python实战案例
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...
-
用于精确目标检测的多网格冗余边界框标注
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 一、前言 现在领先的目标检测器是从基于深度CNN的主干分类器网络重新调整用途的两级或单级网络。YOLOv3就是这样一种众所周知的最先进的单级检测器,它接收输入图像并将其划分为大小相等的网格矩阵。具...
-
目标检测新SOTA,端侧实时识别,沈向洋罕见转发点赞
目标检测领域,迎来了新进展—— Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。 这一进展获得AI大佬沈向洋转发,他一般都是一年一转的节奏。 此次发布主要有两个版本:Pro和Edge。Pro版更强,Edge版更快。...
-
走进采集器:技术革新的数据收集利器
在当今信息化时代,数据正变得越来越重要,成为了各个行业发展的关键因素。而采集器,作为数据收集的利器,近年来在技术革新的推动下,已逐渐走入了人们的视线,并且扮演着越来越重要的角色。本文将对采集器进行全方位的探讨,从定义、技术原理到应用领域,带领读者一起走进采...
-
自动驾驶第一性之纯视觉静态重建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如...
-
高德将落地首个时空智能城市:开放云睿大模型
快科技5月20日消息,据媒体报道,高德地图旗下高德云图宣布将逐步开放云睿时空融合大模型和云境AI三维重建平台,打造时空智能体应用生态。 据悉,高德云睿时空大模型是业界首个以地图点、线、面、体等时空类数据为训练基础的大模型。它能够融合交通、零售等多行业的时空...
-
AI新动能: 数字人三大特征八大场景
随着元宇宙概念的火爆也一同带动了数字人市场的快速升温,据计算全球平均每天都会诞生一个数字人。数字人正成为一股潮流,涌入人们的日常生活——会“捉妖”的虚拟美妆达人柳夜熙,抖音出道三天点赞即超百万,一夜之间成为国内虚拟偶像界的“顶流”;在江苏卫视跨年演唱会上...
-
大模型卷爆数字人:一句话5分钟实现定制,跳舞主持带货都能hold住
最快5分钟,打造一个直接上岗工作的3D数字人。 这是大模型给数字人领域带来的最新震撼。 就像这样,一句话描述需求: 生成的数字人直接就能进驻直播间当主播。 跳起女团舞也不在话下。 整个制作过程中,想到什么说什么就行,大模型都能自动拆解需求,瞬间get...
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是当今深度学习模型的基础构建块。MLP 的重要性无论怎样强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。...
-
Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 多传感器与3DGS的结合 NeRF-based SLAM的隐式神经表示法需要基于3D空间中的采样进行计算密集型的体积渲染,从而削弱了SLAM应用所必需的实时能力。3DGS以其快速的渲染速度和优越的视觉...
-
Llama 3低比特量化性能下降显著!全面评估结果来了 | 港大&北航&ETH
大模型力大砖飞,让LLaMA3演绎出了新高度: 超15T Token数据上的超大规模预训练,既实现了令人印象深刻的性能提升,也因远超Chinchilla推荐量再次引爆开源社区讨论。 与此同时,在实际应用层面上,另一个热点话题也浮出水面: 资源有限场景下...
-
量化、剪枝、蒸馏,这些大模型黑话到底说了些啥?
量化、剪枝、蒸馏,如果你经常关注大语言模型,一定会看到这几个词,单看这几个字,我们很难理解它们都干了些什么,但是这几个词对于现阶段的大语言模型发展特别重要。这篇文章就带大家来认识认识它们,理解其中的原理。 模型压缩 量化、剪枝、蒸馏,其实是通用的神经网络...
-
AI日报:Model3模型重磅发布;阿里云全面支持Llama 3训练推理;Gorq推出iOS应用;批量去水印工具VSR来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Blockade Labs发布...
-
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管神经辐射场(NeRFs)在图像新视角合成(NVS)方面取得了成功,但激光雷达NVS的发展却相对缓慢。之前的方法follow图像的pipeline,但忽略了激光雷达...
-
效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标注之殇 静态物体检测(Static object detection,SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本...
-
大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA
大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。 来自蒙纳士大学、蚂蚁、IBM研究院提出了一种通用框架,结果成功激活大语言模型跨模态处理时序数据的能力。 时序预测有益于城市、能源、交通、遥感等典型复杂系统的决策...
-
Redmi Turbo 3搭载冰封散热系统:支持AI智能温控
快科技4月10日消息,Redmi Turbo 3今晚正式登场,新机对散热系统进行了全方位升级,性能释放无压力。 据介绍,Redmi Turbo 3搭载旗舰级散热技术循环冷泵,相比于传统VC均热板,采用气液分离设计,形成顺畅单向循环,可以大幅提高热扩散速度,...
-
华人开源最强「AI 程序员」炸场,让 GPT-4 自己修 Bug!
自从“AI 程序员”Devin问世之后,近期的一大趋势就是程序员们争先恐后地要让自己失业,试图抢先造出比自己更强大的程序员。 普林斯顿大学为软件工程界迎来了一位新星——SWE-agent,论文将在4月10日正式发布,目前项目已在 GitHub 上开源。...
-
基于FPGA的数据采集、编码、通讯和存储系统设计(即FPGA+RTL8211千兆以太网+SD卡存储+RTC+Uart+AD7606数模转换+电流放大采集等硬件设计及程序验证)
介绍一下学生期间自己做的一个小项目,可以用于FPGA相关接口的整体把握。 下面对硬件及软件代码进行简单梳理: 首先,介绍一下硬件系统的主要功能框图。其中FPGA作为处理单元,实现了包括电流和电压的采集、千兆以太网通讯、SD卡本地数据存储和串口通讯等。已经...
-
让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT
目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练...
-
AI绘画工具有哪些
今天我们来聊聊AI绘画工具。随着科技的不断进步,越来越多的AI绘画工具出现在我们的生活中,为我们带来了很多方便。那么,这些工具到底有哪些呢? 首先,我们有“淘宝造物节”上大热的“AI画手”工具。这个工具可以通过AI技术将用户画的简笔画自动转化成高精度的线...
-
腾讯机器人研究登顶刊!能帮程序员安显示器,像真人一样协同干活
国产机器人新突破: 两只各自独立的机械臂,已经可以丝滑地打配合了! 不信你看这双手拧瓶盖: 拧完再端起杯子倒水: 活灵活现,如真人。 呐,还能搭把手帮程序员安装好显示屏: 甚至接过“同事”手里的大箱子: 可以说是各种几何和物理特性的物体都能稳稳h...
-
突破性的百万级视频和语言世界模型:Large World Model~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 在探索如何让AI更好地理解世界方面,最近的一项突破性研究引起了广泛关注。来自加州大学伯克利分校的研究团队发布了“Large World Model, LWM”,能够同时处理百万级长度的视频和语言序列,...
-
GPT-4「荣升」AI顶会同行评审专家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%评审是ChatGPT生成
LLM在飞速进步的同时,人类也越来越难以区分LLM生成的文本与人工编写的内容,甚至分辨能力与随机器不相上下。 这加大了未经证实的生成文本可以伪装成权威、基于证据的写作的风险。 尽管在个例上难以察觉,但由于LLM的输出趋于一致性,这种趋势可能会放大语料库级...
-
讨论下一个token预测时,我们可能正在走进陷阱
自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后,这一概念逐渐成为现代语言模型的核心部分。最近,围绕下一个 token 预测的讨论日趋激烈。 然而,越来越多的人认为,以下一个 token 的预测为目标只能得到一个优秀的「即兴表演艺...
-
零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步
物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。 在这一领域中,最先受到关注的任务是实例级别 6D 姿态估计,其需要关于目标物体的带标注数据进行模型训练,使深度模型具有物体特定性,无法迁移应用到新物体上。后来...
-
相机与激光雷达是怎么标定的?一览行业所有主流的标定工具
本文经自动驾驶之心公众号授权转载,转载请联系出处。 相机与激光雷达的标定是很多任务的基础工作,标定精度决定了下游方案融合的上限,因为许多自动驾驶与机器人公司投入了较大的人力物力不断提升,今天也为大家盘点下常见的Camera-Lidar标定工具箱,建议收...
-
DECO: 纯卷积Query-Based检测器超越DETR!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 标题:DECO: Query-Based End-to-End Object Detection with ConvNets 论文:https://arxiv.org/pdf/2312.13735...
-
与Sora同架构的Stable Diffusion 3.0 震撼发布
Stability AI 发布了 Stable Diffusion 3,这款图像生成 AI 模型再次刷新了人们的认知。 这款由 Stability AI 倾力打造的文本变图模型,可是迄今为止最强大的“黑科技”!无论你想生成多主题的奇幻场景,还是高精度的风...
-
人工智能对抗人工智能:利用人工智能来检测深度造假和网络钓鱼
译者 | 涂承烨 审校 | 重楼 在当今的数字时代,深度造假技术和语音网络钓鱼策略的激增,给数字通信的真实性和安全性带来了重大挑战。深度造假者操纵音频和视频,创造出令人信服的假冒内容,而深度造假者则利用语音模拟来欺骗个人,以泄露敏感信息。准确识别和减轻这...
-
美图AI视觉创作工具上新,涂抹+关键词,变废为宝!
整理 | 星璇 出品 | 51CTO技术栈(微信号:blog51cto) 近日,美图公司旗下 AI 视觉创作工具 WHEE 推出了 AI 改图功能,这项功能大幅降低了专业图像编辑的门槛,使普通用户也能享受到 AI 创作的乐趣。 简单几步,用户就能...
-
让大模型“瘦身”90%!清华&哈工大提出极限压缩方案:1bit量化,能力同时保留83%
对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。 不过,这个极限究竟有多大? 清华大学和哈工大的一项联合研究给出的答案是: 90%。 他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力...
-
“羊驼“入侵CV,美团&浙大沈春华团队将LLaMA向CV扩展,构建全新基础模型VisionLLaMA
本文首发:AIWalker https://arxiv.org/abs/2403.00522 https://github.com/Meituan-AutoML/VisionLLaMA 本文概述 大型语言模型构建在基于Transf...
-
ADMap:抗干扰在线高精地图新思路
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大家好,很开心能够受邀来到自动驾驶之心分享我们的在线重建矢量化高精度地图的抗扰动方法ADMap。我们的代码已经发布在https://github.com/hht199...
-
小红书博主吐槽自家猫被AI换脸 百万网友围观
近日,小红书博主“grapelu”称自己养的猫被AI换脸,引发了百万网友的关注。从对比图可以看出,AI生成的图像与真实图像存在许多相似之处,但也有一些不合理的局部细节,透露出浓浓的AI感。 在目前的法律体系中,肖像权通常是指保护个人形象不被未经授权地使用。...
-
Feifei采集的数据大观
由于“feifei采集”这个主题相对开放,没有明确的上下文,我将以假设的情境为基础,构建一个关于环境保护、数据采集与科技结合的故事,并尝试达到1500字的要求。请注意,以下内容纯属虚构。---### “菲菲采集”的绿色使命在一个快速发展的科技时代,数据成为...
-
MWC 2024丨生成式AIGC成为最大亮点—美格智能携手阿加犀推出多感知融合VSLAM解决方案
2024世界移动通信大会盛况空前,AI成为最大亮点。2月28日,美格智能携手阿加犀,将算力模组的硬件优势与AI优化部署技术相结合,在MWC展会现场展示了基于高算力AI模组的多感知融合VSLAM解决方案。这一创新性方案可应用于智能机器人与低速无人驾驶场景,助...
-
清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!
自从大模型火爆出圈以后,人们对压缩大模型的愿望从未消减。这是因为,虽然大模型在很多方面表现出优秀的能力,但高昂的的部署代价极大提升了它的使用门槛。这种代价主要来自于空间占用和计算量。「模型量化」 通过把大模型的参数转化为低位宽的表示,进而节省空间占用。目...
-
清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持 83% 性能
近期,清华大学和哈尔滨工业大学联合发布了一篇论文,成功将大模型压缩到1bit,仍保持83% 的性能。这一成果标志着量化模型领域的一次重大突破。过去,2bit 以下的量化一直是研究人员难以逾越的障碍,而这次的1bit 量化尝试,引起了国内外学术界的广泛关注。...
-
机器人物联网是制造业的未来吗?
...
-
鱼眼相机与超声波传感器融合实现鸟瞰近场障碍物感知
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接:https://browse.arxiv.org/pdf/2402.00637.pdf 视频链接:https://youtu.be/JmSLBBL9Ruo 本文介绍了鱼眼相机与超声传...
-
YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址
YOLOv8是YOLO系列目标检测模型的最新版本。它能够在图像或视频中准确快速地识别和定位多个对象,并实时跟踪它们的移动。相比之前版本,YOLOv8在检测速度和精确度上都有很大提升,同时支持多种额外的计算机视觉任务,如实例分割、姿态估计等。YOLOv8可通...
-
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraf...
-
如何使用TensorFlow和Cleanvision检测大堡礁的海星威胁?
澳大利亚的大堡礁美不胜收,是全球最大的珊瑚礁,也是多种多样的海洋生物栖息的家园。不幸的是,珊瑚礁面临蚕食珊瑚的棘冠海星(COTS)的威胁。为了控制COTS爆发,珊瑚礁管理人员使用一种名为Manta Tow勘查的方法,将潜水员拖在船后,目测评估珊瑚礁的各...
-
ChatGPT论文:大语言模型LLM之战:Dolly、LLaMA 、Vicuna、Guanaco、Bard、ChatGPT--在自然语言转SQL(NL2SQL、Text-to-SQL)的比较(二)
3 评价结果 3.1 Spider 数据集 表 2 列出了各种提示策略和模型组合的执行准确性 (EX 和测试套件 (TS 的准确性。我们的主要发现是: 开源模型在 Spider 数据集上遇到了困难:尽管参数数量和模型性能之间存在正相关关系...
-
《GitHub Copilot 操作指南》课程介绍
第1节:GitHub Copilot 概述 一、什么是 GitHub Copilot 什么是 GitHub Copilot GitHub Copilot是GitHub与OpenAI合作开发的编程助手工具,利用机器学习模型生成代码建议。它集成在开发者...