-
让AI更懂物理世界,人大北邮上海AI Lab等提出多模态分割新方法
让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了! 来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下...
-
AI搜索是否能引领信息检索的创新与变革
引言 2024年,人工智能(AI)时代正以前所未有的速度发展。例如,OpenAI推出的Sora模型能够根据文本描述生成视频,震惊了业界;卡内基梅隆大学研究人员发布的基准测试大大提升了大模型在Web上的性能。这些技术创新和突破展示了AI在...
-
最强终端部署的多模态MiniCPM-V模型部署分享(不看后悔)
MiniCPM-V模型是一个强大的端侧多模态大语言模型,专为高效的终端部署而设计。 目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型:该模型系列第一个版本...
-
轨迹优化 | 基于ESDF的共轭梯度优化算法(附ROS C++/Python仿真)
目录 0 专栏介绍 1 数值优化:共轭梯度法 2 基于共轭梯度法的轨迹优化 2.1 障碍约束函数 2.2 曲率约束函数 2.3 平滑约束函数 3 算法仿真 3.1 ROS C++...
-
AI日报:地表最强AI程序员Genie横空出世;SD变现宝来了!ComfyUI工作流秒变小程序;百度AI问答登7月榜首;AI自动化视频剪辑神器Clapper
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、号称全球最强AI程序员 “Ge...
-
“日日新大模型”亮相奥运会,商汤科技AI应用成色几何?
AI技术对于商业模式未通的商汤科技而言,此番奔赴奥运赛场,或许只是追追热点、提升品牌知名度,而其应用场景落地与商业化进程,恐怕不会带来实质性的改变。 AI黑科技加持的2024年巴黎奥运会,浪漫而时髦。各大模型厂商,也在趁着热点,在赛场内外秀肌肉、疯狂内卷。...
-
买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100
【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi,AI团队将「加倍投入」Dojo。 为了训出最强Grok3,xAI耗时19天,打造了由10万块H100组成的...
-
AI重新定义汽车,“蔚小理”抢先交卷
近日,智能驾驶行业的军备竞赛似乎开始全面提速。小鹏汽车正式向全球用户发布AI天玑系统XOS5.2.0版本,这是全球唯二实现端到端大模型量产落地的车企。 抓紧时间交卷的还有理想和蔚来,理想首次公开了其端到端自动驾驶技术架构;蔚来智能驾驶技术架构 NADArc...
-
Meta 发布 LLAMA 3.1;特斯拉无人出租车推迟至 10 月;谷歌将向 Waymo 再投 50 亿美元
Meta 发布 LLAMA 3.1 开源人工智能模型 北京时间 7 月 24 日,Meta 正式发布 Llama 3.1 开源大语言模型,提供 8B、70B 及 405B 参数版本。据介绍,Llama 3.1 系列改进了推理能力及多语言支持,上下文长度提...
-
AI+视频娱乐平台大盘点,谁会成为下一个“Netflix”
故事,是对现实的剖析和重构。讲好一个故事,需要创造性地把素材组织起来。在 AI 时代,一个好的故事又将如何被呈现出来呢? 今年,是视频生成类产品爆发式增长的一年。在AI生成的视频中,我们看到创作者在用一种新的方式讲述着自己的故事。 同样,AI 视频内容...
-
基于LORA的Stable Diffusion模型在增强学习中的应用
基于LORA的Stable Diffusion模型在增强学习中的应用 @[toc](基于LORA的Stable Diffusion模型在增强学习中的应用 引言:探索未知的AI前沿 揭秘LORA:轻量化的力量 Stable Diff...
-
何小鹏:结合端到端技术和大模型最终将实现L4级别自动驾驶
小鹏汽车董事长何小鹏近日在社交媒体上发表了对特斯拉最新版全自动驾驶系统(FSD)和自动驾驶出租车(Robotaxi 的看法。 何小鹏表示,特斯拉今年的FSD系统与过去相比在技术上有了显著提升,他对这一进步表示赞赏。他还提到,他最近与多位L4自动驾驶项目的负...
-
专访诺奖得主:大模型是记忆还是理解?
物理学家理查德·费曼曾将自然世界比作众神的游戏,比如国际象棋——我们不知道游戏规则,但却可以观察棋盘,也许只是其中的一角,然后根据这些观察,试图找出游戏规则。 费曼的比喻,道出了科学研究的核心,也生动描绘了许多经济学家的工作,他们同样致力于从纷繁复杂的经济...
-
GPT-4o mini背后团队揭秘:9人团华人面孔过半,清华北大同济校友在列
“大模型尺寸之争正在加速……倒退!” OpenAI的GPT-4o mini一登场,又登上了大模型话题榜榜首。 并且这次话题焦点,是OpenAI不仅再树新标杆,还一出手就把性价比卷爆了——直接把此前大受开发者好评的Gemini1.5Flash和Claude3...
-
AIGC技术:发展、应用与前景
目录 前言 1 AIGC技术的发展现状 1.1 算法进步 1.2 硬件支持 1.3 数据驱动 2 AIGC技术的应用情况 2.1 医疗保健领域 2.2 金融和商业领域 2.3 智能交通领域 2.4 教育和培训领域 3 AIGC技术的未来...
-
AI日报:阿里云发布音频模型Qwen2-Audio;字节将推类sora模型;AI眼里13.11>13.8
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Qwen2-Audio:千问系...
-
【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比
InternVL和GPT-4V都是多模态模型,但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型,其参数量为60亿,覆盖了图像/视频分类、检索等关键任务,并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...
-
OpenAI首次提出AGI的5个等级,我们接近第2级
彭博消息,OpenAI在最近一次内部会议上,向员工们分享了关于AGI(通用人工智能)的5个等级划分,并表示我们目前处于第1等级,非常接近第2级。 在这次会议上一位OpenAI的领导,展示了最新研究,可以明显提升推理能力达到甚至超越人类的水平。 而根据7月1...
-
2024最新的AIGC的应用领域有哪些?
2023大型语言模型-aigc-LLM-engineering实例代码合集.zip 2023大模型与AIGC峰会(公开)PPT汇总(25份).zip 内容创作: AI写作:AIGC技术可以用于生成文章、新闻、博客、广告文案、创意写作等,为内容创作...
-
Sora AIGC 介绍
Sora的概念介绍: 近年来,AI、大模型相关领域的发展可谓是一天一个脚印,一步一个台阶。从语音识别文字开始,再到chatgpt3、chatgpt4文字互动工具,以及midjourney等AI成图工具,再到现在的vison pro等VR交互设备和今天我们...
-
中国首个AI厨王诞生,苦练7吨菜通过「图灵测试」!网友:机器人都比我会做饭
最近,一位AI炒菜机器人不仅向人类大厨发起了PK,而且还通过了「图灵测试」:根本吃不出来是AI机器人炒的!而在这背后,竟然是1.5个亿的投入和近7吨菜的训练。 你敢相信么?机器人,正式和湘菜大厨「叫板」了! 最近,这位名叫「美膳狮」的AI炒菜机器人,向湘菜...
-
国内首批!华为云盘古汽车大模型通过可信AI汽车大模型评估
快科技7月11日消息,近日在信通院组织的可信AI汽车大模型首轮评估中,华为云盘古汽车大模型顺利完成了评估,获得4 级证书,成为国内首批通过该项评估并获得当前最高评级的行业大模型。 据悉,华为云盘古汽车大模型在2023年的全联接大会首次发布,覆盖了汽车设计、...
-
国产大模型 WAIC 竞技:大厂拼落地,中厂显焦虑
如果想要度量国产大模型大小厂商的实力,WAIC(世界人工智能大会)是一个不错的切口。 众所周知,2023年是国产大模型元年,在去年的 WAIC 之后,腾讯发布混元大模型,字节跳动上线豆包 APP,而后通过豆包大模型正式开启对外服务,年轻的月之暗面、Mini...
-
卧槽!搜索引擎还能这么设计?!阿里「疯」投所图不小;中国AIGC该去向何方;谷歌病在腠理还有救吗;瓶装水与AI创业破局 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 激进的阿里战投:智谱、百川、MiniMax、月之暗面、零一万物,我全都要!! 3月5日消息,据彭博社今日报道,阿里巴巴正作为领投方参与中国AI大模型创...
-
AIGC发展方向和前景
引言 背景介绍 AIGC的定义及其发展历程 AIGC,即人工智能生成内容,是近年来在人工智能领域兴起的一项重要技术。它通过使用机器学习和深度学习等技术,使得计算机能够自动生成各种形式的数字内容,如文本、图像、音频和视频等。 AIGC的发展可以...
-
AI苦工卷向高学历,美国博士正在抢走印度人工作
美国人马特拥有通信博士学位,他最近喜提一份自由职业:成为Scale AI公司的一员,在家训练AI模型。 “通信博士”“训练AI模型”,马特是不是成了一名光荣的AI程序员?事实并非如此。马特的工作很无聊:他在Scale AI的系统中“接活”,以用户的角度浏览...
-
嵌入式期末复习--补充(答案来自文心一言)
一、第一章 1、常见的RTOS,嵌入式操作系统的特点 RTOS就是实时操作系统。根据响应时间的不同,可分为以下3类: (1)强实时嵌入式操作系统 响应时间:微妙或毫秒 (2)一般实时嵌入式操作系统 响应时间:毫秒...
-
普通人当前可以入局AIGC行业吗
文章目录 一、行业前景 1.人工智能 2.大数据 3.物联网 4.云计算 二、职业选择 1.引言 2.职业选择 (1)机器学习工程师 (2)云计算专家 (3)数据工程师 (4)人工智能产品经理 一、行业前景 AI...
-
中国杀出全球首个烹饪大模型
什么?烹饪也有大模型?! 没有听错,这就是国产厨电龙头老板电器最新发布——“食神”大模型。 数十亿级行业数据,数千万级知识图谱加持,据称还是全球首个。 它能为每个人提供个性化量身定制的解决方案,不仅告诉用户怎么做菜,还能调动所有设备,协助你把菜做出来。...
-
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
快科技6月21日消息,在今日召开的华为开发者大会(HDC 2024 上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。 华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和...
-
Kimi创始人套现4000万美元疑云|「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局|中国AI活化石,熬成AIGC第一股| 谁在制造小米汽车?
Kimi创始人套现4000万美元疑云 「商汤」大模型一体机可节约80%推理成本,完成云端边全栈布局 苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相 特斯拉的反围剿战术还剩下啥? 腾讯出手,投了家创新药公司 谁在制造小米汽车? 估值...
-
生成式AI爆发时代,决策式AI“不香了”?
2022年12月,ChatGPT3.5的发布引发了全球范围内对大模型的广泛关注,2023年2月国内高校率先发布产品,2023年6月开始国内涌现出众多的通用大模型和垂类大模型,目前国内大模型产业呈现出“百模大战”的竞争格局。 大模型热引发了全球范围内对生成式...
-
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge:基于大模型边云协同的机器人语义分割算法》,作者:云容器大未来。 近年来快速发展的视觉大模型(例如 SAM 在促进高精度的智能感知方面具有很大的潜力。然而,边缘环境中的资源限制往往会限制这种视觉大模型在本地部署,从...
-
AI日报:美图发布AI视频神器MOKI;OpenAI靠ChatGPT半年赚34亿美元;斯坦福开发对口型视频模型PROTEUS
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、美图发布王炸产品MOKI 可一...
-
送懂车帝“出嫁”,张一鸣豪赌AI
上线七年后,身为国内三大汽车资讯平台之一的懂车帝,距离启动IPO(首次公开募股)又近了一步。 近日有媒体报道称,字节正在为旗下业务懂车帝寻求融资,希望募集7亿~8亿美元,并为上市做准备。本轮融资,懂车帝估值可达30亿美元。 这是懂车帝首次传出融资消息。上述...
-
对国内AI算力紧缺问题的若干看法
今天凌晨的苹果WWDC证实了一点:AI推理算力将长期处于“云端为主”的状态,这个“长期”至少是三到五年。是的,苹果与OpenAI建立了战略合作,计划将下一代iOS系统与ChatGPT深度融合;但是绝大部分生成式AI推理,包括文字和图片生成任务,仍将上传到C...
-
AIGC技术的发展与前景
如何看待AIGC技术? 方向一:技术应用 人工智能生成对抗网络(AIGC)技术在各个领域都有广泛的应用,其影响和潜力逐渐显现。以下是一些领域和应用案例: 1. **医疗保健**: - **医学影像诊断**:AIGC可以帮助医生...
-
Thoughtworks肖然:大模型走向大众,需要新的应用开发逻辑
嘉宾 | 肖然 采访 & 撰稿 | 云昭 出品 | 51CTO技术栈(微信号:blog51cto) 新年伊始,AI大佬们频繁被问及一个话题:“什么时候有杀手级AI应用”。几个月过去,诸如AI Pin、Rabbit R1、Devin等AI产品一闪...
-
迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的文本提示为输入,利用多模态大语言模型的多...
-
报道称,马斯克将数千个AI芯片从特斯拉转移到了X
根据CNBC获得的芯片制造商的电子邮件,埃隆·马斯克(Elon Musk)订购了数千个运往特斯拉的英伟达制造的AI芯片,这些芯片将被转移到他的社交媒体公司X。据该媒体报道,此举有可能将特斯拉收购价值5亿美元的处理器的时间推迟数月。 图源备注:图片由AI生...
-
黄仁勋:下一波浪潮是物理AI 将进入全新机器人时代
站长之家(ChinaZ.com)6月5日 消息:在最近的一次演讲中,英伟达公司的CEO黄仁勋描绘了一个引人注目的未来愿景——物理AI,这一新的技术浪潮正在悄然改变我们的世界。他提出,物理AI,或称为实体AI,是指那些能够模拟智能生物体在控制、形态、动作执行...
-
AI信任问题:你需要知道的事情
随着AI在我们的日常生活和商业运营中的快速发展和整合,AI信任已经成为人类体验和体验经济运行中更加关键的元素。AI技术具有提高效率、个性化体验和管理复杂任务的能力。 然而,它们也带来了挑战,特别是在维护和促进信任方面。 AI对系统的信任 AI系统正越来...
-
理解老司机,超越老司机!LeapAD:具身智能加持下的双过程自驾系统(上海AI Lab等)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文信息 论文题目:Continuously Learning, Adapting, and, Improving: A Dual-Process Approach to Autonomous Dr...
-
港科大最新!Vista:一种具有高保真度和多功能可控的世界模型
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability 论文链接...
-
【AIGC调研系列】MiniCPM-Llama3-V2.5模型与GPT-4V对比
MiniCPM-Llama3-V2.5模型与GPT-4V的对比可以从多个方面进行分析,包括性能、应用场景和技术特点。 从性能角度来看,MiniCPM-Llama3-V2.5在OCR识别、模型幻觉能力和空间理解能力方面表现出色,实现了开源模型的性能SOTA...
-
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在 Transformer 大一统的时代,计算机视觉的 CNN 方向还有研究的必要吗? 今年年初,OpenAI 视频大模型 Sora 带火了 Vision Transformer(ViT)架构。此后,关于 ViT 与传统卷积神经网络(CNN)谁更厉害的争...
-
武汉市民点赞无人驾驶,市交通运输局:与头部企业共创智能网联汽车产业新蓝图
“武汉市注重智能网联汽车产业发展,已陆续开放智能网联汽车开放道路超千公里,鼓励智能网联汽车头部企业入驻武汉,携手共创武汉智能网联汽车产业发展新蓝图。百度萝卜快跑作为自动驾驶行业中的领军企业,重视武汉智能网联汽车产业发展,从2022年8月落户武汉经开区以来...
-
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
在开放世界中,智能系统不仅要处理庞大的数据量,还需要应对各种「长尾问题」,如自动驾驶中面临的突发危险、出入隧道的剧烈光线变化、夜间强闪光干扰等。在这类任务上,传统视觉感知芯片由于受到「功耗墙」和「带宽墙」的限制,往往面临失真、失效或高延迟的问题,严重影响...
-
AI大牛karpathy点赞SEAL榜单,LLM评估的状况过去是非常糟糕的!
lmsys.org的一个严肃的竞争对手已经加入了对LLMs(大型语言模型)评估的讨论中:SEAL Leaderboards——对领先前沿模型进行的私密、专家评估。 SEAL Leaderboards的设计原则: ?私密 + 无法被利用。在评估上不会过度拟...
-
比PID更丝滑的控制算法&卡内基梅隆大学
本文经自动驾驶之心公众号授权转载,转载请联系出处。 MPC控制算法,全称Model Predictive Control(模型预测控制),是一种基于系统动态模型的控制技术。它的工作原理是通过数学模型预测系统的未来行为,并基于这些预测结果来优化系统的控制...