-
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
快科技6月21日消息,在今日召开的华为开发者大会(HDC 2024 上,华为云发布了盘古大模型5.0,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。 华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和...
-
【数字人】AIGC技术引领数字人革命:从制作到应用到全景解析
AIGC技术引领虚拟数字人革命:从制作到应用的全景解析 一、AIGC技术为虚拟数字人注入智能灵魂 二、AIGC型虚拟人制作流程实例分析 1、采集数据 2、建模 3、内容生成 三、AIGC在虚拟数字人应用中的案例分析 四、总结与展望...
-
Runway正式发布全新Gen3模型,AI视频的王,它回来了。
在AI视频被一众新秀,比如Sora、Luma、可灵等等占据注意力的时候,已经有人忘了AI视频领域统治了N久的王者,他叫Runway。 去年的11月份更新了一次Gen2模型模型,然后宣布他们要开始组团队开始进军世界模型之后。 他们就再无动静了。 一晃眼,将...
-
Hinton为拒马斯克offer扯谎挂电话,警告AI取代人类比想象中快30年
Geoffrey Hinton老爷子——图灵奖得主、深度学习发明人、AI三巨头、Ilya之师,在最新专访中透露出这个令人心碎的消息。 就在这两天,Hinton接受了多家媒体的专访,既有老生常谈的内容,即他对AI发展安全的担忧;也有一些新的话题和八卦。 他提...
-
AI绘画Stable Diffusion SDXL 超赞!高质量万能大模型,写实人像、时尚设计、建筑设计、电影制作—筑梦工业XLV4.0
大家好,我是阿威 今天为大家带来了一款多功能大模型——Dream Tech XL | 筑梦工业XL V4.0。该模型是大佬Dr_Dream基于V3.0训练而来的迭代版本,在提升画面质感的同时,对于提示词理解能力有跨越式提升,可以做到100%还原提示词。...
-
机圈周报:华为鸿蒙HarmonyOS首超苹果iOS 苹果发布自家AI技术
机圈周报,盘点一周新机、配置曝光、机圈热闻,每周更新,欢迎关注。 本周手机圈最大的热点,莫过于苹果WWDC24带来的iOS 18更新,以及自家AI技术Apple Intelligence了,我们这周的机圈周报也会多花一点篇幅讲讲有意思的新功能、新玩法,快来...
-
聊聊各种“GC”:UGC、PGC、PUGC、OGC、MGC、BGC、AIGC有什么区别?
01. UGC UGC(User Generated Content ,指用户原创内容。 UGC的概念最早起源于互联网领域,即用户将自己原创的内容通过互联网平台进行展示。 内容生产的主体是非专业人士,即一般公众;内容的制作渠道是非专业化的;内容...
-
盘点GPT-4o十大创意玩法!挑水果、看牙片、全自动化炒股,看完格局瞬间打开
自从OpenAI发布GPT-4o以来,“头号AI玩家”每天的状态be like:新语音模式上线了吗? 是的,还没有,但应该快了。 不过,毕竟GPT-4o已经上线半个月多,虽然新语音模式迟迟未来,但这不影响网友们用它整活儿。本期,“头号AI玩家”全方位盘点...
-
存储器在工业应用中采用人工智能的关键作用
人工智能(AI 已经大规模地出现在人们的视野中,这项技术正在从数据中心扩散到广泛的分布式位置,这是由更强大的处理器和更创新的算法实现的。但其他技术也需要跟上步伐,否则就有可能成为瓶颈。 美光科技公司工业部门主管David Henderson在接受行业...
-
微软震撼发布Copilot+PC!真正意义上的AIPC时代已经到来!
5月20日,微软正式发布了 Copilot+ PC,这是全球首款专为 AI 设计的 Windows PC,也是 有史以来最快、最安全、功能最强大的 Windows PC Copilot+ PC 内置了 OpenAI 的 GPT-4o...
-
柒瑞赛事自动采集器:革新体育赛事数据采集与处理
在现代体育赛事中,数据的采集与处理已经成为不可或缺的一环。随着科技的进步,传统手动采集赛事数据的方式已经无法满足高效、准确的需求。在这一背景下,“柒瑞赛事自动采集器”应运而生,凭借其自动化、智能化的特点,为体育赛事行业带来了前所未有的变革。一、柒瑞赛事自动...
-
使用文心一言进行图像内容理解
接上篇文章,这期使用文心一言图像识别API,对本地图片以及在线视频图片进行内容理解。 该请求用于图像内容理解,支持输入图片和提问信息,可对输入图片进行理解,输出对图片的一句话描述,同时可针对图片内的主体/文字等进行检测与识别,支持返回图片内多主体/文字的...
-
百度文心大模型学习机“小度学习机Z30”发布
近日,百度旗下的小度科技正式推出了首款基于文心大模型的学习机Z30,已在京东平台全面开售。这款学习机以“重新定义AI老师”为核心理念,旨在通过先进的AI技术助力孩子主动学习,同时让家长享受全陪伴的超省心体验。其8GB RAM +256GB存储空间的版本售价...
-
全球首台生物计算机开放服务:16个人脑类器官,能耗节省百万倍
科幻小说《三体》中,为了支撑科技的发展,人类提出了几种下一代计算机的方案,其中除了传统的冯诺依曼架构,还包括量子计算机和生物计算机。其中量子计算的概念现在已有大量研究,生物计算的研究却少有报道。 近日,一家瑞士初创公司 FinalSpark 发布了全球首...
-
DiffMap:首个利用LDM来增强高精地图构建的网络
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文标题: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model 论文作者: Peijin Jia, Tuo...
-
惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发
这几天,在巴黎举办的最大科技活动VivaTech上,OpenAI再次带来了许多惊喜。 从展示的模型智能进化路线图中,可以确定的是,今年OpenAI一定会发布新一代旗舰模型。 而且,大概率不会以GPT-5命名,演示中将其称之为「GPT Next」。 那么...
-
moto X50 Ultra今天开启预售!搭载骁龙8gen3的AI旗舰来了!
今天,摩托罗拉旗下moto X50 Ultra手机正式开启预售。这款手机搭载了骁龙8gen3处理器,并提供12 256GB、12 512GB和16 1TB三种存储配置可选,售价分别为3999元、4299元和4699元。 moto X50 Ultra采用了金...
-
桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o demo再次惊艳:“能力还是被低估了”
GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。 现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。 在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马...
-
【GitHub】github学生认证,在vscode中使用copilot的教程
github学生认证并使用copilot教程 写在最前面 一.注册github账号 1.1、注册 1.2、完善你的profile 二、Github 学生认证 注意事项:不完善的说明 三、Copilot 四、在 Visual Studio C...
-
yolov部署到iPhone或终端实践全过程
本文经计算机视觉研究院公众号授权转载,转载请联系出处。 期待已久的检测经典又来来了一波强袭——yolov5。其实yolov5没有完整的文件,现在最重要的应该是把yolov4弄清楚,在目标检测领域中受益匪浅,可以在某些场景得到较高的提升。今天我们还是给大...
-
第一波收割完的 AI 创企要跑路了?6 年来仅做了一款产品,问世 30 天就彻底失败,Ai Pin 公司 10 亿美元求“卖身”
当地时间5月22日,据外媒报道,总部位于美国加州旧金山的可穿戴设备初创公司 Humane 正考虑接受收购。彭博社援引消息人士称,该公司的定价在7.5亿至10亿美元之间,出售过程正处于早期阶段。 1成立5年未公开过任何产品,拿着 PPT 融了10多亿元? 据...
-
AI 如何颠覆社交互动?两位 Snap 工程师做了这款表情包产品
“生成式 AI 技术正引领一场社交媒体自我表达的革命。从Remini的黏土滤镜到 Easel 的表情包,图像生成领域的创新产品不断涌现。生成式技术、社交媒体与自拍照的结合,为用户提供了前所未有的个性化和创意表达空间。“ Sense 思考 我们尝试基于文章内...
-
AI Pin 首次亮相后表现不佳 Humane 正在寻找买家
Humane,一家备受好评的AI Pin可穿戴电脑背后的初创公司,正为其业务寻找潜在买家。据报道,该公司由苹果前长期员工Imran Chaudhri和Bethany Bongiorno领导,目标售价在7.5亿至10亿美元之间。 售价699美元的AI Pin...
-
自动驾驶第一性之纯视觉静态重建
本文经自动驾驶之心公众号授权转载,转载请联系出处。 纯视觉的标注方案,主要是利用视觉加上一些GPS、IMU和轮速计传感器的数据进行动静态标注。当然面向量产场景的话,不一定非要是纯视觉,有一些量产的车辆里面,会有像固态雷达(AT128)这样的传感器。如...
-
微软重新定义AI PC:与GPT-4o共享屏幕,看过的一切再也不会忘
今天,微软重新定义了个人电脑。 刚刚发布新一代Copilot+PC,让上市还没几天的第一批AI PC直接过时了。 在新一代PC里,打游戏时可与AI实时对话,提供吐槽陪玩或攻略指导,由GPT-4o提供支持。 任何文件或网页浏览记录都可以用自然语言搜索,轻...
-
走进数字时代:采集图片的艺术与科技
在数字化飞速发展的今天,图片采集已成为我们日常生活和工作中不可或缺的一部分。从拍摄美丽的风景照,到记录重要的历史时刻,再到科学研究中的数据分析,采集图片这一行为所蕴含的意义和内涵越来越丰富。接下来,就让我们一起走进这个充满魅力的领域,探索采集图片背后的艺术...
-
探秘采集机器人:未来科技引领智能数据采集新时代
随着科技的不断进步和发展,机器人技术也日益成为各行各业关注的焦点。在众多机器人类型中,采集机器人以其独特的功能和广泛的应用场景,逐渐成为智能数据采集领域的新宠。本文将从采集机器人的定义、技术特点、应用领域以及未来发展趋势等方面进行深入探讨,带领大家走进采集...
-
骁龙8 Gen3 AI旗舰!魅族21系列618特惠:3099元起
快科技5月16日消息,今天,魅族21系列618开启大促,魅族21到手3099元起,魅族21PRO到手4199元起。 核心配置方面,魅族21采用6.55英寸屏幕,搭载高通骁龙8Gen3平台,前置3200万像素,后置1300万像素超广角镜头,2亿像素广角主摄和...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
苹果将推出的AI补丁 用眼睛和声音控制您的 iPhone 和 iPad
苹果公司在纪念全球辅助功能意识日上宣布了即将推出的 iOS 和 iPadOS 辅助功能,旨在为残疾人士提供更便捷的体验。这些新技术不仅服务于特定群体,还可能对广大用户产生积极影响。 眼动追踪技术将成为 iPhone 和 iPad 用户的利器,无需额外硬件...
-
谷歌CEO:如果OpenAI在AI训练中滥用YouTube将采取行动
谷歌母公司 Alphabet 的 CEO Sundar Pichai 在接受 BC 采访时表示,如果谷歌发现由微软支持的 OpenAI 利用 YouTube 内容来训练能够生成视频的人工智模型,谷歌将采取行动来解决这个问题。 这一表态是在 OpenAI 技...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
基本就是AGI?GPT-4o“它”来了
OpenAI昨晚发布的GPT-4o给许多智能助理丢下一颗震撼弹。它不仅是一款强大的多模态AI助理,同时,为了应对Google Gemini的免费策略,OpenAI也让它免费了。 GPT-4o其中的“o”代表“Omni”,也就是“全能”的意思,可见Open...
-
GPT-4o实际应用案例:盲人可以更好地“看见”世界
OpenAI和Be My Eyes合作推出了一款新的APP,旨在帮助视力受限人群实时了解身边场景并提供帮助。这款APP利用了最新的GPT-4o模型,结合了实时视觉和语音能力。 通过这款APP,盲人可以随时了解自己周围的环境,并通过语音助手的帮助做出一些决策...
-
OpenAI春季发布会:这是“Moss”的诞生,我们人类究竟该何去何从
今天,OpenAI又又又又开发布会了。 在大众心里,现在也基本上都知道,奥特曼是一个贼能PR的人。 每一次的PR的时间点,都拿捏的极其到位,精准的狙击其他厂商。比如说上一次Sora,其实你会发现从头到尾就是一个PR的举动,2月16号发的,特么的快3个月了,...
-
OpenAI发布最新旗舰大模型GPT-4o:免费试用 价格五折速度提高一倍
GPT-4o具体特性一览: 站长之家(ChinaZ.com)5月14日 消息:今日凌晨,OpenAI发布了最新旗舰大模型GPT-4o。这款全能AI不仅免费可用,而且具备横跨听图片、看图片、说图片的多项能力,为用户带来如视频电话般丝滑流畅的交流体验。 O...
-
打工人的命运,掌握在AI面试官手上?
“不要靠近AI面试,会变得不幸。” 又是一年招聘季,就业市场的新主力正来势汹汹。数据显示,2024届高校毕业生规模预计1179万人,同比增加21万人。面临如此大规模的求职者,各大公司在招聘过程中正越来越多地使用AI工具。其中,AI面试已成为包括银行、外企和...
-
DriveWorld:一个预训练模型大幅提升检测+地图+跟踪+运动预测+Occ多个任务性能
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 以视觉为中心的自动驾驶技术近期因其较低的成本而引起了广泛关注,而预训练对于提取通用表示至关重要。然而,当前的以视觉为中心的预训练通常依赖于2D或3D预训练任务,忽视了自动驾驶作为4D场景理解...
-
摩托罗拉AI 手机 moto X50 Ultra 将于 5 月 16 日发布
站长之家(ChinaZ.com)5月9日 消息:摩托罗拉手机官方近日宣布,将在5月16日举办一场盛大的联想AI PC & AI手机发售体验会。届时,备受瞩目的“moto X50Ultra”AI手机将正式与公众见面,其独特的slogan“百倍热AI,...
-
LidaRF:研究用于街景神经辐射场的激光雷达数据(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 光真实感模拟在自动驾驶等应用中发挥着关键作用,其中神经辐射场(NeRFs)的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而,由于街道上相机运动的高度共线性和在高速下的稀疏采样,街景的重建质...
-
十种可用于身份验证的物理和行为标识符
译者 | 晶颜 审校 | 重楼 生物识别技术的概念 生物识别技术是人类的物理或行为特征,可用于数字识别一个人,以授予对系统、设备或数据的访问权限。 这些生物特征标识符的例子包括指纹、面部模式、声音或打字节奏等。这些标识符中的每一个对个人而言都是唯一的,...
-
什么是面部识别技术?一文读懂!
面部识别是一种通过分析一个人的面部来验证其身份的技术。其使用软件来测量主要的面部特征,如鼻梁形状、下颌轮廓和两眼之间的距离,然后将这些特征与已知的面部或模板数据库进行比较。 面部识别被用于改善机场安全、解锁智能手机、协助执法部门进行监视等等。尽管面部识别...
-
光纤网络将如何跟上人工智能?
随着人工智能能力的不断发展,对强大的光纤网络的需求变得越来越迫切。 光纤网络将如何跟上人工智能? 技术领域正在迅速发展,人工智能和机器学习工作负载推动了对连接基础设施的前所未有的需求。 人工智能时代有望改变行业,重组企业运营方式以及与数据的交互。技术...
-
5G对制造机器人的重要性
机器人的使用通常与追求效率和生产力有关。根据国际贸易管理局的数据,在所有行业中,机器人密度每增加1%,生产力就会增加0.8%。如今,制造业中的机器人技术是这一持续发展故事的亮点,如今所有行业的制造过程的每个阶段都有机器人的身影。 虽然机器人技术在制造业...
-
苹果新产品明晚10点发布;曝iPhone 17 Slim新机型;昆仑万维净亏损1.87亿元;智谱AI正研发类“Sora”产品
出品 | 51CTO技术栈(微信号:blog51cto)一、商业圈 1.“AI教母”李飞飞首次创业,瞄准空间智能 李飞飞,著名华裔计算机科学家,因其在人工智能领域的卓越贡献而被誉为“AI教母”。根据国外媒体消息,李飞飞正在致力于她的首次创业——一家名为...
-
射频识别技术如何加强安全措施?
射频识别(RFID 技术的历史可以追溯到20世纪80年代初,但直到最近几年才得到广泛采用。 这种高效、经济的创新技术在世界各地的组织中发挥着微妙但强大的作用,其带来的好处比其提供的安全增强更直接。本文将进一步了解RFID技术是如何用于加强企业安全的。...
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。 正常速度下,它分拣电池(特斯拉的4680电池)是这样的: 官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣: 这次放出的视频亮点之一在于Optimus在厂子里完成这项工作...
-
特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
特斯拉人形机器人又解锁了新技能! 昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。 这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。...
-
闭环永动机!NeuroNCAP:彻底打通端到端闭环仿真链路,已开源!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文提出了一种用于测试自动驾驶(AD)软件系统的多功能基于NeRF的仿真器,其设计重点是传感器真实闭环评估和安全关键场景的创建。仿真器从真实世界的驾驶传感器数据序列中...
-
Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 多传感器与3DGS的结合 NeRF-based SLAM的隐式神经表示法需要基于3D空间中的采样进行计算密集型的体积渲染,从而削弱了SLAM应用所必需的实时能力。3DGS以其快速的渲染速度和优越的视觉...