-
探秘内容管理框架下的爬虫技术
随着互联网信息的爆炸式增长,如何高效、准确地获取并管理所需内容,成为了摆在我们面前的一大挑战。内容管理框架(Content Management Framework,简称CMF)应运而生,为组织和个人提供了系统性的解决方案。而在这一框架中,爬虫技术扮演着重...
-
GPT-4o预告中的语音助手“Her”真的很惊艳,但问题是我们还有多久才能够真正上手?网友:PR鬼才奥特曼都坐不住了
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI 发布会中的GPT-4o给所有人都看眼馋了! 谁不想第一时间体验下传说中的“Her”呢? 图片 在发布会上,GPT-4o展示了自己的“magic”:高超的语音理...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不可...
-
花1块钱就有上万篇内容,新晋AI顶流把价格打下来了
过去几天,AI行业大事件高度密集。 先是OpenAI贴脸开大发布GPT-4o,而后谷歌I/O大会原地回击掏出华丽升级Gemini全家桶。放眼国内AI赛道,备受关注的则是字节终于高调发布豆包大模型家族。 昨天上午,当火山引擎总裁谭待宣布豆包通用模型推理输入价...
-
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大六位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。 眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。 就在刚刚,GPT-4o的关键团队信息,也被公布了出来。 就是这个名为「omni」的团队,发挥出了不...
-
「大模型」之所短,「知识图谱」之所长
最近一年以来,大语言模型技术突飞猛进,被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来,给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图,其中包括了文本生成、图像生成等技术。本次分享...
-
谷歌Gemini对OpenAI贴脸开大!文生视频模型Veo硬刚Sora
谷歌近日发布了一系列强大的AI工具,展开了一场针对OpenAI的激烈竞争。这一波强势反击包括了Project Astra、Veo视频模型以及Gemini1.5Pro等一连串武器,旨在彻底颠覆谷歌搜索,并对OpenAI展开全面挑战。 其中,谷歌发布的视频模型...
-
重磅!腾讯宣布混元文生图大模型开源: Sora 同架构,中英文原生DiT,可免费商用
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。 这是业内首个中文原生的DiT架构文生图开源模型,支...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
Refuel AI 推出专为数据标注和清洗设计的开源语言模型 RefuelLLM-2
Refuel AI 最近宣布推出两个新版本的大型语言模型(LLM),RefuelLLM-2和 RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务而设计,旨在提高处理大规模数据集的效率。 RefuelLLM-2的主要特点包括: 自...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...
-
腾讯和字节的幽灵在中国AI的上空徘徊
2023 年 4 月,产品经理松鹅(化名)从腾讯离职两天后,就从深圳来到北京,加入一家基座大模型的初创公司。彼时,这家公司还没什么资本追捧和用户声量,只有一个听起来挺拗口的中文名字:月之暗面。 那时候这家公司的产品团队,只有松鹅一个人。 同月,曾经在字节跳...
-
70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024
遇到一个问题用不同表达方式prompt时,大模型往往会给出两种不同的答案。 比如,「秘鲁的首都是什么」,「利马是秘鲁的首都吗」。 对于这种回答不一致的问题,科学家们纷纷为大模型的「智商」担忧起来。 正如了LeCun所言: LLM确实比狗积累了更多的事实知...
-
ControlNet作者新作爆火:P照片换背景不求人,AI打光完美融入
ControlNet作者新作,玩儿得人直呼过瘾,刚开源就揽星1.2k。 用于操纵图像照明效果的IC-Light,全称lmposing Consistent Light。 玩法很简单: 上传任意一张图,系统会自动分离人物等主体,选择光源位置,填上提示词,就能...
-
SIGGRAPH'24 | 太逆天了!利用分层3D GS,实时渲染超大规模场景!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 近年来,新视角合成取得了重大进展,3D Gaussian splatting提供了出色的视觉质量、快速训练和实时渲染。然而,训练和渲染所需的资源不可避免地限制了可以以良好视觉质量表示的场景大小。本文引入...
-
综述170篇「自监督学习」推荐算法,港大发布SSL4Rec:代码、资料库全面开源!
推荐系统对于应对信息过载挑战至关重要,它们根据用户的个人偏好提供定制化推荐。近年来深度学习技术极大地推动了推荐系统的发展,提升了对用户行为和偏好的洞察力。 然而,由于数据稀疏性的问题,传统的监督学习方法在实际应用中面临挑战,这限制了它们有效学习用户表示的...
-
如何克服人工智能的缺点?
人工智能(AI 领域经历了深刻的变化,并变得越来越复杂。人工智能被誉为改变游戏规则的技术。人工智能由于其聪明才智,比人类更早完成任务,例如语音识别、模式可视化和决策,但它只能翻译语言。然而,自ChatGPT发布以来,该定义一直是类似的。 不过,这并不是...
-
如何克服人工智能的缺点?
人工智能(AI 领域经历了深刻的变化,并变得越来越复杂。人工智能被誉为改变游戏规则的技术。人工智能由于其聪明才智,比人类更早完成任务,例如语音识别、模式可视化和决策,但它只能翻译语言。然而,自ChatGPT发布以来,该定义一直是类似的。 不过,这并不是...
-
探索 2024 年自动化工作管理工具及其优势
在快节奏的商业世界里,效率和生产力是最重要的。为了保持领先地位,组织越来越多地转向自动化工作管理工具。但这些工具到底是什么,它们如何在2024年为企业带来好处? 自动化工作管理工具包含一系列软件解决方案,旨在简化和优化组织工作流程的各个方面。这些工具自...
-
一览Occ与自动驾驶的前世今生!首篇综述全面汇总特征增强/量产部署/高效标注三大主题
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶因其在减轻驾驶员负担和提高驾驶安全方面的潜力而越来越受到关注。基于视觉的三维占用预测是一种新兴的感知任务,适用于具有成本效益的自动驾驶感知系统,它可以...
-
一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo
开源大模型领域,又迎来一位强有力的竞争者。 近日,探索通用人工智能(AGI)本质的 DeepSeek AI 公司开源了一款强大的混合专家 (MoE 语言模型 DeepSeek-V2,主打训练成本更低、推理更加高效。 项目地址:https://gi...
-
智谱AI研发国产文生视频模型对标Sora 最快年内发布
据钛媒体报道,智谱 AI 正在研发对标 OpenAI Sora 的高质量文生视频模型,预计最快年内发布。 该公司是国内一家估值过200亿的 AI 大模型独角兽公司,成立于2019年,由清华大学计算机系的技术成转化而来。智谱 AI 已推出多个大模型产品,包括...
-
OpenAI Sora让创作者们工作轻松,他们还相信自己不会轻易被取代
5月6日消息,OpenAI文生视频工具Sora的早期测试者们似乎可以松口气了。他们并没有因为这款工具而出现即将被取代的恐慌,反而觉得它让他们的工作变得更加游刃有余。 今年2月,人工智能初创公司OpenAI正式推出了Sora,这款工具旨在“深入理解和模拟...
-
强大到不敢给普通人用!史诗级大模型 Sora 如何让众行业一夜变天?
1视频生成模型“新王登基”,Sora 何以成为全球焦点? 2023年以来,多模态视频生成技术取得了显著的进展和突破,从 Runway 到 Pika 再到年末的 VideoPoet,视频生成模型进入到加速阶段。2024年2月,OpenAI 旗下视频生成模型...
-
AI日报:Awaker 1.0写真视频击败Sora?Sora视频被指大量后期;苹果首款AI平板曝光;百万网友围观博主和AI“谈恋爱”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、写真视频击败Sora?人大自研...
-
Sora爆火短频“气球人”制作者亲述优缺点:视频其实都是专业制作,Sora占一小部分;一致性不能很好控制;似有识别版权问题的机制
整理 | 言征 OpenAI 的视频生成工具 Sora在2月份让业界大吃一惊,其流畅、逼真的视频似乎远远领先于竞争对手。然而这场精心策划的首次亮相,留给了大众太多不为人知的细节。 近日, OpenAI 大火的宣传短片的制作团队之一的Shy Kids...
-
Sora大片真相:人工特效参与,被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI...
-
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。 该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度...
-
Gaussian-LIC:首个多传感器融合3DGS-SLAM系统(浙大&TUM)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 多传感器与3DGS的结合 NeRF-based SLAM的隐式神经表示法需要基于3D空间中的采样进行计算密集型的体积渲染,从而削弱了SLAM应用所必需的实时能力。3DGS以其快速的渲染速度和优越的视觉...
-
中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。 据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达...
-
AI日报:当前最强国产Sora大模型Vidu发布;Kimi Chat移动端升级;通义千问开源首个千亿参数模型;苹果计划与 OpenAI 合作
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、清华团队发布视频大模型Vidu...
-
国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布
快科技4月28日消息,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。 这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,还在加速迭代提升中。...
-
清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频
生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这款模型是国内首个达到Sora级别的视频大模型,标志着中国在视频生成技术领域的重要进展。 Vidu的主要特点和技术创新包括: 模型结构...
-
图灵诺奖得主等大佬齐聚海淀!清华版Sora震撼首发,硬核AI盛会破算力黑洞
中关村论坛举办以来的首个主题日活动:「人工智能主题日」今日开启! 到场嘉宾,也是星光熠熠,大佬云集,还有着浓浓的国际范儿,与世界顶尖水平接轨。 一共161位嘉宾,近一半是外籍AI大佬和从业者。 而嘉宾阵容也是非常豪华,汇集了国内外30多名院士,还有诺奖、...
-
清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」
在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。 这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。它不...
-
流量回放平台 AREX 在携程的大规模落地实践
作者简介 携程AREX团队,机票质量工程组,主要负责开发自动化测试工具和技术,以提升质量和能效。 导语 AREX 是一款由携程开源的流量回放平台,孵化于机票BU内部。聚焦录制回放核心链路的建设,从基础方案建设到核心事业线的深入落地验证,在集团复杂业务场...
-
LinkedIn在利用大型语言模型服务十亿用户中的收获
LinkedIn 在全球拥有超过10亿用户,不断挑战当今企业技术的极限。很少有公司能够像LinkedIn那样运营,或者拥有类似的大量数据资源。 对这个专注于商业和就业的社交媒体平台来说,将合格的候选人与潜在雇主连接起来,帮助填补职位空缺是其核心业务。同...
-
实战干货|Spark 在袋鼠云数栈的深度探索与实践
Spark 是一个快速、通用、可扩展的大数据计算引擎,具有高性能、易用、容错、可以与 Hadoop 生态无缝集成、社区活跃度高等优点。在实际使用中,具有广泛的应用场景: · 数据清洗和预处理:在大数据分析场景下,数据通常需要进行清洗和预处理操作以确保数据...
-
Synthesia虚拟数字人Expressive-1 AI Avatars正式版发布
Synthesia 公司最近推出了一款创新的虚拟数字人形象技术——Expressive-1AI Avatars,这是一款能够根据文本内容自动预测并展现丰富表情的AI虚拟形象。这项技术能够将文本转换为包含面部表情、语音和肢体语言的视频内容,极大提升了视频的表...
-
华人持续炸场!8倍于SOTA模型发布,超分辨率细节还原度逆天,终于可以看清楚蜘蛛网丝了!网友:质量真不错!电影时长9秒才够用!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) Sora带火了“视频一致性”的研究,但单纯在时间一致性已经不能满足业内对于高逼真视频的渴望。这不,华人又出来炸场了! 近日,一个名为VideoGigaGAN的视频模型在业界走红。...
-
AI日报:阿里对口型视频项目EMO开启内测;苹果官宣端侧小模型OpenELM;Open-Sora偷偷升级;微信发布AI工具小微助手
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里对口型项目EMO开启内测...
-
在线地图还能这样?MapTracker:用跟踪实现在线地图新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 太强了,在线高精地图还能用跟踪的方式来做!!!本文提出了一种矢量HD建图算法,该算法将在线高精建图公式化为跟踪任务,并使用memory latents的历史来确保随着时...
-
AI电影制作平台Morph Studio正式向候补用户开放访问权限
今日起,备受期待的AI电影制作平台Morph Studio开始向候补用户开放访问权限。这一消息一出,立即引发了广大用户的热烈反响。 Morph Studio官方表示,该平台将很快加入视频生成角色一致性和配音生成功能。这两个功能的加入,无疑将为平台的用户体验...
-
全国首例“AI声音侵权案”宣判:获赔25万元
快科技4月24日消息,北京互联网法院昨日对全国首例AI生成声音人格权侵权案进行了一审判决。 该案涉及的主要问题是自然人的声音权益是否应扩展到AI生成的声音,以及如何确定AI生成声音的可识别性。 原告殷某是一名配音师,发现其配音作品在多个APP中广泛流传。这...
-
黑照变废为宝!超能AI一句话修出创意大片,亲妈看了都说真
2024最wow的AI生图工具出现了! 对“青春纪念手册”下手,你就说这味儿正不正宗: 不信谁没有,谁也别说谁。 别着急,下一秒“啪”的一下: ……什么情况? 这,就是最近摄影圈不少人都在玩的AI修图神器——超能画布。 据说只需一句提示词就能分分钟修出...
-
零门槛用AI画漫画,跨模态内容创作进入next level
AI这把火,烧了一年多。现在,有AI可以帮你写PPT,有的会写歌,有的能帮公司批量生成营销素材,有的擅长“量子速读”提炼长文本。总之,几乎每个月都有AI热点出现。 各种热点背后,有两个事情值得注意: 第一,实践证明,AI落地一定是贴近已有需求,用原先无法想...
-
用百度文库AI,我也能轻松创建漫画、画本?
作为一种受众广泛的艺术形式,漫画的影响力应该不需要我多说什么。 强烈的视觉化和叙事性,让漫画成为无数年轻读者的阅读启蒙,也让无数二十一世纪青年拥有了自己的「漫画梦」。可是要制作出一份能拿得出手的漫画谈何容易,先不论作画水平能不能拿出手,单纯是前期查找资料、...
-
EMNLP 2023|利用LLM合成数据训练模型有哪些坑?
大家好,我是HxShine 今天我们将介绍EMNLP2023的一篇大模型(LLMs)生成文本分类任务合成数据的文章,标题是《Synthetic Data Generation with Large Language Models for Text Cla...
-
CVPR 2024 | 巨幅提升24%!LiDAR4D会是LiDAR重建的答案么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管神经辐射场(NeRFs)在图像新视角合成(NVS)方面取得了成功,但激光雷达NVS的发展却相对缓慢。之前的方法follow图像的pipeline,但忽略了激光雷达...
-
LiDAR仿真新思路 | LidarDM:助力4D世界生成,仿真杀器~
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:LidarDM: Generative LiDAR Simulation in a Generated World 论文链接:https://arxiv.org/pdf/2404.02903....