ide 第52页 - AIGC资讯

腾讯混元大模型升级：新增“文生图”，代码能力大幅提升

10月26日，腾讯宣布，腾讯混元大模型迎来全新升级，并正式对外开放“文生图”功能，展示了其在图像自动生成领域的领先能力。升级后的腾讯混元中文能力整体超过GPT3.5，代码能力大幅提升20%，达到业界领先水平。作为实用级的通用大模型，腾讯混元大模型的应用...

AIGC 2023-10-26 人工智能

897阅读

概述本文将从零开始介绍如何创造并驱动数字人，最后通过AI换脸实现虚拟制片。效果如下：数字人驱动换脸憨豆先生数字人简介数字人（Digital Human / Meta Human），是运用数字技术创造出来的、与人类形象接近的数字化人物形象。数字人...

AIGC 2023-10-26 人工智能

915阅读

10 月 25 日消息，微软近日更新了 iOS 和安卓版 Skype 应用，邀请 Skype Insider 项目成员，测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面，优化了相机体验，修复了多处错误。 IT之家在此附上...

人工智能 2023-10-25 人工智能

829阅读

AI 生成内容已经成为当前人工智能领域的最热门话题之一，也代表着该领域的前沿技术。近年来，随着 Stable Diffusion、DALL-E3、ControlNet 等新技术的发布，AI 图像生成和编辑领域实现了令人惊艳的视觉效果，并且在学术界和工业界...

人工智能 2023-10-24 人工智能

945阅读

VideoCrafter是一款全新的开源视频创建和编辑套件，采用了扩散模型，能够从文本描述生成照片和视频逼真的输出。尽管尚未正式发布，但VideoCrafter有望显著改变视频制作流程。使用VideoCrafter，即使没有视频编辑或动画经验的人也可以轻...

AIGC 2023-10-24 人工智能

1175阅读

????大模型动态科大讯飞星火认知大模型V3.0正式发布在今日的2023科大讯飞全球1024开发者节上，科大讯飞宣布，讯飞星火认知大模型V3.0正式发布，目前星火大模型已整体超越ChatGPT。 ???AI应用 B站测试推出“AI视频总结”功能近日...

人工智能 2023-10-24 人工智能

1161阅读

本文经自动驾驶之心公众号授权转载，转载请联系出处。笔者个人的一些思考不得不说，最近大模型在学术界火起来了，基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外，大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...

人工智能 2023-10-24 人工智能

1005阅读

维基百科一直备受争议，有人视之为无价之宝，有人则对其可靠性提出质疑。近期，一项研究表明，通过人工智能（AI），可以提高维基百科的可靠性。这项研究由一家伦敦的AI公司进行，他们开发了一个名为SIDE的系统，旨在通过检查维基百科的信息来源，识别其准确性，并提...

人工智能 2023-10-24 人工智能

897阅读

1.引言向量检索已经成为现代搜索和推荐系统的核心组件。通过将复杂的对象（例如文本、图像或声音）转换为数值向量，并在多维空间中进行相似性搜索，它能够实现高效的查询匹配和推荐。 Elasticsearch 作为一款流行的开源搜索引擎，其在向量检索方面...

人工智能 2023-10-24 人工智能

975阅读

研究人员推出了一种新的视觉提示方法 Set-of-Mark（SoM），它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。GPT-4V 是一种基于 GPT-4的多模态模型，可以同时处理文本和图像，并生成多种类型的输出。然而...

AIGC 2023-10-23 人工智能

1026阅读

最近一段时间，我们见证了大型语言模型（LLM）的显著进步。特别是，生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来，大型多模态模型 (LMM 引起了研究界越来越多的兴趣，许多工作致力于构建多模态...

AIGC 2023-10-23 人工智能

942阅读

在暖色灯光中，一个复古行李箱缓缓打开，露出灰白色的运动鞋，光影在鞋面上划过，镜头拉近，麂皮质地的纹理清晰可见。画面一转，鞋子旋转起来，灯光由暗转亮，明暗交接在鞋跟处形成一个慢镜头的色彩对比，一边明亮、一边典雅。这个20s的商品展示视频，角度丰富、色彩讲究...

人工智能 2023-10-23 人工智能

981阅读