多模态第3页 - AIGC资讯

阿里重磅开源Qwen2-VL：能理解超20分钟视频，媲美GPT-4o！

阿里巴巴开源了最新视觉多模态模型Qwen2-VL，根据测试数据显示，其72B模型在大部分指标超过了OpenAI的GPT-4o，Anthropic的Claude3.5-Sonnet等著名闭源模型，成为目前最强多模态模型之一。 Qwen2-VL支持中文、英文、...

生成式AI 2024-08-30 人工智能

1258阅读

7 大国产大模型：KimiChat、豆包、文心一言、智谱清言、通义千问、讯飞星火、天工AI，到底哪家强？

有的朋友还不了解 AI 工具，或者跟老王一样，不知道该选哪个 AI 工具。怎么办？先看看别人都用哪个。新榜（著名三方自媒体数据平台），根据各自媒体平台的数据，统计了 AI 产品的用户使用等多个维度，分析得出了综合评分，展示如下。第 3 和...

生成式AI 2024-08-30 人工智能

4528阅读

用AI打假AI，这些倒反天罡的AI应用正在悄悄走红

“不要相信你现在看到的任何东西。”这是X上的一位AI圈博主在看完最近爆火的AI伪造版TED演讲发出的感慨。谁还记得，一年前AI生成的视频是这样的: 生成式AI将互联网带入到了一个真假难辨的深伪时代。 “有图有真相”在过去是网友求证文字信息真实性时常引用...

AIGC 2024-08-28 人工智能

1066阅读

突发！OpenAI展示草莓，很快发布“GPT-5”猎户座！

OpenAI不藏了，终于展示江湖流传已久的秘密项目“草莓”（Strawberry）和猎户座(Orion 。根据Theinformation消息，OpenAI已经向美国国家安全官员展示了草莓这个秘密项目，保证会在安全、合理的范围内来开发和使用。同时Open...

大数据 2024-08-28 人工智能

1005阅读

2024大模型十大趋势

2024大模型十大趋势关键要点一、机器外脑时代的智慧探索二、机器外脑、创意生成和情感陪伴三、大模型驱动的新未来：AI带来创意转化与机遇四、人物-行为-场景一体化：未来人工智能的新范式五、未来数字内容生产的基础设施六、共创、共建、共...

AIGC 2024-08-28 人工智能

1331阅读

如何利用AI创作PPT？

最强AI视频生成：小说文案智能分镜+智能识别角色和场景+批量Ai绘图+自动配音添加音乐+一键合成视频+百万播放量https://aitools.jurilu.com/ 你要是做一张只需要交差用的PPT，用ChatGPT连一分钟都用不了，你看我画...

大数据 2024-08-27 人工智能

2140阅读

关掉MidJourney！ AI绘画Stable Diffusion开源模型新王 FLUX.1整合包来了！

各位小伙伴们，今天我要给大家带来一个超级重磅的消息！Stable Diffusion的创始团队又双叒叕搞事情了，推出了一个全新的开源AI图像生成模型——FLUX.1！这不仅是一个技术上的突破，更是为创意工作者们带来了无限的可能性。话不多说，赶紧来看看吧！...

大数据 2024-08-27 人工智能

1140阅读

五大AI平台特长揭秘：文心一言、通义千问、天工AI、讯飞星火与Kimi的差异化优势

文心一言、通义千问、天工AI、讯飞星火和Kimi是目前国内较为知名的AI平台，它们各自具有以下特点和优势：本文将对这五大 AI 平台进行深度对比，分析各自特点及适用场景，帮助您找到最合适的 AI 助手。一、五大 AI 平台实力对比平台...

AIGC 2024-08-27 人工智能

2920阅读

AI智能助手商业系统软件源码（IMYAI智能助手) AI换脸/智能体GPTs应用/AI视频生成/AI绘画/文档分析/GPT-4o模型支持

人工智能技术的发展日新月异，从深度学习到自然语言处理，再到计算机视觉等领域，不断推动着各行各业的变革。在应用层面，人工智能已深入到内容创作领域，为创作者提供了前所未有的便利和可能性。这些技术的发展潜力巨大，正逐渐改变着内容创作的模式。人工智能大模型的出...

生成式AI 2024-08-27 人工智能

1237阅读

AI日报：可图上线一键换衣软件；Grok-2挤进聊天机器人第二名；大学生靠Claude 3.5成功造出核聚变反应堆

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、可图上线一键换衣Kolors...

大数据 2024-08-26 人工智能

963阅读

推荐使用：openai-whisper-talk —— 您的个人声音助手

推荐使用：openai-whisper-talk —— 您的个人声音助手 openai-whisper-talkopenai-whisper-talk is a sample voice conversation application powered...

AIGC 2024-08-25 人工智能

1016阅读

精读代码，实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记

基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时，也被一些心怀不轨之人当作牟利里的技术，如Deepfake技术。 AI生图最早的工具是机械臂输出作画，现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说，AI生图模型属于多模...

大数据 2024-08-25 人工智能

841阅读

语言图像模型大一统！Meta将Transformer和Diffusion融合，多模态AI王者登场

【新智元导读】就在刚刚，Meta最新发布的Transfusion，能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后，语言模型和图像大一统，又近了一步。也就是说，真正的多模态AI模型，可能很快就要来了! Transformer...

生成式AI 2024-08-25 人工智能

984阅读

AIGC：clip-interrogator

文字生成图片是近年来多模态和大模型研究的热门方向，openai提出的CLIP提供了一个方法建立起了图片和文字的联系，但是只能做到给定一张图片选择给定文本语义最相近的那一个，实际项目开发中我们总是需要从一张图片获取描述，clip-interrogator应运...

生成式AI 2024-08-25 人工智能

1329阅读

最强终端部署的多模态MiniCPM-V模型部署分享（不看后悔）

MiniCPM-V模型是一个强大的端侧多模态大语言模型，专为高效的终端部署而设计。目前该模型有MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2.5版本。 MiniCPM-V 1.0模型：该模型系列第一个版本...

AIGC 2024-08-24 人工智能

2213阅读

ACM MM2024 | 网易伏羲多模态研究再获国际认可，推动特定领域跨模态理解新突破

近日，第32届ACM国际多媒体学术会议（ACM International Conference on Multimedia，简称ACM MM）公布论文接收结果，网易伏羲最新研究成果《Selection and Reconstruction of Key...

人工智能 2024-08-24 人工智能

915阅读

「深度探索：AIGC——从文本到视觉的奇迹之旅」

文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...

AIGC 2024-08-23 人工智能

1129阅读

AI智能体，年轻人的情感搭子

「AI智能体太好了，现实生活当中，我永远没办法得到永远不变的爱。」这是一位网友使用AI情感陪伴类App后的真实感受。现在每月都有成百上千万的年轻人，近乎沉醉地与各种AI智能体对话。他们每月花费在这些软件上的时间，甚至超过一周。他们把智能体当做恋人、朋友...

生成式AI 2024-08-23 人工智能

1175阅读

Xinference安装及部署大模型

1. Xinference 介绍 Xorbits Inference (Xinference 是一个开源平台，用于简化各种 AI 模型的运行和集成。借助 Xinference，您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理...

AIGC 2024-08-23 人工智能

5406阅读

华为昇腾Ascend系列之 01 什么是昇腾芯片？AIGC浪潮已至，进一步推动对芯片和算力的需求，主流 GPGPU/ASIC 产品性能对比（Ascend 910、Ascend 910B）

什么是昇腾Ascend 910、Ascend 910B 昇腾 310 和 910 处理器为华为AI 算力领域核心产品，910 单卡 Int8 算力大致可达 0.6 P，最大功耗为 300W，已可对标国际主流 GPU。且昇腾计算产业在硬件方面坚持“硬件开...

AIGC 2024-08-23 人工智能

6360阅读

如何高效微调多模态Transformers模型：从入门到实践指南

多模态大模型（Multimodal Large Models）是能够处理多种类型数据（如文本、图像、音频等）的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。目录 Transformers简介多模态Transforme...

AIGC 2024-08-22 人工智能

1715阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 Task03笔记

从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期的学习活动（“AIGC”方向），基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 Datawhale官方的速通教程链接： Task 1...

大数据 2024-08-22 人工智能

1080阅读

AI测试入门：认识AIGC与多模态技术

AI测试入门：认识AIGC与多模态技术前言一、什么是AIGC？二、 AIGC的技术基础三、 AIGC的工作原理四、AIGC的应用场景 4.1. 媒体与出版 4.2. 市场营销 4.3. 教育 4.4. 游戏开发 4.5. 艺术创作...

大数据 2024-08-22 人工智能

1306阅读

多模态合规分析平台，保障AIGC营销新时代对客服务高质合规

随着生成式人工智能技术加速应用于人类日常生产生活，AIGC（人工智能生成内容）正逐渐成为营销领域的新选择。与此同时，全渠道数字化时代来临，企业与客户的互动形式更加丰富，包括线上营销平台、私域微信运营、5G视频客服等多形态媒介，沟通更加频繁，营销素材的影...

大数据 2024-08-22 人工智能

1001阅读

AI日报：新壹视频大模型2.0发布；LivePortrait支持用图片控制动画；OpenAI推GPT-4o模型微调功能；免费无水印！AI视频Hotshot最长可生成10秒

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、新壹视频大模型2.0发布:支持...

人工智能 2024-08-21 人工智能

1011阅读

AIGC学习笔记

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档前言提示：这里可以添加本文要记录的大概内容：记录一下学习AIGC，参考链接: 爆火的AIGC到底是什么提示：以下是本篇文章正文内容，下面案例可供参考一、stab...

AIGC 2024-08-21 人工智能

898阅读

即刻体验 Llama3.1就在Amazon Bedrock!

引言在人工智能的浪潮中，大型语言模型（LLMs）不断推动着技术边界的扩展。Meta 最新推出的 Llama 3.1 模型系列，以其卓越的性能和广泛的应用前景，引起了业界的广泛关注。现在，激动人心的消息来了——Llama3.1 已经在 Amazon Be...

AIGC 2024-08-21 人工智能

971阅读

AI日报：《黑神话：悟空》应该感谢AI；通义千问启用新域名“tongyi.ai”；Luma v1.5版本发布；claude被作家集体起诉

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、《黑神话:悟空》震撼上线，英伟...

AIGC 2024-08-20 人工智能

949阅读

尝试问AI：什么是AIGC？

本文内容为AI生成介绍一下什么是AIGC Q：介绍一下什么是AIGC A： AIGC，全称为Artificial Intelligence Generated Content（人工智能生成内容），是一种利用人工智能技术自动创造各种形式内...

大数据 2024-08-19 人工智能

1215阅读

AI日报：昆仑万维推AI短剧平台SkyReels；Glif工作流可一键生成时尚模特图；在线版FLUX提供LoRA训练；ControlNeXt让钢铁侠跳美女舞蹈

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、昆仑万维推出全球首个AI短剧平...

AIGC 2024-08-19 人工智能

1208阅读

国产AI机器人好超前…弹琴泡茶打咏春，还能撸猫？？

什么水平，让海外最火AI机器人Figure的CEO都第一时间关注? 国产人形机器人大秀肌肉，最新技能居然是弹琴泡功夫茶……和颠勺?! 手握琴竹，精准轻巧敲击每根琴弦，演奏动听音乐。熟练泡一壶功夫茶，十几道工序、数个杯壶轻松拿捏。搞定一份香喷喷的华夫饼...

大数据 2024-08-19 人工智能

934阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task 1笔记

引言本笔记可以作为学习手册的扩充版本，也是一份快速上手的指南。灰色的备注部分包含了关于步骤的详细解释和扩展内容，建议你可以先跳过这些备注，等完成所有步骤后再回头查阅。第一步：搭建代码环境 1.1 申请阿里云PAI-DSW 阿里云PAI-D...

人工智能 2024-08-18 人工智能

1012阅读

哦吼，新模型？文生图领域的新模型FLUX.1（附模型下载网盘地址和详细使用方法）

?背景 Black Forest Labs 是由 Stable Diffusion 原班人马成立的公司，致力于研发优质的多模态模型并开源。该公司由多位前 Stability AI 研究员组成，包括 Robin Rombach 在内的团队成员，他们在图像和...

AIGC 2024-08-18 人工智能

3649阅读

超逼真AI生成电影来了！《泰坦尼克号》AI重生！浙大&阿里发布MovieDreamer，纯AI生成电影引爆热议！

视频生成领域的最新进展主要利用了短时内容的扩散模型。然而，这些方法往往无法对复杂的叙事进行建模，也无法在较长时间内保持角色的一致性，而这对于电影等长篇视频制作至关重要。对此，浙大&阿里发布了一种新颖的分层框架MovieDreamer，它将自回归...

生成式AI 2024-08-18 人工智能

1116阅读

【论文+中文文生图】Kolors：快手可图绘画模型实测（24.07.06开源）

代码：https://github.com/Kwai-Kolors/Kolors | 权重论文原文：Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...

人工智能 2024-08-18 人工智能

1189阅读

这个除了会表达爱什么都不会的AI，凭什么能卖到7万块？

“它毛茸茸的，渴望得到关注。但更重要的是，它爱你。” 乍一看，它就像果宝特攻里的角色，神似橙留香，或菠萝吹雪。上为LOVOT，下为果宝特攻所以在第一眼看到它时，会让人感到熟悉又好奇。它既是陈冠希喜爱的陪伴机器人。也曾出演日本已故知名演员三浦春马的...

大数据 2024-08-16 人工智能

1012阅读

盘点目前有关数字人的开源项目

近年来，数字人技术的迅猛发展吸引了众多研究者和开发者的关注。开源社区也涌现出许多优秀的项目，为数字人技术的发展提供了强有力的支持。本文将对一些目前较为热门的数字人生成相关开源项目进行分类整理和总结，以供广大开发者和研究人员参考。一、动画人像生成与动作...

人工智能 2024-08-16 人工智能

2299阅读

Chameleon：Meta推出的图文混合多模态开源模型

目录引言一、Chameleon模型概述 1、早期融合和基于token的混合模态模型 1）早期融合的优势 2）基于token的方法 2、端到端训练二、技术挑战与解决方案 1、优化稳定性问题 2、扩展性问题 3、架构创新 4、训练技...

大数据 2024-08-16 人工智能

1380阅读

GPT-4o mini：AI技术的平民化革命

目录引言一、GPT-4o mini简介二、性能表现三、技术特点四、价格与市场定位五、应用场景六、安全性与可靠性七、未来展望八、代码示例结语引言在人工智能的浪潮中，大模型技术一直是研究和应用的热点。然而，高...

大数据 2024-08-16 人工智能

1517阅读

Nature曝惊人内幕：论文被天价卖出喂AI！出版商狂赚上亿，作者0收入

Nature的一篇文章透露:你发过的paper，很可能已经被拿去训练模型了!有的出版商靠卖数据，已经狂赚2300万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗? 全球数据告急，怎么办? 论文来凑! 最近，Nature的一篇文章向我们揭露了这样...

生成式AI 2024-08-15 人工智能

997阅读

【SD3】发布，送你3个ComfyUI工作流，轻松搞定AI绘画

这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3（简称SD3）的发布。SD3是一个多模态的 Diffusion Transformer 模型，其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。废话不多说，先给大家看看我使...

生成式AI 2024-08-15 人工智能

940阅读

Meta发布新肥羊：Llama 3.1 大模型

Meta 的新 Llama 3.1 模型已经发布，开始与 GPT-4o 和 Claude 3.5 Sonnet 竞争。 Meta 在 23 号宣布其开源 AI 模型 Llama 已发布最新版本。据 Meta 称，随着 Llama 3.1 405B 的...

大数据 2024-08-15 人工智能

1145阅读

AI领域的《猫鼠游戏》，盘点那些打假“AI内容”的强大产品，这款检测器已经突破400万用户

莱昂纳多扮演的小弗兰克在《猫鼠游戏》中凭借着高超的假币伪造技术骗过了一众警察。现实中，AI领域的《猫鼠游戏》正在上演，一场有关人工制作内容和 AI 生成内容的判定成为越来越重要的议题。 Human or AI，这是一个问题。本文介绍了 GPTZero 这...

大数据 2024-08-14 人工智能

1277阅读

华为发布全新OceanStor A800 AI存储：10TB级带宽专攻AI大模型

快科技8月14日消息，近日，在2024华为数据存储用户精英论坛上，AI-Ready的数据基础设施”分论坛成功举行。为促进AI大模型健康发展，华为推出了全新的OceanStor A800 AI存储。华为表示，该存储采用数控分离架构，提供10TB级带宽和亿...

人工智能 2024-08-14 人工智能

1043阅读

LLM大模型：一文彻底搞定 RAG、知识库、 Llama-3

简介： Llama-3 用于 RAG，增强大语言模型的性能，整合外部知识。关键组件包括：1 自定义知识库，存储更新的信息；2 分块处理，拆解文本便于管理；3 嵌入模型，转化多模态数据为数值向量；4 向量数据库，快速检索相似性；5 用户聊天界面，交...

生成式AI 2024-08-14 人工智能

1124阅读

AIGC大模型面经汇总，太全了！

字节暑期实习多模态算法 (二面凉经一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文，中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...

大数据 2024-08-13 人工智能

1703阅读

SD原班人马发布FLUX.1：打开AI绘画新世界

Black Forest Labs 旗下产品 AI 绘画工具如雨后春笋般涌现，让我们对创作的理解不断刷新。就在大家以为已经见识了 AI 绘画的天花板时，FLUX.1 出现了！这款由 Black Forest Labs 推出的 AI 绘画...

AIGC 2024-08-13 人工智能

956阅读

免费替代Midjourney！FLUX.1使用方法大全，支持ComfyUI

一：Flux.1概述 1.1 它是什么如果你想直接查看使用教程，MeoAI建议你直接跳到第四章：4种使用方法教程。 Flux.1是由Black Forest Labs开发的一款开源AI图像生成模型。这个模型继承了Stable Diffusion...

AIGC 2024-08-12 人工智能

2011阅读

【AIGC学习】一文带你了解AIGC基础知识（适用于AI入门/小白）

▌导读写关于AI的文章内容已有一段时间，不少同学问博主怎么学习AI？有没有系统性学习AI知识及教程？在这里，锅头整理了AIGC的基础知识和本文学习思维导图，方便提炼重点和学习总结。在过去的几十年中，人工智能（AI）从科幻小说中的异想...

人工智能 2024-08-12 人工智能

2010阅读

超9000颗星，优于GPT-4V！国内开源多模态大模型

国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。据悉，MiniCPM-V2.6一共有80亿参数，在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...

人工智能 2024-08-11 人工智能

1129阅读