多模态第5页 - AIGC资讯

GPT-4o mini特点功能介绍及使用教程指南 OpenAI最新模型免费体验地址入口

GPT-4o mini简介 GPT-4o mini是一款成本效益极高的小型智能模型，由OpenAI推出。它在多模态推理和文本智能方面超越了其他小型模型，并支持与GPT-4o相同的语言范围。该模型在数学推理和编码任务上表现出色，能够处理大量上下文信息，并支持...

生成式AI 2024-07-19 人工智能

1392阅读

突发！OpenAI发布GPT-4o mini，免费为ChatGPT用户提供

7月19日凌晨，OpenAI在官网发布了最新大模型GPT-4o mini，具备文本、图像、音频、视频的多模态推理能力。根据测试性能显示，GPT-4o mini的性能比GPT-4更好，大约有GPT-4o的80%能力。但API的价格却大幅度下降了60%，每1...

生成式AI 2024-07-19 人工智能

1062阅读

GPT-4o mini完全指南：OpenAI最新模型使用方法教程与免费使用入口

探索GPT-4o mini能为你带来哪些改变为什么选择GPT-4o mini？ GPT-4o mini不仅仅是一款产品——它是一项革命性的技术，致力于超越其他小型模型，在多模态推理和文本智能方面表现出色。致力于提供高效、低成本的智能解决方案，GPT-4...

人工智能 2024-07-19 人工智能

1913阅读

每日AIGC最新进展(45)：字节跳动开源大规模text-to-video数据集OpenVid-1M、浙江大学提出锚定条件控制视频生成GVDIFF、Meta AI研究院提出文生3D大模型3DGen

Diffusion Models专栏文章汇总：入门与实战 OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation https://nju-pcalab....

人工智能 2024-07-19 人工智能

1043阅读

AIGC各个应用场景下的模型选择

需要注意的是，下述模型可以在不同任务和领域中灵活应用，它们的归属也会根据模型的设计和主要应用领域而有所变化，并不绝对。自然语言处理模型模型层中自然语言理解(Natural LanguageUnderstanding，NLU 和自然语言生成(N...

生成式AI 2024-07-18 人工智能

1005阅读

AIGC技术：发展、应用与前景

目录前言 1 AIGC技术的发展现状 1.1 算法进步 1.2 硬件支持 1.3 数据驱动 2 AIGC技术的应用情况 2.1 医疗保健领域 2.2 金融和商业领域 2.3 智能交通领域 2.4 教育和培训领域 3 AIGC技术的未来...

大数据 2024-07-18 人工智能

2713阅读

国内开店卷不动，换上AI出海试试

比日常订单增长翻了四、五倍! 从日开200单到持续一周热销，国内夫妻创业店的老板俩，莫名其妙被雪花式的海外订单砸懵了。这家店叫Zeuslap，卖辅助式显示器，做出海生意，尤其在韩国市场很吃得开。某年黑五，就达成过“十分钟突破1000单”的战绩。要问Z...

人工智能 2024-07-17 人工智能

798阅读

AI日报：阿里云发布音频模型Qwen2-Audio；字节将推类sora模型；AI眼里13.11＞13.8

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、Qwen2-Audio：千问系...

生成式AI 2024-07-17 人工智能

836阅读

AIGC详解

AIGC（AI-Generated Content）指的是利用人工智能技术自动生成内容，包括文本、图像、音频、视频等。AIGC技术近年来迅猛发展，已经在多个领域取得了显著的成果。什么是AIGC AIGC，即人工智能生成内容，是指通过人工智能技术生成...

大数据 2024-07-17 人工智能

2265阅读

AI成龙虽被群嘲，但未来AI依然可能取代演员

电影《传说》顶着成龙的名号，上映7天票房却只有7279万，豆瓣评分更是低至5.4，延续了成龙近些年来的烂片成绩。而27岁的AI成龙，这个曾经被片方当作噱头来吸引观众入场的技术亮点，也成为了劝退观众和影响电影观感的最大硬伤。据传在《传说》中，27岁的AI成...

生成式AI 2024-07-17 人工智能

1244阅读

2024最新AI创作系统，ChatGPT商业运营系统，AI绘画系统源码，AI视频生成系统，AI智能体、文档分析、多模态模型一站式AIGC解决方案

一、人工智能人工智能技术正在迅速发展，AI语言模型、AI绘画、AI视频在多个领域都有广泛的应用。它们不仅在科技创新方面表现出色，还在艺术创作、内容生产和商业应用中展现出巨大的潜力。 AI语言模型可以用于自动化内容生成、智能客服、文本翻译等方面，大大...

AIGC 2024-07-17 人工智能

1058阅读

解密中国首个“音乐版Sora” | 中国AIGC产业峰会

编辑部发自 AIGC峰会量子位 | 公众号 QbitAI 文生图、文生音频、文生视频、AI搜索引擎……大模型在多模态的进程可谓是愈演愈烈。而聚焦在国内，有这么一家公司在AIGC大热潮的前后，单是“首个”就占了四席：发布中国首个开源...

生成式AI 2024-07-17 人工智能

902阅读

【AIGC-图片生成视频系列-7】MoonShot：实现多模态条件下的可控视频生成和编辑

目录一. 贡献概述二. 方法详解编辑三. Zero-Shot主题定制视频生成四. 文本到视频生成五. 直接使用图像ControlNet 六. 图像动画比较七. 视频编辑八. 针对视频生成中多模态 Cross-Attn的消融实...

人工智能 2024-07-16 人工智能

1178阅读

【大模型能力分水岭数学考试，文心一言超gpt4o排名第一】

文末有福利！ 2024年全国高考成绩陆续放榜，各位考生的成绩怎么样？在本次考试中还有几位特殊的考生——国内外知名的9个AI大模型也“参与”了本次高考，它们的成绩可谓也是“几家欢喜，几家愁”。以河北省录取分数线（文科一本线：521分，理科一本线：...

生成式AI 2024-07-16 人工智能

1428阅读

京东广告研发——AIGC在京东广告创意的技术应用

一、前言电商广告图片不仅能够抓住消费者的眼球，还可以传递品牌核心价值和故事，建立起与消费者之间的情感联系。然而现有的广告图片大多依赖人工制作，存在效率和成本的限制。尽管最近AIGC技术取得了卓越的进展，但其在广告图片的应用还存在缺乏卖点信息、难以规模...

大数据 2024-07-15 人工智能

926阅读

【AIGC调研系列】InternVL开源多模态模型与GPT-4V的性能对比

InternVL和GPT-4V都是多模态模型，但它们在性能、参数量以及应用领域上有所不同。 InternVL是一个开源的多模态模型，其参数量为60亿，覆盖了图像/视频分类、检索等关键任务，并在32个视觉-语言基准测试中展现了卓越性能[2]。InternV...

大数据 2024-07-15 人工智能

1673阅读

[AI 大模型] 百度文心一言

文章目录 [AI 大模型] 百度文心一言简介模型架构发展新技术和优势 API 代码示例 [AI 大模型] 百度文心一言 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0DwAIh0...

AIGC 2024-07-14 人工智能

1077阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果...

鱼羊明敏发自凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与...

AIGC 2024-07-13 人工智能

926阅读

Llama 3 与 GPT-4：哪个更好？

Llama 3 和 GPT-4 是目前公开可用的两种最先进的大型语言模型（LLM）。让我们通过比较这两个模型的多模态性、上下文长度、性能和成本，来看看哪个 LLM 更好。什么是 GPT-4？ GPT-4 是 OpenAI 开发的最新大型语言模型（...

生成式AI 2024-07-12 人工智能

1353阅读

深入探索Stable Diffusion：从原理到应用的全面解析

目录一 Stable Diffusion的基本概念什么是Stable Diffusion？ Stable Diffusion与传统生成模型的区别二 Stable Diffusion的理论基础扩散过程的数学描述马尔可夫链蒙特卡罗方法（M...

生成式AI 2024-07-12 人工智能

1056阅读

AIGC底层技术介绍

1.AIGC概述 AIGC，全称Artificial Intelligence Generated Content，即人工智能生成内容。这是一种新兴的人工智能技术，其核心思想是利用人工智能模型，根据给定的主题、关键词、格式、风格等条件，自动生成各种类型...

大数据 2024-07-12 人工智能

942阅读

在stable diffusion中如何分辨lora、大模型、controlnet

LoRA (LowRank Adaptation Stable Diffusion LoRA 是微软的研究人员为了解决大语言模型微调而开发的一项技术,它是一个多模态语言-图像模型，LORA 可以学习将其语言表征迁移到图像 modal 中从而获得跨模态...

人工智能 2024-07-11 人工智能

979阅读

【AIGC半月报】AIGC大模型启元：2024.06（下）

AIGC大模型启元：2024.06（下） (1 Gen-3 (2 Open-Sora 1.2（Open-Sora再升级） (3 Claude 3.5 Sonnet（Claude升级） (4 ChatTTS v3（ChatTTS升级） (...

AIGC 2024-07-11 人工智能

952阅读

国内 10 款主流语言大模型综合能力测评包括文心一言、Kimi、豆包

很多国产的语言大模型在语言运用能力方面表现出色，特别是在特殊的语境中。测评中的语言大模型包括了：阿里的通义千问。其表现最为突出，被作者称为"吵架Top AI"，不仅能生成尖锐、刻薄的回复，还能创造图像内容，展现了强大的多模态能力。商汤的商量模型虽然...

大数据 2024-07-11 人工智能

1335阅读

全能大模型AIGC产品的体验与未来展望

目录前言 1 使用体验分享 1.1 字节豆包 1.2 百度文心一言 1.3 阿里通义千问 1.4 腾讯元宝 2 大模型产品的对比与选择 2.1 产品功能对比 2.2 使用成本与便捷性 2.3 安全性与隐私保护 3 大模型产品的未来发展...

大数据 2024-07-11 人工智能

1544阅读

这届AI厂家，同质下同焦虑

这届WAIC世界人工智能大会上，每家AI企业似乎都找了自己的PMF（产品市场契合点）。 2023年是国产大模型元年，腾讯、字节、百度等众多大模型进入市场，正式开启对外服务，月之暗面、智谱AI等创业公司也形成“五小虎”的格局。迭代发展一年后，大模型选手们都已...

大数据 2024-07-11 人工智能

856阅读

全球AI大事记·疯狂三月盘点：9万亿AIGC时代即将到来

刚刚过去的2024年3月，OpenAI最强人工智能（AI）大模型GPT-4发布了一周年，对于生成式 AI 的热度只增不减。过去一个月内，OpenAI、谷歌、微软、英伟达、阿里等多家国内外大科技公司均发布多个关于 AI 的重要消息，动作不断，全球最强...

AIGC 2024-07-11 人工智能

1030阅读

AI大模型排排坐——通义千问、文心一言、讯飞大模型使用体验

目前，通义千问、文心一言和讯飞大模型是较为受欢迎的AI模型，它们在使用方面各有区别和优劣势。以下是笔者近期使用三个模型的一点浅见: 一、通义千问优势：丰富的知识库：通义千问拥有庞大的知识库，能够为用户提供广泛的信息支持。高效的检索能力：...

大数据 2024-07-11 人工智能

1084阅读

LLaMA-Adapter：零初始注意机制的语言模型高效微调

23年6月来自上海AI实验室，香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...

生成式AI 2024-07-10 人工智能

1210阅读

AIGC内容分享(一)：一次性搞懂什么是AIGC

目录前言一、基本概念/理论 1、AI 2、AI大模型 3、开源 4、自然语言处理（NLP） 5、AIGC 6、AIGC和Chat GPT的关系 7、AIGC可以生成的内容二、常见的AIGC应用（一）常用AIGC软件（二）A...

AIGC 2024-07-10 人工智能

1201阅读

文心一言对GPT-4o的评价与分析

在人工智能的浪潮中，大型语言模型（LLM）的发展日新月异，为自然语言处理（NLP）领域带来了诸多突破。GPT系列模型作为其中的佼佼者，其每一次更新都牵动着业界的目光。近日，GPT-4o的发布更是引发了广泛的讨论。本文将从文心一言的视角出发，对GPT-4o进...

大数据 2024-07-10 人工智能

836阅读

【AIGC评测体系】大模型评测指标集

大模型评测指标集（☆）SuperCLUE （1）SuperCLUE-V（中文原生多模态理解测评基准）（2）SuperCLUE-Auto（汽车大模型测评基准）（3）AIGVBench-T2V（文生视频基准测评）（4）SuperCLUE-C...

大数据 2024-07-09 人工智能

1239阅读

混元单日调用tokens达千亿后，腾讯大模型战略露出全貌

大模型之争，到了不只是拼技术的时刻。最新的行业风向是:谁能大范围应用落地?谁能笑到最后?谁能真正产生价值? 对大模型行业玩家的评判标准也不再只看技术。战略布局、落地进展、未来判断……成为了更被重视的维度。无论“杨植麟们”还是大厂高管，公开探讨大模型的频...

生成式AI 2024-07-09 人工智能

953阅读

对标GPT-4 Turbo！OpenAI断供后科大讯飞星火API调用量大增

快科技7月8日消息，今年6月，OpenA宣布终止对中国提供API服务，有业内人士分析，这将打击部分借助OpenAI大模型套壳创业的公司。日前，有投资者在互动平台向科大讯飞提问：OpenAI关停中国地区的API服务，讯飞火星有承接OpenAI国内用户的AP...

AIGC 2024-07-09 人工智能

953阅读

互联网十万个为什么之什么是AIGC？

AIGC（Artificial Intelligence Generated Content）即人工智能生成内容，即人工智能通过学习大量的数据，来实现自动生成各种内容，如文本、图像、音频、视频等，是继专家生产内容（PGC, Professional Gen...

大数据 2024-07-08 人工智能

810阅读

国产大模型 WAIC 竞技：大厂拼落地，中厂显焦虑

如果想要度量国产大模型大小厂商的实力，WAIC（世界人工智能大会）是一个不错的切口。众所周知，2023年是国产大模型元年，在去年的 WAIC 之后，腾讯发布混元大模型，字节跳动上线豆包 APP，而后通过豆包大模型正式开启对外服务，年轻的月之暗面、Mini...

人工智能 2024-07-08 人工智能

919阅读

千呼万唤的可灵网页版来了！基础模型重磅升级，新功能“炸场”WAIC

“这可能是本届WAIC上欢呼声最多的一场发布” 在刚刚闭幕的世界人工智能大会（WAIC）上，快手晒出了可灵发布一个月以来的成绩单: “超50万人申请，已开放给超30万用户使用，生成超700万条短视频。” 作为全球首个用户可用的真实影像级视频生成大模型，可灵...

生成式AI 2024-07-08 人工智能

891阅读

AI+视频 | Nvidia 投资的AI公司，通过视频理解开创感知推理，获顶级风投5000万美元融资

在每天刷视频的时代，我们如何快速创作360度全方位理解的视频内容? Twelve Labs，一家旧金山初创公司，是由一支年轻的工程师团队Jae Lee 和 Aiden L 创立，该产品可在视频中提取特定视频瞬间，包括视觉、音频、文本和上下文信息，以实现语义...

生成式AI 2024-07-08 人工智能

1248阅读

达摩院发布一站式AI视频创作平台“寻光”，打造全新AI工作流

今年是 AI 视频生成爆发的元年，以 Sora 为代表的算法模型和产品应用不断涌现。短短几个月内，我们目睹了几十种视频生成工具的问世，基于 AI 的视频创作方式开始流行起来。但新技术也引发更多的挑战与质疑，除了大家熟知的 “开盲盒”现象，AI 所生成的视...

AIGC 2024-07-08 人工智能

928阅读

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

【新智元导读】ChatGPT能耗惊人，该怎么解?谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电，相当于1.7万个美国家庭的用电量! 然...

AIGC 2024-07-07 人工智能

956阅读

LLaMA-Cult-and-More：深度学习的新里程碑

LLaMA-Cult-and-More：深度学习的新里程碑在人工智能领域，尤其是自然语言处理（NLP）中，模型的规模和能力不断提升，推动了行业的飞速进步。今天我们要介绍的是一个名为LLaMA的开源项目，它由shm007g开发并维护，旨在提供高效的、大规...

人工智能 2024-07-07 人工智能

877阅读

10款AI绘画工具介绍，让你的绘画变得更简单

AI绘画工具是利用人工智能技术进行绘画创作的工具，近年来随着人工智能技术的发展，AI绘画已经成为一个独立的领域，并且在艺术、设计等多个领域得到了广泛应用。以下是一些常见的AI绘画工具介绍： 1：Stable-Diffusion（SD）/ SDXL1.0...

AIGC 2024-07-06 人工智能

1642阅读

推荐大模型书籍|《从ChatGPT到AIGC：智能创作与应用赋能》

自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知...

人工智能 2024-07-06 人工智能

1044阅读

AI视频创作一条龙！达摩院“寻光”平台炸场WAIC，突破可控编辑难题

AIGC时代，视频创作这事儿真的不一样了。就像这样，轻轻一圈，选定目标立刻变身单独图层，再丝滑嵌入不同的背景视频，场景变换so easy~ 想要调整一下镜头角度，交给AI，同样能一键完成: 还能一键消除、修改目标: 后期再也不用加班加到手抽筋（d...

大数据 2024-07-05 人工智能

831阅读

中国版GPT-4o炸场：国内首个流式多模态交互模型，现场实时且丝滑

没等到GPT-4o，商汤先把《Her》给发布出来了! 就在刚刚，商汤直接在现场来了个炸裂的Live Show，话不多说，直接看效果: 不仅声音非常拟人（观众直呼好磁性），而且还是实时、随时可以打断的那种! 它宛如被安上了一对儿眼睛，可以做到精准无误的所见...

生成式AI 2024-07-05 人工智能

988阅读

AI日报：百度文心4.0免费开放；AI lab开源超强多模态大模型；对标GPT-4o！商汤发布日日新5o

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、百度文心智能体平台免费开放文心...

大数据 2024-07-05 人工智能

882阅读

一文看懂LLaMA 2：大型多模态模型的新里程碑

一文看懂LLaMA 2：大型多模态模型的新里程碑 LLaMA 2是OpenAI继GPT-3之后推出的又一重磅模型，它不仅在文本生成方面有所突破，而且在图像处理和语音识别等领域也展现出了令人印象深刻的能力。本文将全面介绍LLaMA 2的背景、技术细节、应用...

大数据 2024-07-05 人工智能

863阅读

拥抱 AGI：PieDataCS 引领云原生数据计算系统新范式

自2023年后，人工智能技术进入了一个更为成熟和广泛应用的阶段，人工通用智能（AGI）这一概念也成为了科技界和产业界热议的焦点。本文将结合 AGI 时代背景，从架构设计到落地实践，详细介绍拓数派云原生数据计算系统 PieDataCS。 1 中国...

生成式AI 2024-07-05 人工智能

945阅读

一键部署LLaMA 3 Chinese Chat，含中文训练数据集；Food2K数据集下载，含2千类别，100万张图片...

前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把，但它对纯中文的支持不是很好，不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线了 Llama 3 中文版——LlaMA 3 Chinese Chat 的部...

生成式AI 2024-07-05 人工智能

909阅读

视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等

VideoChat VideoChat?: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...

人工智能 2024-07-04 人工智能

1076阅读