-
Stable Diffusion【二次元模型】:最强扁平化风格大模型一键生成插画风格
大家好,我是安琪!!! 二次元世界,以其独特的魅力,吸引了无数艺术爱好者和动漫迷。如今,借助Stable Diffusion的二次元模型,你只需一键操作,就能轻松实现扁平化风格的插画创作。本文将带你深入了解Stable Diffusion二次元模型的使用...
-
自回归模型胜过扩散模型:用于可扩展图像生成的 Llama
📜 文献卡 Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation 作者: Peize Sun; Yi Jiang; Shoufa Chen; Shil...
-
stable diffusion 插件篇(1)
前言: 首先要讲解的第一个超强插件是controlnet,跟着一起学习的小伙伴应该知道,如果仅是仅凭文生图或者是图生图的功能,想要生成的图片如自己所愿是比较有困难的,但是在sd里面,插件controlnet是可以做到帮助我们控制生图的,并且掌握contr...
-
Stable Diffusion【Pony模型】:C站广受欢迎的底层大模型
大家好,我是安琪 Stable Diffusion,一款基于深度学习的图像生成模型,以其强大的图像生成能力和个性化风格迁移能力,在艺术创作领域掀起了一场革命。而Pony模型,作为Stable Diffusion的底层大模型,更是备受C站用户的喜爱。本文将...
-
iPhone 15 Pro首发尝鲜!Apple Intelligence即将登场:苹果杀入AI领域
快科技7月25日消息,截至目前,iOS 18已经更新至Beta 4版本,但苹果还没有推送Apple Intelligence个人智能化系统。 对此,苹果表示,今年夏天Apple Intelligencey会在iOS 18测试版中上线。 消息称苹果会在8月底...
-
【三维AIGC】扩散模型LDM辅助3D Gaussian重建三维场景
标题:《Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models》 来源:Glasgow大学;爱丁堡大学 连接:https://arxiv.org/abs/2406.13099...
-
AIGC 原理与代码实例讲解
AIGC 原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 随着人工智能技术的快速发展,生成式AI成为了科技界的一大热点。在众多生成技术中,AIGC(Artificial Intelligence for Generation and Crea...
-
Stable Diffusion 3 论文及源码概览
天才程序员周弈帆 2024年07月13日 23:30 近期,最受开源社区欢迎的文生图模型 Stable Diffusion 的最新版本 Stable Diffusion 3 开放了源码和模型参数。开发者宣称,Stable Diffusion 3 使用了...
-
AI日报:性能超GPT-4o!Meta4050亿参数开源模型Llama3.1遭泄漏;Stability AI开源音频生成模型Stable Audio Open
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、震惊AI界!Llama 3.1...
-
AIGC:人工智能生成内容的深度探索
目录 引言 技术基石:AIGC背后的力量 第一节:自然语言处理(NLP ——文字的智慧编织者 第二节:计算机视觉(CV ——计算机视觉 第三节:深度学习与神经网络——智能创造的引擎 第四节:生成对抗网络(GANs 思考 引言 ...
-
Llama也能做图像生成?文生图模型已开源
导读 基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型,证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成?文生图模型已开源...
-
Stable Diffusion原理与代码实例讲解
Stable Diffusion原理与代码实例讲解 1. 背景介绍 1.1 问题的由来 在图像处理和生成领域,扩散模型(Diffusion Models)作为一种新型的生成模型,逐渐成为了研究热点。这类模型通过模拟真实世界的物理扩散过程,为生成高质量...
-
Stable Diffusion 秋叶整合包v4.7 :解压即用,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡,来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Sta...
-
每日AIGC最新进展(45):字节跳动开源大规模text-to-video数据集OpenVid-1M、浙江大学提出锚定条件控制视频生成GVDIFF、Meta AI研究院提出文生3D大模型3DGen
Diffusion Models专栏文章汇总:入门与实战 OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation https://nju-pcalab....
-
每日AIGC最新进展(42):首尔国立大学提出解耦运动建模视频插帧方法MoMo、维也纳工业大学提出减少3D高斯内存占用方法、哈索普拉特纳研究所提出改进 CLIP 中跨模式对齐的方法AlignCLIP
Diffusion Models专栏文章汇总:入门与实战 Disentangled Motion Modeling for Video Frame Interpolation 本文提出了一种新的视频帧插值(VFI 方法,名为MoMo,它通过解耦...
-
每日AIGC最新进展(33):小米提出单步扩散模型SDXS、阿米蒂大学提出加速SD的统一模块LCM-LORA、国立台湾大学提出生成QR二维码的扩散模型
Diffusion Models专栏文章汇总:入门与实战 SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions 本文介绍了一种名为SDXS的新型实时一步潜在...
-
探索AI绘画的艺术!盘点全球8款顶尖AI绘画工具,开启您的创作之旅
AI绘画的艺术奥秘! AI绘画艺术,是通过人工智能的强大力量实现的创作方式。它基于深度学习算法,从海量的艺术作品和图像中汲取灵感,进行分析和学习。接着,借助生成模型——例如著名的GAN(生成对抗网络)——AI能够根据用户的指导,创造出既新颖又独特的艺术作...
-
【AIGC调研系列】AIGC赋能测试用例生成的案例
基于功能需求规格说明的测试用例自动生成方法研究表明,传统的测试用例生成方法存在一些局限性,如需要额外的建模成本和缺少测试输入数据等问题[2]。这为AIGC在测试用例生成中的应用提供了背景。AIGC技术,特别是像ChatGPT这样的模型,能够理解和生成自然语...
-
AIGC各个应用场景下的模型选择
需要注意的是,下述模型可以在不同任务和领域中灵活应用,它们的归属也会根据模型的设计和主要应用领域而有所变化,并不绝对。 自然语言处理模型 模型层中自然语言理解(Natural LanguageUnderstanding,NLU 和自然语言生成(N...
-
AI生成视频,究竟有多癫狂?
最近,各路视频生成AI放出的Demo让人眼花缭乱。“容嬷嬷喂紫薇吃香肠”“唐僧啃鸡腿、吃汉堡”“尔康失态”等“名场面”在各大短视频平台广为流传。 “刺激”的点在于,网友们无法预料一些经典的影视画面下一秒会衍生出什么剧情,也正因为如此,AI视频爆改在推出短短...
-
【AIGC-图片生成视频系列-7】MoonShot:实现多模态条件下的可控视频生成和编辑
目录 一. 贡献概述 二. 方法详解编辑 三. Zero-Shot主题定制视频生成 四. 文本到视频生成 五. 直接使用图像ControlNet 六. 图像动画比较 七. 视频编辑 八. 针对视频生成中多模态 Cross-Attn的消融实...
-
Diffusion【1】:SDSeg——基于Stable Diffusion的单步扩散分割!
文章目录 前言 Abstract Introduction Methods Latent Estimation Concatenate Latent Fusion Trainable Vision Encoder Experiment D...
-
ShowMeAI | 字节AIGC模型&工具大清单;AI解梦靠谱吗?AI MV制作手册;一文看懂MoE混合专家大模型;DeepSeek发布全球最强开源MoE模型
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 1. 字节跳动生成式AI布局:卷到飞起的「App 工厂」这局也有点稳了? 字节最近有点猛啊!出圈的AI产品越来越多,迭代速度肉眼可见的快,「App 工厂」...
-
Stable Diffusion 3架构解析
在台湾举办的台北国际电脑展上,Stability AI CTO 兼联合 CEO Christian Laforte 与 AMD CEO 苏姿丰一起宣布文本到图像生成模型 Stable Diffusion 3 将于 6 月 12 日开源。 一、扩散模型的...
-
AIGC从入门到实战:安装权重文件和 LoRa 模型文件
1. 背景介绍 1.1 AIGC 的兴起与发展 近年来,人工智能生成内容(AIGC)技术取得了显著的进步,其应用范围也日益广泛,涵盖了图像生成、文本创作、音频合成、视频制作等众多领域。AIGC 的兴起得益于深度学习技术的突破,特别是生成对抗网络(GAN...
-
如何“正确“使用Stable Diffusion?文本到图像扩散模型中记忆化实用分析(浙大)
论文链接:https://arxiv.org/pdf/2405.05846 它能被生成吗?文本到图像扩散模型中记忆化的实用分析 过去几年见证了由扩散模型驱动的文本引导图像生成领域的重大进展。然而,已经显示出文本到图像扩散模型容易受到训练图像记忆的影响,引发...
-
深入探索Stable Diffusion:从原理到应用的全面解析
目录 一 Stable Diffusion的基本概念 什么是Stable Diffusion? Stable Diffusion与传统生成模型的区别 二 Stable Diffusion的理论基础 扩散过程的数学描述 马尔可夫链蒙特卡罗方法(M...
-
Sora AIGC 介绍
Sora的概念介绍: 近年来,AI、大模型相关领域的发展可谓是一天一个脚印,一步一个台阶。从语音识别文字开始,再到chatgpt3、chatgpt4文字互动工具,以及midjourney等AI成图工具,再到现在的vison pro等VR交互设备和今天我们...
-
Stable Diffusion:最全详细图解
Stable Diffusion,作为一种革命性的图像生成模型,自发布以来便因其卓越的生成质量和高效的计算性能而受到广泛关注。不同于以往的生成模型,Stable Diffusion在生成图像的过程中,采用了独特的扩散过程,结合深度学习技术,实现了从噪声到清...
-
70万人争先体验!视频生成新王者「可灵AI」又双叒升级了
难不成,AI 生成短剧时代真的要来了? 最近,各路视频生成 AI 放出的 Demo 让人眼花缭乱。从玩梗图、拼长度再到讲究真实物理逻辑,层出不穷的人工智能创意难分高下,个个都要跟 Sora 试比高。这时候,突然有人偷偷先行一步,搞出了「电影级」的表现: 从...
-
AI日报:快手上线可灵网页端并开源可图Kolors;达摩院AI视频平台“寻光”炸场;月之暗面推Kimi浏览器插件
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、可灵AI又放大招:上线Web端...
-
千呼万唤的可灵网页版来了!基础模型重磅升级,新功能“炸场”WAIC
“这可能是本届WAIC上欢呼声最多的一场发布” 在刚刚闭幕的世界人工智能大会(WAIC)上,快手晒出了可灵发布一个月以来的成绩单: “超50万人申请,已开放给超30万用户使用,生成超700万条短视频。” 作为全球首个用户可用的真实影像级视频生成大模型,可灵...
-
Stable Diffusion 3 开源发布可下载体验
本文来自huggingface翻译 Stable Diffusion 3 Medium是一种多模态扩散变换器 (MMDiT 文本到图像模型,其在图像质量、排版、复杂提示理解和资源效率方面的性能有极大提升。 有关更多技术细节,请参阅研究论文。 请注意:此...
-
AIGC:生成式模型简介
AIGC:生成式模型简介 变分自编码器(VAE) 生成对抗网络(GAN) 自回归模型(Autoregressive Model) 流模型(Flow Model) 扩散模型(Diffusion Model) 此博客将从原理、优点和缺点几...
-
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题
AIGC时代,视频创作这事儿真的不一样了。 就像这样,轻轻一圈,选定目标立刻变身单独图层,再丝滑嵌入不同的背景视频,场景变换so easy~ 想要调整一下镜头角度,交给AI,同样能一键完成: 还能一键消除、修改目标: 后期再也不用加班加到手抽筋(d...
-
「创意无界,智领未来」:解锁AIGC技术的无限潜能与行业重塑力
文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深度...
-
文献研读|AIGC溯源场景及研究进展
前言:本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。 相关文章:针对文生图模型的AIGC检测论文研读,参见此篇文章。 如下图所示,在AIGC生成阶段,有4种溯源场景: 1)生成模型溯源训练数据 2)微调模型溯源预训练模型 3)AI...
-
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了? 一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石 Gem 同台对唱《从军行》。 「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情: 这场表演背后的...
-
AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读
Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文!受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。 在...
-
李彦宏大手笔布局AI短剧:百度数百万美元投资井英科技
快科技7月3日消息,CreativeFitting(井英科技)近日宣布完成由百度集团投资的数百万美元Pre-A 轮融资。 据了解,井英科技一家专注于AIGC视频生成模型自主研发的公司,计划利用这笔资金进一步升级其AI视频模型和工具,加强内容生态系统的构建。...
-
论文研读|针对文生图模型的AIGC检测
前言:人工智能生成内容的鉴别(AIGC检测)算是当前的研究热点之一,本篇文章介绍几篇针对文生图模型的 AIGC 检测相关工作。 相关文章:AIGC溯源相关研究详见此篇文章 目录 1. Towards Universal Fake...
-
每日AIGC最新进展(37):达姆施塔特工业大学提出分布式协作扩散模型CollaFuse、卡耐基梅隆大学提出扩散模型简易一致性调优方法、俄罗斯Yandex提出可逆一致性蒸馏
Diffusion Models专栏文章汇总:入门与实战 CollaFuse: Collaborative Diffusion Models CollaFuse是一种创新的分布式协作扩散模型,旨在解决传统图像生成模型在数据可用性、计算需求和隐私方面...
-
AI绘图软件midjourney的底层模型是什么?
生成式模型Midjourney如何工作: Midjourney 的底层模型是一个大型语言模型 (LLM ,它已经在海量图像和文本数据集上进行了训练。 能够生成既逼真又富有创意的图像。Midjourney 的一些优势包括:准确性、创造力、速度。 LLM...
-
天才程序员周弈帆 | Stable Diffusion 解读(二):论文精读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(二):论文精读 【小小题外话】端午安康! 在上一篇文章天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早...
-
Stable Diffusion 3 使用指南:安装与实例详解
Stable Diffusion 3 使用指南:安装与实例详解 Stable Diffusion 3(SD 3)终于来了!作为最新版本的图像生成模型,SD 3 在功能和性能上都有了显著提升。本文将带你深入了解 SD 3 的用法和安装指导,帮助你快速上手...
-
重磅发布!Stable Diffusion 3 Medium 终于开源,革新图像生成技术新时代
重磅发布!Stable Diffusion 3 Medium 终于开源,革新图像生成技术新时代 关键词:Stable Diffusion 3 Medium, MMDiT, 文本到图像模型, 图像质量, 排版, 复杂提示理解, 资源效率 原...
-
每日AIGC最新进展(29):复旦大学提出通过人类反馈来优化语音生成模型SpeechAlign、浙江大学提出跟踪3D空间中的任何2D像素SpatialTracker、西安交大提出动态场景的语义流
Diffusion Models专栏文章汇总:入门与实战 SpeechAlign: Aligning Speech Generation to Human Preferences 本文介绍了一种名为SpeechAlign的方法,旨在通过人类反馈...
-
腾讯混元文生图大模型开源训练代码,发布LoRA与ControlNet插件
6月21日,腾讯混元文生图大模型(以下简称为混元 DiT 模型)宣布全面开源训练代码,同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。 这意味着,全球的企业与个人开发者、创作者们,都可以基于混元 DiT 训练代...
-
Stable Diffusion模型训练 — 前菜
图像生成模型原理简析 你有没有好奇过,AI图像生成模型是怎么学会“绘画”的吗?人工智能(Artificial Iitelligence)这个概念是在1956年的达特矛斯会议上提出来的认为机器可以模仿人类的学习以及其他方面的智能,后世也将实现人工智能的方式...
-
大模型学习路线(9)——AIGC其它相关技术
前言: 博主没力气写了,快被csdn榨干了,这个章节就推几篇系统化的还不错的文章吧......AIGC技术相关的demo可以在HuggingFace、Modelscope、PaddlePaddle等各大社区找到。 AIGC技术和应...