-
每日AIGC最新进展(54):中科大提出Pose引导的图像生成模型、韩国科技学院提出发型控制模型、北大提出风格生成数据集CSGO
Diffusion Models专栏文章汇总:入门与实战 GRPose: Learning Graph Relations for Human Image Generation with Pose Priors 在过去的研究中,基于扩散模型的人...
-
深度剖析Google黑科技RB-Modulation:告别繁琐训练,拥抱无限创意生成和风格迁移!
给定单个参考图像,RB-Modulation提供了一个无需训练的即插即用解决方案,用于(a 风格化和(b 具有各种提示的内容样式组合,同时保持样本多样性和提示对齐。例如,给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ,RB...
-
AIGC入门(二)从零开始搭建Diffusion!(下)
上篇。https://blog.csdn.net/alxws/article/details/140058117?spm=1001.2014.3001.5502四、前向加噪过程(ForwardProcess.py) 当我们的去噪器设计完成后,接下来,就...
-
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程 stable-diffusion-webui-colabstable diffusion webui colab项目地址:https://gitco...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
【扩散模型(六)】Stable Diffusion 3 diffusers 源码详解1-推理代码-文本处理部分
系列文章目录 【扩散模型(一)】中介绍了 Stable Diffusion 可以被理解为重建分支(reconstruction branch)和条件分支(condition branch) 【扩散模型(二)】IP-Adapter 从条件分支的视角,快...
-
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit)
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit) stable-diffusion-webui-model-toolkit项目地址:https://gitcode.com/gh_mirrors/st/st...
-
Stable Diffusion Web UI基础入门之常用参数
在之前的文章中我们介绍了,Stable Diffusion的基础知识和使用工具———Stable Diffusion AI入门介绍。这篇文档带大家了解一下Stable Diffusion Web UI的常用参数,在日常绘图中如何使用。 我们知道在St...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
在 iPhone 15 Pro 上运行 Llama-3.1 8B;使用扩散模型生成类人绘画过程的工具;使用ChatGPT自动生成思维导图
✨ 1: MLX Examples 在 iPhone 15 Pro 上运行 Llama-3.1 8B 基于 MLX 机器学习推理框架轻松将 「Llama-3.1 8B」在 iPhone 15 Pro 上运行🤯 代码已开源! 地址:http...
-
精通 Stable Diffusion 调优秘籍
一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具,其调优具有至关重要的意义。通过合理的调优,可以显著提升图像生成的质量、速度和准确性,满足用户更加多样化和精细化的需求。 调优主要涵盖了...
-
Stable Diffusion 开源项目教程
Stable Diffusion 开源项目教程 stablediffusionHigh-Resolution Image Synthesis with Latent Diffusion Models项目地址:https://gitcode.com/gh...
-
GameNGen有哪些功能?谷歌游戏引擎AI模型怎么使用方法详细教程指南
GameNGen 是什么? GameNGen 是一个由神经模型驱动的前沿游戏引擎,专注于实现与复杂环境的实时互动,并在长时间的模拟中保持高质量图像。它能够以每秒超过 20 帧的速度高效模拟经典游戏《DOOM》,并且其下一帧预测的峰值信噪比(PSNR)达到...
-
5分钟 Stable Diffusion 本地安装
5分钟 Stable Diffusion 本地安装 5分钟 Stable Diffusion 本地安装 1. 引言 1.1 什么是Stable Diffusion? 1.2 本地安装的优势 2. 准备工作 2.1 系统要求 2.2 推荐...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 2 震惊!!!AI小白竟然用AI生成这种图片......
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一.问题的提...
-
3秒让AI变乖,生成风险图片减少30%!复旦新研究拿下扩散模型概念移除新SOTA|ECCV 2024
让AI绘画模型变“乖”,现在仅需3秒调整模型参数。 效果be like:生成的风险图片比以往最佳方法减少30%! 像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。 在移除裸露内容上,效果达到“只穿衣服,不改结构”。 这就是复旦大学提...
-
Midjourney地位不稳?AI绘图又一黑马出现,附4款产品一手实测
AI圈,再次开卷图像生成。 一连串进展扎堆: 8月21日,Ideogram正式推出2.0版本,声称文本渲染能力更强。 没错,就是那个成立于去年8月,由谷歌AI绘画4大牛集体离职创业的项目,曾获得过一众AI大佬投资。 此番Ideogram还公开叫板Flux,...
-
CVPR2024|Diffusion模型轻量化与计算效率优化
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做DDPM的下游任务实在是太难受了),所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化 的相关论文...
-
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
🔍在之前AIGC助力ResNet分类任务:跃升10个百分点-CSDN博客文章中,提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强,再进行分类任务,精度上升。 📕而今天要聊到的这篇论文更全面地探究了扩散模型...
-
DALL·E 2 模型实现与运行指南
DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...
-
AIGC从入门到实战:涌现:人工智能的应用
AIGC从入门到实战:涌现:人工智能的应用 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:AI生成内容、涌现现象、应用案例、技术挑战、未来展望 1. 背景介绍 1.1 问题...
-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task1
小白学习笔记,如有错误请各位大佬指正 一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...
-
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
文章链接: https://arxiv.org/pdf/2407.18290 亮点直击 概述了视觉生成领域中的各种问题。 这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。 本文旨...
-
ECCV2024中有哪些值得关注的扩散模型相关的工作?
Diffusion Models专栏文章汇总:入门与实战 The Fabrication of Reality and Fantasy: Scene Generation with LLM-Assisted Prompt Interpretation...
-
stable diffusion--小白学习步骤
1.看一下Unet网络的讲解_哔哩哔哩_bilibili,了解Unet网络 2.看一下【生成式AI】Diffusion Model 原理剖析 (1/4 _哔哩哔哩_bilibili,起码要看前3/6个视频 3.看一下超详细的扩散模型(Diffusion...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1
一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识 文生图主要以SD系列基础模型为主,以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...
-
干货!Stable Diffusion 从入门到精通之提示词手册
前言 超级干货来了,我们耗费大量时间精力整理编写的Stable Diffusion提示词手册正式公开!Stable Diffusion 和提示词介绍 Stable Diffusion 是一种开源的基于文本的图像生成模型,可以根据任何文本输入生成逼...
-
人类还在怕鬼,AI已经开始害怕自己了。
昨天中元节,我本来一直打算做一个关于中式恐怖的视频,来呼应一下这个节日氛围。 带着这个想法,我开始在网上搜寻灵感。 然而,我在B站上看到的一个视频彻底改变了我的计划。 这个视频,是这样的,来自B站UP主@明天的心声-,名字叫做:《随手拍的一张医院走廊的照片...
-
面完 AIGC 大模型算法岗,心态崩了。。。
大家好,今天我们继续聊聊 AI 科技圈发生的那些事。 内容包括:AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化!Meta 推新一代SAM 2 官方链接:https://ai.meta.com/blog/se...
-
magic-animate_pytorch AIGC使图像中人物按照给定动作动起来
magic-animate 论文 MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model https://arxiv.org/pdf/2311.1...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
【论文+中文文生图】Kolors:快手可图绘画模型实测(24.07.06开源)
代码:https://github.com/Kwai-Kolors/Kolors | 权重 论文原文:Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Imag...
-
ComfyUI系列教程(1)--Stable Diffusion基本原理
1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍 文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示,主要包括3个部分。其中1是CLIP图像文本对,将图...
-
Stable Diffusion是什么?
目录 一、Stable Diffusion是什么? 二、Stable Diffusion的基本原理 三、Stable Diffusion有哪些运用领域? 一、Stable Diffusion是什么? Stable Diff...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 Task01笔记
第一次任务比较简单,只需要配置好环境,简单运行一次 项目背景 赛题任务 可图Kolors-LoRA风格故事挑战赛 1.参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格........
-
FLUX | 超越SD3、媲美Midjourney的顶级AI绘图模型
本文包含大量AI干货 阅读完大约需要8分钟 1.引言 在过去的两年中,第一个公开发布且功能齐全的图像合成模型 Stable Diffusion 完全占据了主导地位,一大批竞争对手(PixArt Alpha/Sigma/AuraFlow)试图效仿S...
-
AI绘画:艺术与科技融合的新篇章
随着人工智能(AI)技术的飞速发展,AI绘画作为一种新兴的艺术形式,正逐步改变着传统艺术创作的格局。从早期的简单模仿到如今的个性化创作,AI绘画不仅提升了艺术创作的效率和质量,还开辟了全新的应用场景和商业模式。本文将深入探讨AI绘画的发展历程和现状、技术...
-
AIGC-ToonCrafter: Generative Cartoon Interpolation-CVPR2024
论文:https://arxiv.org/pdf/2405.17933 代码:https://doubiiu.github.io/projects/ToonCrafter 给定首尾帧,生成逼真生动的动画,动画插值生成 MOTIVATION T...
-
【SD3】发布,送你3个ComfyUI工作流,轻松搞定AI绘画
这几天AI绘画界最轰动的消息莫过于Stable Diffusion 3(简称SD3)的发布。SD3是一个多模态的 Diffusion Transformer 模型,其在图像质量、排版、复杂提示理解和资源效率方面具有显著提升。 废话不多说,先给大家看看我使...
-
Datawhale X 魔搭 AI夏令营-AIGC方向 task01笔记
目录 文生图技术的相关知识储备 SD结构图 种子 提示词 生成过程简单介绍 接下来开始随教程操作 Ⅰ开通阿里云PAI-DSW试用 Ⅱ在魔搭社区进行授权 Ⅲ报名“可图Kolors-LoRA风格故事挑战赛 Ⅳ在魔搭社区创建PAI实例编辑...
-
Datawhale X 魔搭 AI夏令营第四期AIGC文生图方向Task1笔记
目录 前置知识 生成对抗网络(GAN) 大规模预训练模型 LoRA baseline一站式实现过程 下载baseline文件 安装环境,然后重启kernel 调整prompt 总结 前置知识 指导手册里写得很详细,这里写一...
-
Stable Diffusion系列课程二:ControlNet
AUTOMATIC1111/stable-diffusion-webui 参考B站Nenly视频《零基础学会Stable Diffusion》、视频课件 推荐网站:stable-diffusion-art、Civitai(魔法) 、libilibi、AI...
-
超算互联网-Stable Diffusion 2.1文生图教程
一、名词简介 1. 超算互联网 超算互联网是一种基于云计算的高性能计算平台,用户可以通过互联网接入超级计算资源。它集成了大量的计算节点,提供强大的计算能力,适用于科学计算、深度学习、人工智能等领域。用户可以利用超算互联网平台运行复杂的模型和算法,显...
-
【Datawhale AI夏令营第四期】魔搭-AIGC方向 Task01笔记
报名参加了和鲸的AI夏令营,出于任务要求,也出于我一贯的学习习惯,写篇笔记记录一下自己学习过程中遇到的困难,和积累的资源、经验等。 课程链接: https://space.bilibili.com/1069874770/channel/collect...
-
AIGC前沿 | LivePortrait
0. 资源链接 论文超链接: LivePortrait 项目: https://github.com/KwaiVGI/LivePortrait 1. 背景动机 现有AIGC存在的问题 随着智能手机和其他录制设备的普及,人们越来越频繁地...
-
SD原班人马发布FLUX.1:打开AI绘画新世界
Black Forest Labs 旗下产品 AI 绘画工具如雨后春笋般涌现,让我们对创作的理解不断刷新。就在大家以为已经见识了 AI 绘画的天花板时,FLUX.1 出现了!这款由 Black Forest Labs 推出的 AI 绘画...