-
在modelscope(魔塔)部署自己的Stable-Diffusion-WebUI并实现网络穿透,可外部调用
一、注册并登陆modelscope平台 modelscope账号的注册这里就不做过多的介绍,大家可以自行搜索完成账号注册及实名认证,领取免费GPU算力; 登陆后按下图指示依次点击选择对应配置,最后点击‘启动’开启并进入服务器...
-
天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源码解读(篇幅略长,建议收藏!)
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(三):原版实现源码解读 天才程序员周弈帆 | Stable Diffusion 解读(一):回顾早期工作-CSDN博客 天才程序...
-
每日AIGC最新进展(46):上海AI Lab发布多模态大模型InternLM-XComposer-2.5、阿里发布视频生成大模型EasyAnimate-V3、快手发布人像模型LivePortrait
Diffusion Models专栏文章汇总:入门与实战 InternLM-XComposer-2.5: A Versatile Large Vision Language Model Supporting Long-Contextual Input...
-
【AIGC绘画】Midjourney关键词分享(三):构图/视角关键词
前言 Midjourney构图和视角关键词的作用在于帮助我们在创作过程中更好地规划和实现视觉作品。 一、Midjourney构图和视角关键词的作用 1. 构图技巧 (Composition Techniques 引导视觉焦...
-
天才程序员周弈帆 | Stable Diffusion 解读(四):Diffusers实现源码解读
本文来源公众号“天才程序员周弈帆”,仅用于学术分享,侵权删,干货满满。 原文链接:Stable Diffusion 解读(四):Diffusers实现源码解读 接上一篇文章[天才程序员周弈帆 | Stable Diffusion 解读(三):原版实现源...
-
Llama-factory源码详细解读
微调 采用逐行调试的方法,细节来看SFT代码 AutoModelForCausalLM...
-
传知代码-Llama 2:开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)
代码以及视频讲解 本文所涉及所有资源均在传知代码平台可获取 本文概述 本文首先会介绍一下Llama2大模型,然后会使用一个公开的中文法律判决数据集(部分)进行Llama2提示学习的分类实战。 论文主要内容 这篇文章介绍了Llama 2,这是...
-
Midjourney画图关键词-最详细的拍摄视角关键词
在Midjourney画图中,拍摄视角关键词可以指导AI从特定的角度来构建画面,每种视角都能带来不同的视觉效果和感受。以下是一些常见的拍摄视角及其效果的解释: 1. **鸟瞰视角(Bird's-eye View)**:从高处向下看,像鸟儿飞翔在空中一样。...
-
掌握Midjourney视觉艺术的关键提示词指南
在数字艺术的海洋中,Midjourney以其独特的图像生成能力脱颖而出,为艺术家和创意工作者提供了前所未有的创造自由。要真正掌握这一工具,理解并有效使用各种提示词至关重要。本文将深入探索Midjourney中的“风格关键词”、“场景关键词”、“视觉关键词”...
-
Stable Diffusion XL网络结构-超详细原创
强烈推荐先看本人的这篇 Stable Diffusion1.5网络结构-超详细原创-CSDN博客 1 Unet 1.1 详细整体结构 1.2 缩小版整体结构 以生成图像1024x1024为例,与SD1.5的3个CrossAttnDownBlo...
-
stable diffusion 1.x 模型训练概述
本文主要介绍sd发展的第一阶段版本的模型架构和一些微调训练方法,后续版本SDXL,LCM 版本再写文章继续介绍 SD 1.x 版本模型结构 autoencoder(VAE :encoder将图像压缩到latent空间,而decoder将latent解码...
-
【AIGC】HF-Mirror 使用说明(MacOS 版)
今天这篇文章主要是记录 HF-Mirror 的使用过程,官网上提供了 Linux 和 Windows 的使用方式。本人作为 MacOS 用户也将自己的使用办法记录一下,希望能够帮助到其他人。 HF-Mirror 是什么? HF-Mirror 是大神...
-
AIGC工具使用指南与测评报告
目录 AIGC工具使用指南与测评报告 1. 引言 2. AIGC使用指南 2.1 安装和设置 2.2 与AIGC进行对话 2.3 提高对话质量 3. 测评报告 4. 结论 AIGC工具使用指南与测评报告 1. 引言 AIGC(A...
-
每日AIGC最新进展(27):用于视频生成的ControlNets Ctrl-Adapter、无缝循环视频生成LoopAnimate、高分辨率大型视觉-语言模型InternLM-XComposer2
Diffusion Models专栏文章汇总:入门与实战 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusio...
-
AIGC笔记--Stable Diffusion源码剖析之UNetModel
1--前言 以论文《High-Resolution Image Synthesis with Latent Diffusion Models》 开源的项目为例,剖析Stable Diffusion经典组成部分,巩固学习加深印象。...
-
Midjourney绘画风格关键词总结
我们初次使用AI绘图时,可能会对如何使用关键词营造画面感到迷茫,很多参数需要在提示词中设置,尤其多小白来说不是很好友。所以,掌握一些简单的语法和技巧很重要,下面我们将根据不同的风格列举常用的高质量关键词。 1. 风格关键词 Ink style ...
-
Midjourney 关键词与案例整理
常用关键词 风格 说明 Tradition Chinese Ink Painting 东方山水画 Japanese Ukiyo-e 浮世绘 Japanese comics/manga 日本漫画风格 s...
-
【LLM第二篇】stable diffusion扩散模型、名词解释
最近在整理大模型的相关资料,发现了几个名词,不是很懂,这里整理一下: stable diffusion(SD 模型: 扩散模型(Diffusion model)的一种,主要用于生成高质量的图像,GAN的替代者,扩散模型通过一些列学习步骤生成数据,逐渐从...
-
聊聊大模型:开源LLaMA背后的底层逻辑与赚钱之道?大模型的发展瓶颈?如何一键部署LLaMA3?
如果我们相信未来比今天更好,坚信自己生活在一个好地方,所要做的便是认识到未来时代的特征和规律。把握住一些不变的道理,使用正确的方法,做那些能够不断让自己获得可叠加式进步的事情,这样便能立于不败之地。—吴军 最近关注两个方向,也是公司重点发展和投资的两个方...
-
微软Copilot的周年之“痒”
AI Services在Q1占微软Azure增长的3%、Q2是6%、上个季度是7%, 这些数字并没有体现Copilot 所期望带来的“指数级增长”。 最终还是卖GPU是最好的生意。下面的文章是我2个月前对Copilot业务的判断,供参考: ===...
-
Stable Diffusion最好用的高清修复插件
虽说大部分N家显卡都能跑得起来Stable Diffusion,但想要画尺寸更大、更清晰的图片,需要更大的显存。 以12G显存的3060为例,2048大概是单张尺寸的上限,如果画更大的尺寸,大概率会爆显存。 大多数情况下,都是画512小尺寸的图,生成效...
-
Stable Diffusion【进阶篇】:图片中指定元素的移除
大家好,在图像处理中,去掉图片中不想要的元素是一种常见的应用场景,比如去掉图片中的水印、旅游拍的照片中P掉路人等等。随着AI技术的普及,目前可以精准地抹除掉照片中不想要的元素。今天我们分享在SD中2种实现图片中指定元素的移除方法。(文末附籽料) 我们以下...
-
windows下使用midjourney (一)
一、midjourney是什么? midjourney 是一款AI绘画工具,输入描述自动生成图片。 二、使用步骤 1.安装anaconda 安装之前先在cmd里输入conda看下有没有安装过,没有的话安装一下 安装完成之后,在安装目录下找到....
-
Meta-Llama-3-8B-Instruct本地推理
Meta-Llama-3-8B-Instruct 本地推理 基础环境信息(wsl2安装Ubuntu22.04 + miniconda) 使用miniconda搭建环境 (base :~$ conda create --name pyto...
-
基于Llama 2家族的提示词工程:Llama 2 Chat, Code Llama, Llama Guard
Prompt Engineering with Llama 2 本文是学习 https://www.deeplearning.ai/short-courses/prompt-engineering-with-llama-2/ 的学习笔记。...
-
引领Midjourney Logo设计新潮流:激发创意,探索无限可能 - V5版 (上)
大家好!天,我们非常高兴地为大家带来一项精彩教程——利用Midjourney来设计和制作精美的Logo。本教程将涵盖两个版本:Midjourney v5和v6,以满足不同用户的需求和创意发挥。 在v5版本中,我们将着重于激发您的无限创意。为此,我们精...
-
AIGC学习(SD、LoRA和ControlNet)
目录 Stable Diffusion(稳定扩散模型) 为什么叫扩散模型? 网络结构 VAE(Variational Auto-Encoder) UNet模型 CLIP Text Encoder LoRA(低秩适应矩阵 什么是LoRA?...
-
Stable Diffusion XL(未待完续)
模型介绍 Stable Diffusion XL 是一种基于人工智能的图像生成模型,由Stability AI开发。它是Stable Diffusion系列模型中的一员,专门设计用来生成更高质量的图像。这个模型在原有的Stable Diffusion模型...
-
LLM之RAG之LlaMAIndex:llama-index(一块轻快构建索引来查询本地文档的数据框架神器)的简介、安装、使用方法之详细攻略
LLM之RAG之LlaMAIndex:llama-index(一块轻快构建索引来查询本地文档的数据框架神器 的简介、安装、使用方法之详细攻略 目录 LlamaIndex的简介 1、LlamaIndex有什么帮助? 2、核心原理 llama-i...
-
Diffusion Model, Stable Diffusion, Stable Diffusion XL 详解
文章目录 Diffusion Model 生成模型 DDPM概述 向前扩散过程 前向扩散的逐步过程 前向扩散的整体过程 反向去噪过程 网络结构 训练和推理过程 训练过程 推理过程 优化目标 详细数学推导 数学基础 向前扩散过程 反向...
-
【Diffusion实战】基于Stable Diffusion实现文本到图像的生成(Pytorch代码详解)
来试试强大的Stable Diffusion吧,基于Stable Diffusion的pipeline,进一步了解Stable Diffusion的结构~ Diffusion实战篇: 【Diffusion实战】训练一个diffusion模型生成...
-
pipeline-stable-diffusion.py文件逐行解释
本文是对stabled-diffusion的pipeline文件的代码逐行解释。 60-71行 该函数对经过cfg重组出来的noise_pred,再重组。 def rescale_noise_cfg(noise_cfg, noise_pred_t...
-
在本地跑一个AI模型(5) - Stable Diffusion
在之前的文章中,我们使用ollama在本地运行了大语言模型,它可以与你聊天,帮助你理解和生成文本内容。使用coqui-tts在本地运行了文本转语音模型,它可以将大语言模型生成的文字转换成语音,让你的应用更有趣。今天我们将要介绍Stable Diffusio...
-
无需搭建环境,零门槛带你体验Open-Sora文生视频应用
案例体验 ?* 本案例需使用 Pytorch-2.0.1 GPU-V100 及以上规格运行 ?* 点击Run in ModelArts,将会进入到ModelArts CodeLab中,这时需要你登录华为云账号,如果没有账号,则需要...
-
人工智能 | 360自研可控布局AI绘画模型HiCo发布
龙年春意伊始,360人工智能研究院正式发布新的AI绘画模型:可控布局生成模型HiCo。与大家所熟悉的文生图模型相比,HiCo在普通的文本输入之上,提供了更为强大的画面布局控制能力:用户可以根据自己的构思,指定在画面不同的区域生成不同的指定内容,实现A...
-
Midjourney 参数详解(MJ参数)
官方地址: Midjourney Parameter ListParameters are added to a prompt to change how an image generates. Parameters can change an imag...
-
大模型微调之 使用 LLaMA-Factory 微调 Llama3
大模型微调之 使用 LLaMA-Factory 微调 Llama3 使用 LLaMA Factory 微调 Llama-3 中文对话模型 安装 LLaMA Factory 依赖 %cd /content/ %rm -rf LLaMA-Factory...
-
2024年最新AI绘画普及课【二】文生图入门_平铺 分块 (tiling)
正面提示词: (1girl:2.0 , solo, nilou \(genshin impact\ , solo, long hair, jewelry, blue gemstone, earrings, horns, crown, cyan satin...
-
Llama 3 微调项目实践与教程(XTuner 版)
Llama 3 微调项目实践与教程(XTuner 版) OpenMMLab 2024-04-20 11:37 上海 以下文章来源于InternLM ,作者XTuner InternLM. 以原始创新引领AI大模型技术进步。 Lla...
-
aigc 启动器 sd-webui-aki-v4 decode_base64_to_file
下载地址: SD-WebUI启动器 绘世-启动器 | 万物档案 decode_base64_to_file报错: File "E:\BaiduNetdiskDownload\stable diffusion\sd-webui-aki-v4\e...
-
五一假期Llama 3之魔改不完全攻略(Part 2)
2024年4月18日,Meta AI 正式宣布推出 Llama 3,这标志着开源大型语言模型(LLM)领域的又一重大进步。如同一颗重磅炸弹, Llama 3 以其卓越的性能和广泛的应用前景,预示着 AI 技术的新时代。 目前开源的是Llama3 8B 和...
-
OpenAI Whisper 语音转文本实验
为了实现语音方式与大语言模型的对话,需要使用语音识别(Voice2Text)和语音输出(Text2Voice)。感觉这项技术已比较成熟了,国内也有许多的机构开发这项技术,但是像寻找一个方便测试的技术居然还不容易。Google 墙了,微...
-
Meta Llama 3本地部署
感谢阅读 环境安装 收尾 环境安装 项目文件 下载完后在根目录进入命令终端(windows下cmd、linux下终端、conda的话activate) 运行 pip install -e . 不要控制台,因为还要下载模型。这...
-
仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 大语言模型的微...
-
Llama 3 模型家族构建安全可信赖企业级AI应用之使用 Llama Guard 保护大模型对话 (八)
LlaMA 3 系列博客 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (一) 基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二) 基于 LlaMA 3 + LangGraph 在w...
-
LLaMA-Factory+qwen多轮对话微调测评
目录 训练的时间和效果 数据准备 数据样例 数据配置 环境搭建 模型微调训练 模型预测 运行成功的web UI LLaMA-Factory地址:https://github.com/hiyouga/LLaMA-Factory/blo...
-
【AIGC】本地部署通义千问 1.5 (PyTorch)
今天想分享一下 Qwen 1.5 官方用例的二次封装( huggingface 说明页也有提供源码),其实没有太多的技术含量。主要是想记录一下如何从零开始在不使用第三方工具的前提下,以纯代码的方式本地部署一套大模型,相信这对于技术人员来说还是非常有用的。...
-
LLaMA-Factory微调(sft)ChatGLM3-6B保姆教程
LLaMA-Factory微调(sft)ChatGLM3-6B保姆教程 准备 1、下载 下载LLaMA-Factory 下载ChatGLM3-6B 下载ChatGLM3 windows下载CUDA ToolKit 12.1 (本人是在w...
-
详解苹果和微软的AI集成策略
当OpenAI在其春季更新会议上宣布推出macOS的ChatGPT桌面应用时,人们不禁疑惑为什么它没有先从Windows开始,毕竟,微软是OpenAI的主要投资者,理应最早获得新ChatGPT功能的访问权限。 现在我们知道原因了,在Build会议上宣布...
-
AIGC-controlnet代码详细解读
hugging face 社区diffusers官方代码:stable_diffusion/controlnetcontrolnet.ipynb 原始代码的解读可以看看这个博主的:万字长文解读Stable Diffusion的核心插件—ControlNet...