-
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于SD的方法缺乏对图片结构的保持,所以本...
-
微调神器LLaMA-Factory官方保姆级教程来了,从环境搭建到模型训练评估全覆盖
编者注:之前一直用firefly做微调,最近切换到LLaMA-Factory,发现不但简单易用,而且非常全面,有点相见恨晚的感觉。使用过程中我主要参考2个文档,一个是github上的官方中文文档: https://github.com/hiyouga/L...
-
stable diffusion中dreambooth模型训练
stable diffusion中dreambooth模型训练 简介 一、参考材料 二、运行备注 模型训练步骤 一、连接服务器 二、虚拟环境配置 简介 一、参考材料 1、Github项目网址 2、huggingface...
-
测试:ollama加载羊驼版本llama-3中文大模型
找了一个晚上各种模型,像极了当初找各种操作系统的镜像,雨林木风,深蓝、老毛桃…… 主要是官方的默认7B版本回答好多英文,而且回复的很慢,所以我是在ollama上搜索"chinese"找到了这个羊驼版本的, ollama run lgkt/llama3-...
-
图生视频,Stable Diffusion WebUI Forge内置SVD了!
在 Stable Diffusion WebUI Forge 版本中内置了一个SVD插件,也就是 Stable Video Diffusion(稳定视频扩散),之前我介绍过这个工具的使用方法:图片生成视频(独立部署SVD 但是当时还不能集成到Stabl...
-
【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读
写在前面的话: 今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界,其中 25 个角色由 GPT 和自定义代码控制,并在arxiv上提交了论文版本,引起了对AIGC+游戏的广泛讨论; 8月,该项目在GitHub上正式开源...
-
大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了
继分不清9.11和9.9哪个大以后,大模型又“集体失智”了! 数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。 GPT-4o不仅错了还很自信。 刚出炉的Llama-3.1405B,倒是能在验证中发现问题并改正。 比较离谱的是Clau...
-
【AI绘画系列】分享5个让你艺术细胞炸裂的SD资源
大家好,最近我疯狂研究AI绘画,AI绘画有一种魔力,一坐下就完全不知道时间的流逝(饭都不知道按时吃了),修仙走火入魔了? 目前AI绘画领域最火的就是MJ和SD,社群众说纷纭。各有所长。建议两者都学习一下,然后找到最适合自己的用法。 AI绘画系列将是一系...
-
【一文开启StableDiffusion】最火AIGC绘画工具SD阿里云部署指南(含踩坑经验)
Midjonery使用简单,效果出色,不过需要付费。本文将介绍完全开源的另一款产品StableDiffusion,它的社区目前非常活跃,各种插件和微调模型都非常多,而且它无需付费注册,没有速度、网络限制,非常推荐一试。 目前主流AI绘画产品: 产...
-
使用LLaMA-Factory微调大模型
使用LLaMA-Factory微调大模型 github 地址https://github.com/hiyouga/LLaMA-Factory 搭建环境 git clone --depth 1 https://github.com/hiyouga/...
-
Meta的Llama-3.1-405B遭泄漏,可下载,性能超GPT-4o!
7月23日凌晨,有人爆料,Meta的Llama3.1-405B评测数据遭遇泄漏,明天可能会发布Llama3系列中最大的参数模型,同时还会发布一个Llama3.1-70B版本。 这也是在3.0版本基础之上进行了功能迭代,即便是70B的基础模型的性能也超过了G...
-
【05】LLaMA-Factory微调大模型——初尝微调模型
上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据,为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段,构建法律垂直应用大模型。 一、硬件依赖 LLaMA-Factory框架对硬件和软件的...
-
Llama也能做图像生成?文生图模型已开源
导读 基于next-token prediction的图像生成方法首次在ImageNet benchmark超越了LDM, DiT等扩散模型,证明了最原始的自回归模型架构同样可以实现极具竞争力的图像生成性能。 Llama也能做图像生成?文生图模型已开源...
-
Windows下安装LLama-Factory
在进行安装前,请先确认你的GPU能支撑起训练的显存。如果和可怜的我一样是4GB可以选择上云或者换一个好一点的显卡。并且确定你安装了显卡驱动版本在官方给的版本以上,如果没有安装,详细参考我的另一篇文章:LLama-Factory运行异常,CU...
-
阿里开源语音大模型:SenseVoice 识别,语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等!
阿里开源语音大模型:语音识别效果和性能强于 Whisper,还能检测掌声、笑声、咳嗽等! 原创 kakuqo AI真好玩 2024年07月06日 10:21 福建 语音识别技术在人工智能(AI)领域扮演着至关重要的角色,它不仅是人机交互的基石,也是推动...
-
自动炼丹基于Llama-factory改写--学习记录
最近在使用llama-factory微调LLM,但是一个个手动修改基本的学习率,学习轮次有太麻烦了。在寻找有没有什么自动调参的办法,在github上看到Llama-factory支持Weights & Biases 记录实验数据自动微调,尝试了一下...
-
GPT-4和Whisper从长视频生成短视频;AI治好了我的拖延症;GraphRAG技术集成到Open WebUI;两个开源LivePortrait实现
✨ 1: AI Youtube Shorts Generator AI Youtube Shorts Generator是一款利用GPT-4和Whisper从长视频生成短视频的Python工具。 AI YouTube Shorts Gene...
-
[机器学习]-如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境
如何在 MacBook 上安装 LLama.cpp + LLM Model 运行环境 1. 问题与需求 近段时间想学习一下大语言模型的本地化部署与应用。首先遇到的就是部署硬件环境的问题。我自己的笔记本是一台 MacBook Pro M3,没有 Nv...
-
比肩Midjourney-v6!没有GPU也能跑可图Kolors
比肩Midjourney-v6,快手的文生图开源模型可图Kolors一发布,开源社区就炸开了锅。短短几天,可图在Github上收获2k Star,Huggingface模型下载热榜第一。 7月6日,快手宣布开源数十亿参数的文生图模型可图Ko...
-
Stable Diffusion学习指南【ControlNet上篇】- 功能介绍、安装和使用
(注:文末扫码获取AI工具安装包和AI学习资料) 自 SD 系列教程发布这几个月,已被大家多次催更 ControlNet 的教程,相信很多朋友也都听说过这款神奇的控图工具。ControlNet 到底是什么?为什么作为一款插件它可以引起如此多的热议?究竟该...
-
GitHub Copilot & API
1. 引言 GitHub Copilot:智能编程的革新者 在软件开发的浩瀚宇宙中,GitHub Copilot犹如一颗璀璨的新星,以其独特的魅力引领着智能编程的新纪元。作为GitHub与OpenAI合作推出的革命性工具,Copilot不仅仅是一个简单...
-
Github Copilot - AI辅助编程工具的使用反馈和技巧分享
背景介绍 过去的两个月,我尝试使用Github Copilot作为前端开发和Javascript编程的辅助工具。下面分享一些相关的Github Copilot使用技巧。这并不是一个全面的Github Copilot使用指令介绍。关于完整和详细的指令介绍...
-
玩转AI绘画:一文教小白入门MidJourney与StableDiffusion两大AI绘画神器!| 系列之一
所有的AI绘画工具,模型和插件,都已经整理好了,文末扫码即可免费获取噢~ 如果说早期的AI绘图可能还是以娱乐为主,那么现在的AI绘图已经达到了以假乱真的地步。大量的自媒体人、某宝店主、甚至设计公司都已经开始借助AI来替代传统的设计公司、美工与作图软件。除...
-
深度掌握GitHub Copilot:提高编码效率的终极指南
引言: GitHub Copilot,作为一款由OpenAI和GitHub合作打造的智能代码助手,正在迅速改变开发者的编码体验。本文将深入研究GitHub Copilot,从安装和基础用法到高级应用和实用技巧,助您充分发挥这一工具在提高编码效率和代码质量...
-
openai 开源模型Whisper语音转文本模型下载使用
Whisper Whisper 是一种通用语音识别模型。它是在大量不同音频数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。官方地址 https://github.com/openai/whisper 方法...
-
AIGC月刊 | 技术革新与应用案例(2024.6月第二期)【魔方AI新视界】
〔更多精彩AI内容,尽在 「魔方AI空间」 公众号,引领AIGC科技时代〕 本文作者:猫先生 往期回顾:AIGC月刊 | 技术革新与应用案例(2024.5月第一期)【魔方AI新视界】 写在前面 【魔方AI新视界】 专栏致...
-
在Arch Liunx里只用Intel Ultra 7 155H跑stable-diffusion-webui
引言 虽然我把arch linux装在了移动硬盘里,使得我可以同时在我的轻薄本和游戏本之间运行同一个系统,并拥有一个系统级同步的开发环境,但由于我之前将stable-diffusion-webui部署在了游戏本的win11上,这就导致我无法在带着轻薄本...
-
【stable diffusion】ComfyUI扩展安装以及”127.0.0.1拒绝了我们的连接请求“解决记录
目录 扩展安装 ”127.0.0.1拒绝了我们的连接请求“解决记录 操作1 操作2 操作3 操作4 总结 扩展安装 虽然大家都推荐将扩展包直接放到extension文件夹的...
-
vscode结合GitHub Copilot编码
已集成工具 Azure Data Studio JetBrains IDEs Vim/Neovim Visual Studio Visual Studio Code 目录 GitHub Copilot & Visual Studio C...
-
AIGC是什么,与AI绘画有什么关系,一篇文章带你了解AI绘画的前世今生
在讲解AIGC和AI绘画之前,我们先看看什么是AI以及AI的历史。 AI历史发展轨迹 什么是人工智能 人工智能(Artificial intelligence,简称AI 亦称机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指用普通计...
-
AI绘画-----Stable Diffusion Web UI 卡在Installing requirements怎样解决,有可能表示正在下载中,等一个小时说不准就好了
好的资料: stable-diffusion-webui手动安装详细步骤(以及报错解决、踩坑) 参考资料: stable diffusion部署环境时一直卡在“installing requirements”? - 搜索结果 - 知乎 今天在下...
-
AI绘画Stable Diffusion精准控制人物姿势(ControlNet之OpenPose)
大家好,我是程序员晓晓 今天分享的是AI绘画Stable Diffusion中ControlNet控制网中的OpenPose模型,可以精准控制人物姿势,想摆什么pose,就摆什么pose,假以时日,多加练习,你也可以成为AI摄影师。 01、【准备插件】...
-
建议收藏!100款宝藏级AIGC工具分享,70款ChatGPT插件惊艳的开发过程与宏大的商业化愿景
建议收藏!100款宝藏级AIGC工具分享,70款ChatGPT插件惊艳的开发过程与宏大的商业化愿景。 不输ChatGPT?整理了100款AIGC神器,打工人速进。 说到AIGC工具,你还是只知道ChatGPT? 实际上,越来越多的AIGC应用都已...
-
【内网穿透】如何本地搭建Whisper语音识别模型并配置公网地址
个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119@qq.com] 📱个人微信:15279484656 🌐个人导航网站:www.forff.top 💡座右铭...
-
独立开发变现周刊:一个 AI 个人穿搭App年收入300万美元
目录 1、PDF Guru Anki: 一款开源以PDF为中心的办公学习工具箱 2、Langflow:一个开源构建多代理和RAG应用程序的可视化框架 3、【粉丝自荐】Color4Bg:一款酷炫的背景图生成工具 4、如何通过Telegram频道实现每月收入...
-
Stable Diffusion 秋叶整合包v4.7 :解压即用,快速入门AI绘画
Stable Diffusion秋叶整合包,超简单一键安装Stable Diffusion,无任何使用门槛,完全免费使用,支持Nvdia全系列显卡,来自B站up@秋葉aaaki,近期发布了Stable Diffusion整合包v4版本,一键在本地部署Sta...
-
每日AIGC最新进展(45):字节跳动开源大规模text-to-video数据集OpenVid-1M、浙江大学提出锚定条件控制视频生成GVDIFF、Meta AI研究院提出文生3D大模型3DGen
Diffusion Models专栏文章汇总:入门与实战 OpenVid-1M: A Large-Scale High-Quality Dataset for Text-to-video Generation https://nju-pcalab....
-
Llama - 微调
本文翻译整理自:https://llama.meta.com/docs/how-to-guides/fine-tuning 文章目录 微调 实验跟踪 Recipes PEFT LoRA torchtune Hugging Face PE...
-
SQL AI 工具太贵用不起?开源的更有性价比
在提高效率这方面,AI 的能力是毋庸置疑的。为了更高效地管理和分析数据库中的数据,很多 SQL AI 工具应运而生。 简单一点的 SQL AI 工具可以扩展传统的SQL查询功能,根据自然语言输入自动生成 SQL 查询,这降低了使用SQL的门槛,即使非技术...
-
【Stable Diffusion webui安装】
tips:python最好有conda控制版本,这样可以给sd-webui一个相对空白的环境 环境安装 安装CUDA 去官网下载对应版本的CUDA https://developer.nvidia.com/cuda-toolkit-archi...
-
使用llama.cpp量化模型
文章目录 概要 整体实验流程 技术细节 小结 概要 大模型量化是指在保持模型性能尽可能不变的情况下,通过减少模型参数的位数来降低模型的计算和存储成本。本次实验环境为魔搭社区提供的免费GPU环境(24G),使用Llama.cpp进行...
-
使用 stable-diffusion 入门级教程【Mac】
最近一直在短视频平台刷到AI生成的图片,质量也非常不错。术哥也跟我讲解了下如何安装使用。于是周末试了试。 也差点变成从入门到放弃了,所以也把过程中遇到的问题记录一下。 目前基本上运行正常,只是内存稍微小了点,把质量调低即可。...
-
ai绘画部署教程
在部署AI绘画Web环境的过程中,你提供了一些关键步骤。以下是一些详细说明: 1. 克隆webui 首先,通过以下命令从GitHub上克隆webui的代码: git clone https://github.com/AUTOMATIC1111/...
-
如何使用阿里云AMD CPU云服务器(g8a)和龙蜥容器镜像,并基于Stable Diffusion模型搭建个人版文生图服务
Stable Diffusion是文本到图像的潜在扩散模型,它可以根据文本提示词生成对应的图像。Stable Diffusion模型是扩散模型的变种,可以通过逐步对随机高斯噪声进行去噪以获得感兴趣的样本。与传统生成模型相比,Stable Diffusion...
-
【vs2022】安装copilot和reshaper
直接安装新版vs 17.10 自带集成的copilot 支持安装resharper 可以跳过市场里的reshper 安装好后依然可以直接使用vs。 resharper 2024.1.2 市场里还是i老版本 : copilot 不兼...
-
“全网最全”LLM推理框架集结营 - 看似微不足道,却决定着AIGC项目的成本、效率与性能!
00-前序 随着ChatGPT、GPT-4等大语言模型的出现,彻底点燃了国内外的学者们与企业家们研发LLM的热情。国内外的大语言模型如雨后春笋一般的出现,这些大语言模型有一部分是开源的,有一部分是闭源的。 伴随着大语言模型的出现,国内外基于大语言模型...
-
GitHub Copilot 简介
GitHub Copilot 使用 OpenAI Codex 直接从编辑器实时建议代码和整个功能。 学习目标 在本模块中,您将: 了解 GitHub Copilot 如何通过提供自动完成式建议来帮助您编码。 了解 Git...
-
Mac本地部署Stable-Diffusion
之前有AI绘图场景时一直用的是封装好的软件,因为不用考虑背后繁琐的细节,但因为各种原因难免会有使用不了等问题,为了一劳永逸,决定直接使用Stable-Diffusion。之前因为图省事以及电脑硬盘所剩空间捉襟见肘就没部署(Stable-Diffusion的...
-
【AIGC】二、mac本地采用GPU启动keras运算
mac本地采用GPU启动keras运算 一、问题背景 二、技术背景 三、实验验证 本机配置 安装PlaidML 安装plaidml-keras 配置默认显卡 运行采用 CPU运算的代码 step1 先导入keras包,导入数据cifar...
-
国产AI大模型Kolors:ComfyUI平台部署指南
在AI技术的浪潮中,快手公司推出的文生图大模型——Kolors,以其卓越的性能和开源精神,成为国产AI技术的一颗璀璨新星。Kolors不仅在图像生成效果上超越了现有的开源模型,更达到了与商业闭源模型相媲美的水平,迅速在社交媒体上引发热议。 Kolors的...