-
在 Stable Diffusion 1.5 中 Lora, Dreambooth, Textual Inversion的详解指北
Lora, Dreambooth and Textual Inversion 说明 您是否想象过您可爱的宠物与埃菲尔铁塔合影的画面,或者想象过如何生成一张带有您朋友面孔的人工智能图像? 是的,通过稳定扩散技术的微调,这完全是可能的! 创建这些场景的整...
-
如何在Android上运行Llama 3.2
引言 随着Llama 3.2的发布,Meta在将强大的语言模型带到边缘和移动设备方面取得了重大进展。Llama 3.2包含了专为智能手机和平板电脑高效运行而设计的轻量级模型(1B和3B参数)。本教程将指导您通过MLC LLM库对Llama 3.2模型进...
-
24最新Stable Diffusion Lora模型训练详细教程!
前言 1. 介绍 通过Lora小模型可以控制很多特定场景的内容生成。 但是那些模型是别人训练好的,你肯定很好奇,我也想训练一个自己的专属模型(也叫炼丹~_~)。 甚至可以训练一个专属家庭版的模型(family model),非常有意思。 将自...
-
CopilotChat.nvim 开源项目安装与使用教程
CopilotChat.nvim 开源项目安装与使用教程 CopilotChat.nvimChat with GitHub Copilot in Neovim项目地址:https://gitcode.com/gh_mirrors/co/CopilotC...
-
LLM | llama.cpp 安装使用(支持CPU、Metal及CUDA的单卡/多卡推理)
1. 详细步骤 1.1 安装 cuda 等 nvidia 依赖(非CUDA环境运行可跳过) # 以 CUDA Toolkit 12.4: Ubuntu-22.04/24.04(x86_64 为例,注意区分 WSL 和 Ubuntu,详见 http...
-
nvim (setup copilot)for code assit
4. Work with Neo Vim 4-1. Install Neo Vim (0.9.5 or higher neovim/neovim: Vim-fork focused on extensibility and usability (gith...
-
【AI画图】stable-diffusion-webui学习之一《安装部署》
简介 Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它是一种潜在扩散模型,它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源,在Github上由AUTOMATIC...
-
【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画
GitHub:https://github.com/BadToBest/EchoMimic 论文: https://arxiv.org/pdf/2407.08136 comfyui: https://github.com/smthemex/ComfyU...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task3笔记
在task2中,已经借助AI工具对AIGC生图的代码进行精读。在本章中则更加关注于了解Lora微调的基本原理以及文生图的工作流平台工具ComfyUI的使用。 task2链接:Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task...
-
llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程
llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程 llama3.cudallama3.cuda is a pure C/CUDA implementation for Llama 3 model.项目地址:https://git...
-
在矩池云使用 Llama-3.2-11B-Vision 详细指南
Llama 3.2-Vision是Meta开发的一系列多模态大型语言模型(LLMs),包含11B和90B两种规模的预训练和指令调整模型。 这些模型专门优化用于视觉识别、图像推理、字幕生成和回答有关图像的一般问题。Llama 3.2-Vision模型在常见...
-
LLaMA-Factory 让大模型微调变得更简单!!
背景 如果只需要构建一份任务相关的数据,就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作, 那么必将大大减轻微调工作量。 今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...
-
Whisper JAX:闪电般快速的语音识别框架
Whisper JAX:闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...
-
Flux.1:AI绘画的新标杆,文生图效果秒杀MJ、SD
大家好,我是爱绘画的彤姐。 AI绘画技术正以前所未有的速度发展,其中Flux.1的出现标志着这一领域的新高度。 由Black Forest Labs推出的Flux.1,不仅在图像细节和风格多样性上树立了新的标杆,还在开源社区中迅速形成了一个活跃的生态系...
-
【AIGC】ComfyUI安装及常见问题cuda及pytorch安装教程
说明:ComfyUI安装方式有很两种,第一种是下载独立包。独立包下载到本地后,即可使用。不需要搭建(安装)python、cuda、cudnn、pytorch环境. 第二种是,手动安装。手动安装要复杂很多,需要搭建开发环境,即安装python、cuda、c...
-
TaskbarDock:个性化定制你的Windows 10任务栏
TaskbarDock:个性化定制你的Windows 10任务栏 TaskbarDockCustomize Windows 10 Taskbar with few extra features项目地址:https://gitcode.com/gh_mi...
-
Linly-Talker容器构建
一、模型介绍 Linly-Talker 是一款集成了多种人工智能技术的数字人对话系统,它通过多模型集成、多轮对话能力、语音克隆技术、实时互动和视觉增强,为用户提供了一种全新的交互体验。 二、特点 智能和个性化 :系统不仅能够理解并生成自然语言,还...
-
Stable Diffusion 必备插件推荐,菜鸟轻松成高手!
一个刚学AI绘画的小菜鸟如何快速成为Stable Diffusion高手?答案就是SD插件。 只要学会使用SD的各种插件,帮你写正向和负向提示词,修复人脸/身体/手指,高清放大图片,指定人物pose,图片微调等等都可以轻松搞定,善用插件是成为高手必经之路...
-
【AIGC】Kolors:快手开源的文生图大模型
GitHub:GitHub - Kwai-Kolors/Kolors: Kolors Team 论文:Kolors/imgs/Kolors_paper.pdf at master · Kwai-Kolors/Kolors · GitHub comfyu...
-
Python Poetry fails to add openai-whisper due to triton installation error
题意:Python Poetry 因 Triton 安装错误而无法添加 openai-whisper。 问题背景: so im trying to use openai-whisper. i'm using poetry as my env a...
-
Unsloth 教程 - 如何微调 Llama-3并导出到 Ollama
本文翻译整理自:🦙 How to Finetune Llama-3 and Export to Ollamahttps://docs.unsloth.ai/tutorials/how-to-finetune-llama-3-and-export-to-ol...
-
LLaMA-Lite:轻量级Llama模型简介与实战指南
LLaMA-Lite:轻量级Llama模型简介与实战指南 llama-lite Embeddings focused small version of Llama NLP model 项目地址: https://gitcode.com/gh_m...
-
【Stable Diffusion Webui】本地部署教程——使用虚拟环境,教你以简洁不折腾的方式入坑AI绘画
【Stable Diffusion Webui】本地部署教程——使用虚拟环境,教你以简洁不折腾的方式入坑AI绘画 引言 何谓“三个必要,两句代码”? 操作流程 (1)Anaconda、Git的下载安装 (2)创建conda虚拟环境 (3)在虚...
-
Ubuntu LLaMA-Factory实战
一、Ubuntu LLaMA-Factory实战安装: CUDA 安装 CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型,它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。 首先,在 https://develop...
-
基于 ROS 的Terraform托管服务轻松部署Stable Diffusion
介绍 Stable Diffusion是文本到图像的潜在扩散模型,它可以根据文本提示词生成对应的图像。Stable Diffusion模型是扩散模型的变种,可以通过逐步对随机高斯噪声进行去噪以获得感兴趣的样本。与传统生成模型相比,Stable Diff...
-
1500+ HuggingFace API token暴露,使数百万 Meta-Llama、Bloom 等大模型用户面临风险
HugginingFace 和 GitHub 是AI开发人员的重要平台,因此我们决定对这些平台做更为深入的研究。在这项研究中,我们发现了数以千计的 API 令牌,这些令牌暴露给恶意行为者,使数百万最终用户可能受到攻击。 本文的主要内容包括:...
-
【AI绘画教程】ComfyUI基础篇:小白都可以学会的ComfyUI安装教程(原生版安装包)
大家好,我是程序员晓晓 自从Flux这一款最新黑马文生图模型推出以来,Flux的浪潮正以不可阻挡之势席卷全球,目前本地电脑环境要玩Flux, 支持方式主要是ComfyUI。但是ComfyUI工具安装一直是很多小白比较困惑的地方,在和小伙伴的私下留言中,C...
-
使用llama.cpp 在推理MiniCPM-1.2B模型
llama.cpp 是一个开源项目,它允许用户在C++中实现与LLaMA(Large Language Model Meta AI)模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型,虽然llama.cpp本身并不包含LLaM...
-
使用Ollama本地部署Llama 3.1大模型
Llama 3.1 介绍 2024 年 7 月 24 日,Meta 宣布推出迄今为止最强大的开源模型——Llama 3.1 405B,Llama 3.1 405B 支持上下文长度为 128K Tokens, 增加了对八种语言的支持,号称第一个在常识、可...
-
【Llama3.1-8B-Instruct】Llama Factory 等部署实战
一、模型介绍 Meta Llama 3.1 系列是一个多语言大型语言模型 (LLM 集合,包括 8B、70B 和 405B 三种尺寸(文本输入/文本输出)。Llama 3.1 的指令调优版本(8B、70B、405B)针对多语言对话用例进行了优化,并在常...
-
AI音频成诈骗神器!律师父亲险被骗走21万,3秒原声即可克隆声音
【新智元导读】Deepfake到底有多可怕?国外一名律师的父亲,险些陷入一场巨大AI骗局。诈骗者借助AI克隆其儿子的声音,伪造车祸事故要挟3万保释金。GenAI技术犯罪泛滥同时,科学家们也在寻找破魔之道。 AI泛滥成灾的时代,真假孰能分辨? 最近,国外一位...
-
使用 GaLore 预训练LLaMA-7B
项目代码: https://github.com/jiaweizzhao/galorehttps://github.com/jiaweizzhao/galore 参考博客: https://zhuanlan.zhihu.com/p/686686751...
-
faster-whisper-GUI 使用教程
faster-whisper-GUI 使用教程 faster-whisper-GUIfaster_whisper GUI with PySide6项目地址:https://gitcode.com/gh_mirrors/fa/faster-whisper...
-
陶哲轩全网悬赏「最强大脑」!AI+人类颠覆数学难题?凡尔赛网友已下场
【新智元导读】最近,陶哲轩向广大网友和数学爱好者发起了挑战:大众数学爱好者、证明助理、自动化助手和AI联合起来,是否可以证明扩展几个数量级的数学问题? 想参加陶哲轩发起的「众包」数学研究项目吗? 机会来了! AI辅助证明数学研究,越来越可行了 在传统上,...
-
当剪映识别字幕开始收费,我们用免费开源软件FFmpeg、Whisper、ChatGPT来快速制作中文或双语字幕
最近剪映中的视频“智能提取字幕”的功能收费了,收费是按照会员功能年收费,收费还不低。由于我只需要剪映的字幕功能,其他会员功能并不需要,于是想了其他的办法来解决给视频增加字幕的功能,并且还能添加双语字幕,给中文字翻译成其他任何一门语言再加在中文幕...
-
下载官方llama
1.官网.pth格式 去官网(Download Llama (meta.com )申请 具体可以看这个B站视频 Llama2模型申请与本地部署详细教程_哔哩哔哩_bilibili(视频是llama2,下载llama3是另外一个git) 相关...
-
Whisper ASR Webservice 使用教程
Whisper ASR Webservice 使用教程 whisper-asr-webserviceOpenAI Whisper ASR Webservice API项目地址:https://gitcode.com/gh_mirrors/wh/whis...
-
AI是在帮助开发者还是取代他们?
在软件开发领域,生成式人工智能(AIGC)正在改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试,AI工具正在成为开发者的得力助手。然而,这也引发了对开发者职业前景和技能需求变化的讨论。AI究竟是在帮助开发者还是取代他们? 方向一:AI...
-
Emacs Copilot 安装与使用指南
Emacs Copilot 安装与使用指南 emacs-copilotLarge language model code completion for Emacs项目地址:https://gitcode.com/gh_mirrors/em/emacs-...
-
AI一键批量生成各类短视频,自动批量混剪短视频,自动把视频发布到抖音,快手,小红书,视频号上,赚钱从来没有这么容易过! 支持本地语音模型chatTTS,fasterwhisper,支持云语音
最近MoneyPrinterPlus比较火,可以自动生成视频,剪辑视频,而且还可以直接上传到多媒体平台上!!! 赶紧自己动手实操一下吧。 1、首先安装好需要的环境。 Python 3.10+,安装地址:直接跳转到下载页面 ffmpeg 6.0+,123网盘...
-
让我的工作效率翻倍的编程利器:VSCode + Git + GitHub Copilot
哪个编程工具让你的工作效率翻倍? 在日益繁忙的工作环境中,选择合适的编程工具已成为提升开发者工作效率的关键。不同的工具能够帮助我们简化代码编写、自动化任务、提升调试速度,甚至让团队协作更加顺畅。那么,哪款编程工具让你的工作效率翻倍?是智能的代码编辑器,...
-
【AI绘画】超详细!ComfyUI 全方位入门指南,初学者必看,附多个实践操作
本文正文字数约 8300 字,阅读时间 20 分钟。如果按照文章实操一遍,预计时间在半小时到两小时不等。 在上一篇文章中,我向大家介绍了有关于 Stable Diffusion 的基本概览,同时也在文章里放置了一些相关的工具链接可以方便的使用 Stab...
-
Stable Diffusion WebUI Forge 支持 Flux 了!
大家好,我是每天分享AI应用的萤火君! Flux横空出世有段时间了,模型效果也得到了广泛的认可,但是 Stable Diffusion WebUI 官方迟迟没有跟进,据说是因为要修改很多底层的处理机制,加之ComfyUI如火如荼,可能越南大佬的心气也不是...
-
【AIGC】ComfyUI 入门教程(7):SDXL 工作流和 ComfyUI 整合包
前言 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: ComfyUI 工作...
-
丹摩智算(damodel)部署stable diffusion实验
名词解释: 丹摩智算(damodel):是一款带有RTX4090,Tesla-P40等显卡的公有云服务器。 stable diffusion:是一个大模型,可支持文生图,图生图,文生视频等功能 一.实验目标 注册丹摩智算(damodel) 账户...
-
Copilot,Cursor和通义灵码:到底谁才是你的最强代码助手?
近期基于大语言模型诞生的代码辅助助手可谓层出不穷,从一开始的github copilot, tabnine到现如今的cursor大火,到底谁才是代码辅助的最强王者呢?我希望就我近期的体验带大家初步认识一下他们(仅代表个人见解) 本文将介绍以下几个工具:...
-
基于Llama构建的语音语言模型LLaMA-Omni;增强记忆的长文本建模检索方法;全功能的AI应用AnythingLLM
✨ 1: LLaMA-Omni LLaMA-Omni是基于Llama-3.1-8B-Instruct构建的语音语言模型,支持高质量低延迟的语音互动。 LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的语音语言模型...
-
【AI绘画】零基础入门ComfyUI(三)目录和插件
大家好,我是写编程的木木。 在上一期的探索中,我们一起走进了快手可图的奇妙世界,并通过一组提示词生成了不错的图片,粗略体验了它独特的操作。许多朋友可能对其中文件夹的作用感到好奇。今天,我们将深入探讨ComfyUI的目录结构和插件体系,并推荐几款值得一试的...
-
cursor 和 GitHub copilot 最强竞品:开源 Void 编辑器会取代他们吗?
你是否在使用 GitHub Copilot 或 Cursor 的时候,觉得它们的智能补全虽然强大,但总有些地方不尽如人意?比如,价格高昂,或者一些功能限制让人抓狂?如果你有类似的痛点,那么今天我要给你介绍一款新工具——Void,这款编辑器号称是开源的 Cu...
-
Datawhale AI夏令营第四期魔搭 AIGC task02
一、AI生图 1.1 AI生图技术 AIGC(AI-Generated Content 是通过人工智能技术自动生成内容的生产方式,很早就有专家指出,AIGC将是未来人工智能的重点方向,也将改造相关行业和领域生产内容的方式。 ...