-
ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型
OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...
-
超级Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了
起猛了?不过两三天的时间,仅有两个 Markdown 文件的 GitHub 项目为何竟能收获2k star? 仔细一看,其中一个 Markdown 文件是一个流程图,另一个 Readme 文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛?:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
使用PyTorch从零构建Llama 3
我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama...
-
WhisperX: 带时间戳的自动语音识别及说话人分离
WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,...
-
使用OpenAI Whisper的说话人识别管道
使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程
Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程 stable-diffusion-webui-colabstable diffusion webui colab项目地址:https://gitco...
-
Distil-Whisper 开源项目教程
Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...
-
LongLLaMA:扩展上下文处理能力的大型语言模型
LongLLaMA:扩展上下文处理能力的大型语言模型 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on Ope...
-
全网最全,保姆级Stable Diffusion系列入门使用教程(图生图、LoRA、提示词权重),建议收藏!
大家好,我是画画的小强 今天将给大家讲解 Stable Diffusion 入门使用教程的 图生图、LoRA和提示词权重的教程,如果你还没有使用或者安装SD,那么可以看看我的往期入门教程AI绘画『Stable Diffusion』面向小白的免费AI绘画工...
-
如何在家用设备上运行 Llama 3.1 405B?搭建 AI 集群
在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中,开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外,您无需依赖外部提供商或支付任何额外费用。但是,随着模型大小的增加,这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是,张...
-
DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营
Task2:精读代码,实战进阶 聊聊相关:虽然现在很多的AI绘图都能被大家说“一眼鉴AI”,但随着技术日新月异的变化,我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实...
-
震撼发布!阿里通义FunAudioLLM:重塑自然语音交互新纪元,开源引领语音处理革命!
近年来,人工智能的进步如 GPT-4o 和 Gemini-1.5极大地改变了人与机器的互动方式,2023这种转变在语音处理领域尤为明显。 阿里巴巴通义实验室近日发布并开源了 FunAudioLLM,这是一个旨在增强人与大型语言模型(LLMs)之间...
-
重磅!Stable Diffusion创始团队推出FLUX.1:一夜颠覆MJ v6,DALL·E 3,SD3!
前言 Stable Diffusion 大家已经很熟悉了,是由 CompVis 团队开发的,这是一个隶属于德国慕尼黑大学的计算机视觉研究小组。该团队由多个研究人员和开发者组成,包括 Patrick Esser、Robin Rombach 和 Bjö...
-
推荐项目:Hugo Whisper 文档主题
推荐项目:Hugo Whisper 文档主题 hugo-whisper-themeWhisper is a minimal documentation theme for Hugo.项目地址:https://gitcode.com/gh_mirrors...
-
CVPR`24 | 又快又好!渲染速度比ENeRF快30倍!4K4D:实时4K分辨率4D视图合成
文章链接:https://arxiv.org/pdf/2310.11448 git链接: https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近,一些动态视图合成方法在渲染质量方面...
-
基于大模型的原神对话系统尝试
一.简介 该项目为一次大模型+游戏的尝试,成功实现了一个与原神内角色的对话系统。 演示视频:https://www.bilibili.com/video/BV1b48CeuELL github地址:https://github.com/goodlu...
-
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南
Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南 stable-diffusion-webui-Prompt_Generator项目地址:https://gitcode.com/gh_mirrors/st/...
-
WebLlama 项目使用教程
WebLlama 项目使用教程 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:https://gitcod...
-
【AI绘画】ComfyUI 入门教程:安装 ComfyUI,AIGC新手入门教程
大家好,我是写编程的木木。 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面(GUI)。通过将不同的节点连接在一起,你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样: C...
-
Mac 部署Stable Diffusion WebUI和ControlNet的保姆级教程(附安装包)
Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述生成详细图像,它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。详细介绍看维基百科词条Stable Diffusi...
-
探索未来游戏开发新纪元: 使用Godot Copilot加速您的创作之旅
探索未来游戏开发新纪元: 使用Godot Copilot加速您的创作之旅 godot-copilotAI-assisted development for the Godot engine.项目地址:https://gitcode.com/gh_mir...
-
探秘Whispers:守护代码安全的静态分析工具
探秘Whispers:守护代码安全的静态分析工具 whispersIdentify hardcoded secrets in static structured text项目地址:https://gitcode.com/gh_mirrors/wh/wh...
-
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI sd-webui-deoldifyDeOldify for Stable Diffusion WebUI:This is an extension...
-
MIT新研究揭秘「AI洗脑术」!AI聊天诱导人类「编造」记忆,真假难辨
【新智元导读】MIT研究发现:在AI的操纵下,人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导,形成「现场有枪」的错误记忆。有趣的是,AI的阿谀奉承,会产生「回音室效应」,让偏见更加强化。 GenAI的影响,已经不仅仅是搜索引擎、聊天机器人这么简...
-
【无矶之谈】编码能力堪比Copilot、Cursor、GPT-国内可用的智能AI编程
前言简述 Copilot Copilot 是一款由 OpenAI 推出的人工智能代码自动补全AI工具 早在2022年4月,我便写了一篇Github Copilot的申请及在Pycharm的配置和使用,那个时候我便在用AI进行编程,当时虽然用的不是...
-
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit)
推荐开源项目:稳定扩散模型工具包(stable-diffusion-model-toolkit) stable-diffusion-webui-model-toolkit项目地址:https://gitcode.com/gh_mirrors/st/st...
-
主流AI绘画工具-StableDiffusion本地部署方法(mac电脑版本)
Stable Diffusion是一款强大的AI生成图像模型,它可以基于文本描述生成高质量的图像。对于想要在本地运行此模型的用户来说,使用Mac电脑部署Stable Diffusion是一个非常吸引人的选择,特别是对于M1或M2芯片的用户。本文将详细介绍如...
-
WhisperX:革命性的自动语音识别工具
WhisperX:革命性的自动语音识别工具 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音...
-
【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。 官网中有以下功能开源供大家参考: FLUX.1 擅长在图像中准确再现文字,因此非常适合需要清晰文字或...
-
RAG 入门指南:从零开始构建一个 RAG 系统
本文正文字数约 3300 字,阅读时间 10 分钟。 从零开始构建一个应用可以让我们快速理解应用的各个部分。 这个方法其实非常适用于 RAG。 我在以前的文章中有介绍过 RAG 的概念、原理以及应用等,但其实,亲自动手来构建一个 RAG 系统或许能够...
-
GitHub Copilot 支持 IntelliJ IDEA啦,插件装起来!(1)
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》,点击传送门,即可获取! 别以为TJ君说的是天方夜谭,就在前不久的 GitHub Universe 2021开发者大会上,GitHub官方正式宣布了一款名为 Copilot工具的...
-
BMAB:Stable Diffusion WebUI的创意增强工具
BMAB:Stable Diffusion WebUI的创意增强工具 sd-webui-bmabAuto masking and inpainting for person, face, hand. Resizing image using detec...
-
【知识星球】大模型与AIGC+从零学AI+项目与人才招聘共3大知识星球成立,共建有三AI星球社区生态...
大家好,今年我们生态的重点将再次聚焦于知识星球社区,为了尽可能满足各层次学习者学习人工智能的需求,也为了满足非学习者对于项目研发和人才招聘的需求,我们将其分为3大星球社区。有三AI(大模型与AIGC)+ 有三AI(零基础学人工智能)+ 有三...
-
Stable Diffusion 常用模型下载与说明(保姆级)
那么,接下来我们就要学习怎么使用Stable Diffusion 中最重要的各类模型了。 因为,相比于Midjourney,Stable Diffusion最大的优势就是开源。相比于Midjourney靠开发人员开发的少数模型,SD则每时每刻都有人在世界...
-
AI助力浮雕创作!万物皆可浮雕?Stable Diffusion AI绘画【浮雕艺术】之文生浮雕!
前言 对于浮雕艺术,其实并不了解。但有幸能和“细辛”前辈结识,对浮雕有了简单的了解,浮雕图案的传统方式是先由画师画出图,然后由雕刻师雕刻。画师画图归为浮雕的设计阶段,画师会绘制出浮雕的设计图,这为后续的雕刻工作提供了基础和指导。设计图可以展现出...
-
探索LLaMA Factory:一站式大模型微调平台
探索LLaMA Factory:一站式大模型微调平台 LLaMA-Factory易于使用的LLM微调框架(LLaMA, BLOOM, Mistral, 百川, Qwen, ChatGLM)。项目地址:https://gitcode.com/gh_mir...
-
Distil-Whisper:高效快速的语音识别模型
Distil-Whisper:高效快速的语音识别模型 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1...
-
5 分钟 Stable Diffusion 本地安装指南
一、Stable Diffusion 简介 Stable Diffusion 是一款非常强大的基于深度学习的 AI 图像生成技术。它由众多研究团队和开发者共同努力而成,其中包括德国慕尼黑大学和总部位于纽约的 RunwayML 公司的国际研究团队。...
-
【国产AI绘图】快手把“可图”大模型开源了,这是一款支持中文的SDXL模型
Kolors 是由 Kuaishou Kolors 团队(快手可图)开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿对文本图像的训练,Kolors 在视觉质量、复杂语义的准确性以及中英文字符的文本渲染方面,与开源和专有模型相比都具有显著优势。此外,...
-
将 GitHub Copilot 与 JavaScript 结合使用
使用 GitHub Copilot(一个 AI 结对编程器,可在您编码时提供自动完成式建议)来处理 JavaScript 学习目标 学完本模块后,您将能够: 在 Visual Studio Code 中启用 GitHub Copi...
-
深度学习与图像修复:ADetailer插件在Stable Diffusion中的应用
文章目录 引言 ADetailer插件介绍 插件安装 常用模型 控制提示词 参数配置 参数详解 实践建议 示例 插件的对比: 1. ADetailer插件 2. Photoshop插件(如Nik Collection) 3. GIMP插件...
-
基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat
本文旨在探讨基于Llama factory使用LoRA(Low-Rank Adaptation)技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程,重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...
-
在 iPhone 15 Pro 上运行 Llama-3.1 8B;使用扩散模型生成类人绘画过程的工具;使用ChatGPT自动生成思维导图
✨ 1: MLX Examples 在 iPhone 15 Pro 上运行 Llama-3.1 8B 基于 MLX 机器学习推理框架轻松将 「Llama-3.1 8B」在 iPhone 15 Pro 上运行? 代码已开源! 地址:http...
-
记录Linux上安装LLaMA Factory v0.8.3 增量预训练/监督微调
序:SFT 和 PT 的区分 sft(Supervised Fine-Tuning,监督微调) 定义:sft是一种基于监督学习的微调方法,它使用标记好的数据(即带有输入、指令和期望输出的数据集)来进一步训练已经预训练好的模型。这种方法允许模型...
-
Copilot.el 开源项目教程
Copilot.el 开源项目教程 copilot.elAn unofficial Copilot plugin for Emacs.项目地址:https://gitcode.com/gh_mirrors/co/copilot.el 1. 项目的目...
-
Stable diffsuion基础篇(4)
前言: 基础篇的最后一篇,本篇主要是记录stable diffusion的本地部署以及云端部署,还有3种插件的安装方法。明天再补充一篇关于大模型和其他小模型的琐碎知识点,后面就开始进军插件篇以及关于stable diffusion的项目实战案例。有时间再...
-
Stable-Diffusion-Android 开源项目教程
Stable-Diffusion-Android 开源项目教程 Stable-Diffusion-AndroidStable Diffusion AI是一款易于使用的应用程序,只需点击几下即可从文本或其他图像快速生成图像。使用此应用程序,您可以与自己的...
-
llama.cppllama.cpp 是一个C++库,用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现,不依赖任何外部库,并且针对x86架构提供了AVX、
llama.cpp llama.cpp - Qwen llama.cpp 是一个C++库,用于简化LLM推理的设置。它使得在本地机器上运行Qwen成为可能。该库是一个纯C/C++实现,不依赖任何外部库,并且针对x86架构提供了AVX、AVX2和AVX5...