-
如何部署Meta开源大模型Llama2,转换为Huggingface模型的权重文件
如何部署Meta开源大模型Llama2 一、申请下载权限 通过Meta AI官网(https://llama.meta.com/llama-downloads/ 申请下载权限,注意Country/Region选择这里,可能会影响审查速度吧,...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task1笔记及心得
从零入门AI生图原理&实践是Datawhale 2024年AI夏令营第四期“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 主要是通过对模型的微调,以及对prompt的调整,可以根据要求生成不同...
-
AI 音频/文本对话机器人:Whisper+Edge TTS+OpenAI API构建语音与文本交互系统(简易版)
文章目录 前言 思路: 环境配置 代码 1. 加载Whisper模型 2. 使用Whisper语音转文本 3. 使用OpenAI API生成文本进行智能问答 4. 实现文本转语音功能 5. 合并音频文件 6. 构建Gradio界面 注意 总...
-
【AIGC】因果注意力(Causal Attention)原理及其代码实现
概述 因果注意力(Causal Attention)是一种自注意力机制,广泛应用于自回归模型中,尤其是在自然语言处理和时间序列预测等任务中。它的核心思想是在生成每个时间步的输出时,只关注当前时间步及之前的时间步,确保生成过程的因果性,从而避免模型在预测...
-
欺诈文本分类检测(十一):LLamaFactory多卡微调
1. 引言 前文训练时都做了一定的编码工作,其实有一些框架可以支持我们零代码微调,LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台,有如下特性: 支持常见的模型种类:LLaMA、Mixtral-MoE、Qwen、B...
-
Introduction to Automotive Speed Sensors: Understanding Passive and Active Systems
When it comes to automotive technology, understanding the sensors that monitor rotational speed is crucial. These sensors provid...
-
四个节点即可实现的ComfyUI批量抠图工作流
原文链接:ComfyUI面部修复完全指南 (chinaz.com 下图就是批量抠图的工作流 虽然工作流很简单,但是我们前提还是需要安装好我们的节点 首先安装我们的抠图节点 安装 BiRefNet 所需依赖:timm,如已安装无需运行 r...
-
【国产异构加速卡】基于llama.cpp实现Llama3模型的guff格式转换、4bit量化以及推理加速
重要说明:本文从网上资料整理而来,仅记录博主学习相关知识点的过程,侵删。 序言 本文使用llama.cpp框架,对 Llama3-8B-Instruct 模型进行gguf格式转换,8bit量化,并在CPU和GPU上对8bit模型进行推理。 测试平台...
-
记一次:Datawhale AI夏令营-第四期-魔搭-AIGC-Task02
前言:上一篇我们按步骤跑了一遍Baseline也生成了8张故事图片,但是原理啥的都是一头雾水,因为是初学者,所以只能一点点的分析来理解消化。这篇咱们就深入的来了解一下相关的内容。根据内容自己总结理解和查询相关的一些资料。不正确的地方提出来我修改一下。 学...
-
【Datawhale X 魔搭 AI夏令营】AIGC方向——Task02笔记GC
Task02 AI生图技术 为什么要了解AI生图前沿? AI生图的历史 AI生图的难点和挑战有哪些? 精读baseline代码(上次运行的) 再次生成图片 AI生图技术 为什么要了解AI生图前沿? AIGC(AI-Gene...
-
240810-Gradio自定义Button按钮+事件函数+按钮图标样式设定
A. 最终效果 B. 参考代码 要通过自定义HTML按钮来触发Gradio自带按钮的 click 函数,你可以使用JavaScript来模拟点击Gradio的按钮。这里是一个示例代码,展示了如何实现这一点: import gradio as...
-
使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意
引言 什么是Amazon Bedrock? Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere...
-
Datawhale X 魔搭AI夏令营 第四期 AIGC文生图方向 Task2笔记
这次的笔记主要是结合了AI来辅助学习和生成提示词,和上次Task1的笔记一样,笔者会先过一遍流程,在文末再补充相应的理论知识。 通义千问(如果已经有习惯的大语言模型可以跳过这一段) 通义千问是由阿里云开发的人工智能助手,这里给出链接,大家可以自行体验...
-
LyCORIS: 一种革命性的Stable Diffusion微调方法
LyCORIS简介 LyCORIS(Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion 是一个为Stable Diff...
-
Datawhale X 魔搭 AI夏令营‣AIGC文生图方向-Task2笔记
目录 一、用AI的prompts进行AI文生图 ‣通义千问 ‣跑baseline ‣结果展示: ‣另,prompts风格补充: 三、精读baseline ‣原始代码详情 ‣分析代码的主题架构 & 分析代码的主题...
-
最新口型同步技术EchoMimic部署
EchoMimic是由蚂蚁集团推出的一个 AI 驱动的口型同步技术项目,能够通过人像面部特征和音频来帮助人物“对口型”,生成逼真的动态肖像视频。 EchoMimic的技术亮点在于其创新的动画生成方法,它不仅能够通过音频和面部关键点单独驱动图像动画,还能结...
-
lit-llama代码解析
https://github.com/Lightning-AI/lit-llama/blob/main/README.md 下载的时候会报错误,因为网不行,一种方法就是多次尝试,另一种方法是终端连上代理下载 pycharm连接hugging fac...
-
【Datawhale X 魔搭 AI夏令营】第四期 AIGC方向 学习笔记
零基础30分钟速通文生图 一、开通阿里云PAI-DSW试用 1、开通阿里云免费试用 链接:https://free.aliyun.com/?productCode=learn 2、在魔搭社区进行授权 链接:https://www.models...
-
从【人工智能】到【计算机视觉】,【深度学习】引领的未来科技创新与变革
前几天偶然发现了一个超棒的人工智能学习网站,内容通俗易懂,讲解风趣幽默,简直让人欲罢不能。忍不住分享给大家,点击这里立刻跳转,开启你的AI学习之旅吧! 前言 – 人工智能教程https://www.captainbed.cn/lzx 1. 引言...
-
AIGC笔记--基于PEFT库使用LoRA
1--相关讲解 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS LoRA 在 Stable Diffusion 中的三种应用:原理讲解与代码示例 PEFT-LoRA 2--基本原理...
-
基于LLaMA-Factory微调llama3成为一个角色扮演大模型,保姆级教学零基础,导出GGUF格式前篇
训练私有本地大模型需求量越来越高了, 今天就从零基础开始,不讲原理,只看结果的来完整走一遍如何训练llama3成为角色扮演,先培养兴趣,后面有需要再补充原理 (1)准备环境 推荐:使用云计算机(当然4090高配大佬请忽略) 这不是广告!不是广告!你...
-
本地搭建和运行Whisper语音识别模型小记
搭建本地的Whisper语音识别模型可以是一个非常有用的项目,尤其是在需要离线处理语音数据的情况下。Whisper是OpenAI开发的一个开源语音识别模型,支持多语言和高效的转录能力。以下是详细的步骤来本地搭建和运行Whisper语音识别模型: 1....
-
OpenAI GPT-3 Davinci:引领AI写作新纪元
本文还有配套的精品资源,点击获取 简介:OpenAI研发的GPT-3模型,尤其是其Davinci版本,代表了自然语言处理领域的重大突破,具有1750亿参数,提升了AI在理解和生成语言的能力。GPT-3的Davinci版本以顶级性能著称,在多种语...
-
Llama-factory的yaml配置参数--学习记录
最近llama-factory的配置参数有很多不懂的地方,整理了一些但也有可能有错,仅供大家参考。 # 可选参数 # 模型和适配器相关 --adapter_name_or_path # 描述: 适配器的名称或路径。 --adapter_folder...
-
浅谈AIGC的底层技术
人工智能生成内容(Artificial Intelligence Generated Content, 简称AIGC)是近年来AI技术发展的一个重要领域,它利用机器学习和自然语言处理等技术,让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...
-
107 深入解析Llama Index的响应合成器 llamaindex.core.response_synthesizers.facotry.py
深入解析Llama Index的响应合成器 在自然语言处理(NLP)领域,Llama Index 是一个强大的工具,用于构建和处理复杂的语言模型。本文将深入探讨 Llama Index 中的一个关键组件——响应合成器(Response Synthesi...
-
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
【新智元导读】两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用
比赛🔗:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 报名赛事(点击即可跳转 (一定要进行报名,后面环境中的数据和授权等会用到) 赛事链接:https://tianchi.aliyun.com/competit...
-
使用PyTorch从零构建Llama 3
我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后,有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了,本文将详细指导如何从零开始构建完整的Llama 3模型架构,并在自定义数据集上执行训练和推理。 [图1]:Llama...
-
大模型之二十七-语音识别Whisper实例浅析
Whisper简介 Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预训练模型,而large-v3的标注数据超过了500万小时,其...
-
AIGC初体验 Datawhale X 魔搭夏令营
跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...
-
猫头虎 Gemma和Gemini模型的区别是什么?
猫头虎 🐯 Gemma和Gemini模型的区别是什么? 摘要📘 在这篇文章中,我们将深入探讨Gemma和Gemini这两个由Google开发的AI模型。我们会对比它们的参数规模、计算资源需求和集成难度,帮助大家了解这两者之间的主要区别。无论你是AI...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营
Task2:精读代码,实战进阶 聊聊相关:虽然现在很多的AI绘图都能被大家说“一眼鉴AI”,但随着技术日新月异的变化,我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
Datawhale X 魔搭 AI夏令营 第四期AIGC_task03笔记
工具初探一ComfyUI 认识ComfyUI ComfyUI 是"Graphical User Interface"(图形用户界面)的缩写,简单来说,GUI 就是你在电脑屏幕上看到的那种有图标、按钮和菜单的交互方式。ComfyUI 是GUI的一种,是...
-
LLM之基于llama-index部署本地embedding与GLM-4模型并初步搭建RAG(其他大模型也可,附上ollma方式运行)
前言 日常没空,留着以后写 llama-index简介 官网:https://docs.llamaindex.ai/en/stable/ 简介也没空,以后再写 注:先说明,随着官方的变动,代码也可能变动,大家运行不起来,可以进官网查查资料...
-
Datewhale AI夏令营第四期 AIGC方向Task1笔记
①文生图基基础知识: ✔提示词:主体描述,细节描述,修饰词,艺术风格,艺术家 ✔Lora模型:实现对特定主题、风格或任务的精细化控制 ✔ComfyUI:模型微调、数据预处理、图像生成 ✔参考图控制:openp...
-
【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器
项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。 官网中有以下功能开源供大家参考: FLUX.1 擅长在图像中准确再现文字,因此非常适合需要清晰文字或...
-
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记)
Datawhale X 魔搭 AI夏令营第四期(AIGC学习笔记) 00. Diffusion 扩散模型 去噪扩散模型(Denoising diffusion probabilistic models,DDPM) 正向扩散过程 逆向去噪过程...
-
基于 Llama factory 微调 Llama3.1-70B-Chinese-Chat
本文旨在探讨基于Llama factory使用LoRA(Low-Rank Adaptation)技术对Llama3.1-70B-Chinese-Chat模型进行微调的过程,重点介绍在单机多卡和多机多卡两种分布式训练环境下的实现方法。 1.环境准备...
-
Llama-X 开源项目指南
Llama-X 开源项目指南 Llama-XOpen Academic Research on Improving LLaMA to SOTA LLM项目地址:https://gitcode.com/gh_mirrors/ll/Llama-X 项目...
-
Coze工作流之使用Stable Diffusion插件实现儿童故事绘本
不清楚coze使用的可以参考这篇文章coze全方位剖析 也推荐这个免费AI知识库给大家 👀AI洞察者中心|知识库 - 飞书云文档 (feishu.cn 话不...
-
【Datawhale X 魔搭 AI夏令营第四期-AIGC方向】 Task1笔记:跑通baseline
前言 Datawhale的官方速通文档:https://linklearner.com/activity/14/10/24 本篇文章基于官方文档内容进行归纳总结。 跑通代码 Step0:开通阿里云PAI-DSW试用 阿里云PAI-DSW(Data...
-
Chinese-Llama-2-7b 开源项目教程
Chinese-Llama-2-7b 开源项目教程 Chinese-Llama-2-7b开源社区第一个能下载、能运行的中文 LLaMA2 模型!项目地址:https://gitcode.com/gh_mirrors/ch/Chinese-Llama-2...
-
8G显存运行Llama 3.1 405B!
我正在接受挑战,在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB!这是 8GB VRAM 容量的 103 倍! 显然,8GB VRAM 无法容纳它。那么我们如何让它工作呢?...
-
DataWhaleX魔搭夏令营第四期AIGC方向task01笔记
从零入门AI生图原理&实践是Datawhale AI 夏令营(第四期)“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 在task01中,我们主要在魔搭社区搭建PAI实例并体验一下baselin...
-
DataWhale多模态赛事Task1
赛事链接:https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述:在当下大数据、大模型时...
-
Stable Diffusion的微调方法原理总结
目录 1、Textural Inversion(简易) 2、DreamBooth(完整) 3、LoRA(灵巧) 4、ControlNet(彻底) 5、其他 1、Textural Inversion(简易) 不改变网络结构...