模型训练第4页 - AIGC资讯

小白教程：Unsloth 打造属于自己的中文版Llama3

在定制化业务场景中，如果利用专属数据集，经过微调的大模型能够在多种任务上与GPT-4媲美，并支持本地部署，保护隐私，同时还能降低运算成本。最新推出的Llama3，作为当前性能最强的开源基础大模型，非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机...

AIGC 2024-08-20 人工智能

2958阅读

Datawhale X 魔塔AI夏令营 ——从零入门AI生图原理&实践_task 1

一. 基础知识 1.1 文生图发展历史 1.2 文生图基础知识文生图主要以SD系列基础模型为主，以及在其基础上微调的lora模型和人物基础模型等。 1.2.1 文生图流程图 1. 输入提示词 ...

大数据 2024-08-20 人工智能

978阅读

【深度学习】LLaMA-Factory 大模型微调工具, 大模型GLM-4-9B Chat ，微调与部署 (2)

文章目录数据准备 chat 评估模型导出模型部署总结资料： https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md https:...

生成式AI 2024-08-20 人工智能

1313阅读

从头开始微调Llama 3.1模型

在今天的科技专栏中，我们将深入探讨如何微调Llama 3.1模型，以使其更好地适应您的特定领域数据。微调大型语言模型（如Llama）的主要目的是为了在特定领域的数据上表现更好，从而生成更符合您需求的输出。以下是我们将要介绍的五个主要步骤：安装必要的软...

人工智能 2024-08-19 人工智能

1190阅读

【史上最强的AIGC的使用场景和具体案例分析】

AIGC（Artificial Intelligence in Game Creation）是一种利用人工智能技术辅助游戏开发的方法。它可以用于游戏中的各个方面，包括游戏设计、关卡设计、角色设计、AI行为设计等。以下是一些AIGC的使用场景和具体案例...

人工智能 2024-08-19 人工智能

1445阅读

Datawhale X 魔搭 AI夏令营第四期 AIGC方向学习笔记（一）

本期主要任务是了解AI文生图的原理并进行相关实践下面是对baseline部分代码的功能介绍：安装Data-juicere和DiffSynth-Studio !pip install simple-aesthetics-predictor !pip...

大数据 2024-08-19 人工智能

1045阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task 1笔记

引言本笔记可以作为学习手册的扩充版本，也是一份快速上手的指南。灰色的备注部分包含了关于步骤的详细解释和扩展内容，建议你可以先跳过这些备注，等完成所有步骤后再回头查阅。第一步：搭建代码环境 1.1 申请阿里云PAI-DSW 阿里云PAI-D...

人工智能 2024-08-18 人工智能

984阅读

ComfyUI系列教程(1)--Stable Diffusion基本原理

1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示，主要包括3个部分。其中1是CLIP图像文本对，将图...

大数据 2024-08-18 人工智能

1162阅读

Lag-Llama 开源项目实战指南

Lag-Llama 开源项目实战指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:https://gitcode...

生成式AI 2024-08-18 人工智能

1380阅读

LLAMA Factory: 简洁高效的大语言模型训练平台

LLAMA Factory: 简洁高效的大语言模型训练平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_...

大数据 2024-08-17 人工智能

2078阅读

LLaMA-Factory全面指南：从训练到部署

项目背景与概述 LLaMA-Factory项目目标 LLaMA-Factory项目是一个专注于大模型训练、微调、推理和部署的开源平台。其主要目标是提供一个全面且高效的解决方案，帮助研究人员和开发者快速实现大模型的定制化需求。具体来说，LLaMA-F...

大数据 2024-08-16 人工智能

6240阅读

【机器学习】Google开源大模型Gemma2：原理、微调训练及推理部署实战

目录一、引言二、模型简介 2.1 Gemma2概述 2.2 Gemma2 模型架构三、训练与推理 3.1 Gemma2 模型训练 3.1.1 下载基座模型 3.1.2 导入依赖库 3.1.3 量化配置 3.1.4 分词器和模型实...

生成式AI 2024-08-16 人工智能

1012阅读

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...

生成式AI 2024-08-16 人工智能

2045阅读

Chinese-LLaMA-Alpaca-3 项目使用教程

Chinese-LLaMA-Alpaca-3 项目使用教程 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:https:/...

人工智能 2024-08-15 人工智能

932阅读

Datawhale X 魔搭 AI夏令营第四期 | AIGC文生图——可图Kolors-LoRA风格故事 Task1笔记

Hi，大家好，我是半亩花海。最近在尝试学习AIGC的内容，并报名参加了Datawhale举办的2024年AI第四期夏令营，主要学习内容是从零入门AI生图原理和实践。本次活动基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”进而开展的项目实践学习，很适...

人工智能 2024-08-14 人工智能

872阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory（五）

一、前言本篇文章将使用LLaMA-Factory去高效微调QWen2系列模型，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low...

生成式AI 2024-08-14 人工智能

1316阅读

Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记

不用写一行代码，只需要跟着步骤点点点，就可以完成task01！本笔记可视作学习手册速通指南的扩充版本。灰色的备注是关于该步骤的解释和拓展，可以先跳过，等走完所有步骤再回头看！第一步搭建代码环境 1.1 阿里云PAI-DSW申请...

人工智能 2024-08-12 人工智能

983阅读

Huatuo Llama Med Chinese 教程

Huatuo Llama Med Chinese 教程 Huatuo-Llama-Med-ChineseRepo for BenTsao [original name: HuaTuo (华驼 ], Instruction-tuning Large La...

大数据 2024-08-12 人工智能

986阅读

Stable Diffusion之最全详细图解

Stable Diffusion是一种生成模型，用于生成高质量的图像。这种模型基于扩散过程，能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解，涵盖其原理、模型结构、训练过程及应用示例。一、Stable Diffusi...

人工智能 2024-08-11 人工智能

1672阅读

记一次：Datawhale AI夏令营-第四期-魔塔-AIGC-Task01

前言：随着AI时代的来临，本人也想深入的了解一下不被时代淘汰（紧追）正好看见有夏令营这方面的，顺便来参加一下学习一下。学习任务目录一、赛事环境准备二、跑通 “可图Kolors-LoRA风格故事挑战赛” 一、赛事环境准备 0、夏令营介绍...

AIGC 2024-08-10 人工智能

1130阅读

Datawhale AI夏令营第四期魔搭-AIGC方向 task01笔记

目录赛题内容可图Kolors-LoRA风格故事挑战赛 baseline要点讲解(请配合Datawhale速通教程食用 Step1 设置算例及比赛账号的报名和授权 Step2 进行赛事报名并创建PAI实例 Step3 执行basel...

大数据 2024-08-10 人工智能

827阅读

内容数字化的革命：AIGC的现状与未来

本文将聚焦设计师群体，看看被AI赋能的内容数字化工具如何帮助内容设计师们减负提效。目前内容设计师团队正在经历的痛点有如下几条：这些痛点，是我们在与品牌内容设计师团队沟通时，获得的一手声音。跨行业来看，多产品SKU的ToC品牌内容设计师们，对内容...

大数据 2024-08-10 人工智能

1423阅读

本地部署私人知识库的大模型！Llama 3 + RAG！

在今天的的教程中，我们将打造更加个性化的大模型，可以定制搭载私人知识库的本地大模型！我们探讨Meta AI 的尖端 Llama 3 语言模型构建强大的检索增强生成（RAG）来实现。通过利用 Llama 3 和 RAG 技术的功能，我们将创建一个应用...

人工智能 2024-08-08 人工智能

1751阅读

深度探索：Dreambooth与Stable Diffusion的梦幻交织

深度探索：Dreambooth与Stable Diffusion的梦幻交织项目介绍梦想启航，艺术与技术的碰撞——Dreambooth for Stable Diffusion。这一项目巧妙地结合了当下热门的人工智能领域两大神器：Stable Dif...

AIGC 2024-08-08 人工智能

906阅读

Stable Diffusion如何训练属于自己的Lora模型

Stable Diffusion如何训练属于自己的Lora模型前面（Stable diffusion的本地部署以及使用）介绍了那么多，相信你一定对Stable Diffusion有了一定的认知，那么你是否也在想：我下载的都是别人训练的模型，那我该怎么...

AIGC 2024-08-07 人工智能

1530阅读

AI写作革命：PyTorch如何助力人工智能走向深度创新

身为专注于人工智能研究的学者，我十分热衷于分析"AI写稿"与"PyTorch"这两项领先技术。面对日益精进的人工智能科技，"AI写作"已不再是天方夜谭；而"PyTorch"如璀璨明珠般耀眼，作为深度学习领域的尖端工具，正有力地推进着人工智能化进程。于此篇文...

生成式AI 2024-08-07 人工智能

870阅读

Stable Diffusion教程|练丹师是如何炼丹的Lora模型训练

前言还记得我们之前就讲过学习SD成为炼丹师不？那么今天就来手把手教大家炼丹，看看同一个角色或某种风格的小模型是如何制作出来的。目录 1 炼丹介绍 2 环境准备 3 Lora模型训练 **一、**炼丹介绍什么是炼丹？早在学习SD地第...

人工智能 2024-08-07 人工智能

1516阅读

AI绘画；（Stable Diffusion进阶篇：模型训练）

前言在上一篇笔记中学习了解了一部分关于Stable Diffusion的运行原理，今天就来接着学习下Stable Diffusion关于微调训练方面的知识点。今天没多少废话，因为我下午要去玩PTCG！让我们冲冲冲整理和输出教程属实不易，觉得这...

大数据 2024-08-06 人工智能

1008阅读

部署微调框架LLaMA-Factory

LLaMA Factory 1.我们在ChatGLM3的github官方页面上能看到对LLaMA-Factory的推荐 2.LLaMA Factory github链接 hiyouga/LLaMA-Factory: Unify Efficien...

大数据 2024-08-05 人工智能

1268阅读

最强大模型 Llama 3.1-405B 架构设计剖析

—1— 最强大模型 Llama 3.1-405B 简介在历经了两天的提前“泄露风波”后，Llama 3.1 终于正式揭开面纱，由官方对外公布。新版 Llama 3.1 将其上下文处理能力扩展至 128K，推出了 8B、70B 及 405B 三个不...

人工智能 2024-08-05 人工智能

1370阅读

Stable Diffusion 深入浅出,一看就会

Stable Diffusion 是一个基于深度学习的图像生成模型，旨在生成高质量的图像。下面是一个 Stable Diffusion 入门案例教程，旨在帮助您快速入门 Stable Diffusion。安装 Stable Diffusion 首先，...

人工智能 2024-08-05 人工智能

1056阅读

如何定量分析 Llama 3，大模型系统工程师视角的 Transformer 架构

读完全文后，你将获得回答以下问题的能力（参考答案，请见最后一章节）： Llama 3 技术博客说 70B 模型、最长序列 8K、15T Tokens，训练了 640w GPU 时，这发挥了 H100 理论算力（989TFlops）的百分之多少?...

大数据 2024-08-05 人工智能

906阅读

【机器学习】机器学习与医疗健康在疾病预测中的融合应用与性能优化新探索

文章目录引言第一章：机器学习在医疗健康中的应用 1.1 数据预处理 1.1.1 数据清洗 1.1.2 数据归一化 1.1.3 特征工程 1.2 模型选择 1.2.1 逻辑回归 1.2.2 决策树 1.2.3 随机森林 1.2...

大数据 2024-08-02 人工智能

1093阅读

山大软院创新实训之大模型篇（二）——Llama Factory微调Qwen实践

山大软院创新实训之大模型篇（二）——Llama Factory微调Qwen实践 LLaMA Factory 是一个用于微调和部署 LLaMA (Large Language Model Applications 模型的框架。它旨在简化大语言模型的使用...

生成式AI 2024-08-02 人工智能

1401阅读

LLama-Factory使用教程

本文是github项目llama-factory的使用教程注意，最新的llama-factory的github中训练模型中，涉及到本文中的操作全部使用了.yaml配置。新的.yaml的方式很简洁但不太直观，本质上是一样的。新的readme中的.yam...

人工智能 2024-08-01 人工智能

2568阅读

Stable Diffusion：质量高&画风清新&细节丰富的二次元大模型二次元插图

今天和大家分享一个基于Pony模型训练的二次元模型：二次元插图。关于该模型有4个不同的分支版本。 1.5版本：loar模型，推荐底模型niji-动漫二次元4.5。 xl版本：SDXL模型版本 mix版本：光影减弱，减少SDXL版本色调偏暖有种...

生成式AI 2024-08-01 人工智能

1188阅读

LLM大模型实战项目--基于Stable Diffusion的电商平台虚拟试衣

本文详细讲解LLM大模型实战项目，基于Stable Diffusion的电商平台虚拟试衣一、项目介绍二、阿里PAI平台介绍三、阿里云注册及开通PAI 四、PAI_DSW环境搭建五、SD+LORA模型微调一、项目介绍 ...

大数据 2024-07-31 人工智能

1226阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1956阅读

使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

文章目录模型及数据：模型下载数据 LLaMA-Factory启动拉取代码启动webui 模型训练数据导入数据预览设置模型路径配置参数及参数的保存开始训练过程观察加载模型、对话模型导出、再次加载...

人工智能 2024-07-31 人工智能

1328阅读

Stable Diffusion【真人模型】：SD1.5人像模型新高度，超级逼真的AI真人模型：AWPortaint

今天和大家分享一个基于SD1.5基础模型训练的人像大模型AWPortrait。该模型在真人写实摄影方面效果超级逼真，能够模拟在真实摄影中的光影效果、皮肤纹理质感、甚至是人物的表情和妆容。目前最新的版本是V1.4，在V1.3版本的基础上升级而来，对大模型...

人工智能 2024-07-30 人工智能

1335阅读

深度解读AIGC技术背后的算法原理

深度解读AIGC技术背后的算法原理欢迎光临未来的文字工厂：AIGC的奇妙世界想象力的火花：AIGC技术如何让创作焕发新生从零到英雄：AIGC背后的核心算法简史拨开云雾见青天：解密AIGC的算法基础语言模型：词与句的舞蹈编排师深...

人工智能 2024-07-30 人工智能

912阅读

【爆】Stable Diffusion【真人模型】：全网最真实的亚洲女性大模型

模型v1下载：XXMix_9realisticSDXL-Checkpoint-展夜枭-LiblibAI 环境要求： gpu：12G+ 最好16G+ python：3.10 cuda：11.8 一、介绍 XXMix_9realisticSDXL是...

AIGC 2024-07-30 人工智能

2104阅读

stable diffusion中dreambooth模型训练

stable diffusion中dreambooth模型训练简介一、参考材料二、运行备注模型训练步骤一、连接服务器二、虚拟环境配置简介一、参考材料 1、Github项目网址 2、huggingface...

AIGC 2024-07-26 人工智能

1160阅读

Stable Diffusion【Pony模型】【二次元模型】：质量高&画风清新&细节丰富的二次元大模型二次元插图

今天和大家分享一个基于Pony模型训练的二次元模型：二次元插图。关于该模型有4个不同的分支版本。 1.5版本：loar模型，推荐底模型niji-动漫二次元4.5。 xl版本：SDXL模型版本 mix版本：光影减弱，减少SDXL版本色调偏暖有种过曝的感觉...

生成式AI 2024-07-26 人工智能

1730阅读

AI绘画引发艺术界地震：抄袭争议、原创危机，画师们如何自处？

▲ 画作《一个男人在用AI作画》，作者是AI。（视觉中国 / 图）两年来，AI绘画技术一路狂奔，并织起一张抄袭之网。AI抄人，人又抄AI……到底什么是绘画？盖茨不会画画，但会用AI画画。以生成式AI软件Midjourney为代表的AI绘画模型，...

人工智能 2024-07-23 人工智能

1191阅读

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒

凌晨4:20，大洋彼岸的最大超算训练集群开始轰鸣。「420」也是马斯克最喜欢玩的梗，象征着自由、不受约束和反传统。马斯克频繁把「420」用在他的产品定价，公司开会时间和星舰一发射时间上等等。网友也在评论区打趣马斯克超绝仪式感，不到4:20不开工。...

人工智能 2024-07-23 人工智能

907阅读

【05】LLaMA-Factory微调大模型——初尝微调模型

上文【04】LLaMA-Factory微调大模型——数据准备介绍了如何准备指令监督微调数据，为后续的微调模型提供高质量、格式规范的数据支撑。本文将正式进入模型微调阶段，构建法律垂直应用大模型。一、硬件依赖 LLaMA-Factory框架对硬件和软件的...

AIGC 2024-07-23 人工智能

1597阅读

以全栈智算拥抱生态，为AIGC种一棵向上生长的巨榕

榕树，被称为百木之王。它既有极深的根，又有繁茂的叶。只要一棵榕树长成，就能够独木成林，遮天蔽日。更可贵的是，榕树可以为树荫下繁茂的生态提供支撑，形成“一榕生，万物长”的格局。开年以来，OpenAI推出了炸裂的Sora文生视频模型，再一次将...

人工智能 2024-07-23 人工智能

792阅读

AFAC2024-基于保险条款的问答比赛日记 llamafactory qwen npu 910B1

AFAC2024: 基于保险条款的问答挑战——我的实战日记概述在最近的AFAC2024竞赛中，我参与了基于保险条款的问答赛道。这是一次深度学习与自然语言处理的实战演练，旨在提升模型在复杂保险文本理解与问答生成方面的能力。本文将分享我的参赛过程，...

大数据 2024-07-21 人工智能

1054阅读

AI绘画：多种XP一次满足（Stable Diffusion进阶篇：模型训练）

前言今天，是一个比较特殊的日子。从我开始学习AI绘画开始到现在AI工具相关的笔记我已经写了50篇了，其中估摸着得近40篇都是关于Stable Diffusion的。在这一天天的学习中我感受到了对知识的疲倦，是时候给自己来点奖励了！所以...

大数据 2024-07-20 人工智能

931阅读