模型训练第3页 - AIGC资讯

Stable Diffusion训练LoRA模型参数详细说明（阿里巴巴堆友AI）

工具：线上模型训练堆友AI 一、训练参数批量大小 (Batch Size 作用：每次训练中使用的样本数量。参考值：可以从 8 到 64，取决于显存大小。训练轮数 (Epochs 作用：完整遍历训练数据的次数。参考值：通...

人工智能 2024-09-18 人工智能

2429阅读

大模型+小模型协同处理跨文档理解任务，成本更低，性能更高

“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...

大数据 2024-09-13 人工智能

1485阅读

分享一个AI开发者的强力助手：openMind Library

在人工智能的浪潮中，深度学习开发套件 openMind Library，以其强大的功能和易用性，逐步成为AI开发者们的强力助手。本文将通过魔乐社区近期关注挺高的大模型平台魔乐社区，深入了解openMind Library。 openMind Librar...

大数据 2024-09-12 人工智能

1210阅读

对标英伟达B200！马斯克：特斯拉2025年末批量装备Dojo 2 AI训练芯片

快科技9月11日消息，据媒体报道，马斯克在出席All-In Summit 2024活动时表示，特斯拉的下代AI芯片Dojo 2将于2025年末批量装备。马斯克强调，特斯拉的AI生态系统构筑精妙，其中Dojo扮演着模型训练的核心角色，而部署于车辆中的专用芯...

生成式AI 2024-09-11 人工智能

926阅读

AI日报：Vidu推“主体参照”功能；200美元ChatGPT Pro上线；荣耀手机首发 AI 智能体

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、Vidu推出“主体参照”功能...

生成式AI 2024-09-11 人工智能

1024阅读

欺诈文本分类检测（十一）：LLamaFactory多卡微调

1. 引言前文训练时都做了一定的编码工作，其实有一些框架可以支持我们零代码微调，LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台，有如下特性：支持常见的模型种类：LLaMA、Mixtral-MoE、Qwen、B...

生成式AI 2024-09-11 人工智能

2149阅读

AIGC的社会责任：AIGC的社会责任

AIGC的社会责任：AIGC的社会责任作者：禅与计算机程序设计艺术 1. 背景介绍 1.1 AIGC的兴起与社会影响近年来，人工智能生成内容（AIGC）技术发展迅速，其应用范围不断扩大，对社会产生了深远的影响。从文本创作、图像生成到音频合成，A...

生成式AI 2024-09-11 人工智能

878阅读

200美元的ChatGPT Pro正式上线，聪明N倍的新模型草莓要来了。

半夜10点，The Information发了个新闻，透露了OpenAI的新模型，草莓，要来了。两个小时后，我的好朋友@solitude（美东时间），作为一个常年拥有第一手资料和信息的人，跟我说，ChatGPT Pro会员上线了，售价200刀/月，他已...

生成式AI 2024-09-11 人工智能

1131阅读

关于大模型和AIGC的36条笔记和真话

行业到底有多卷？最新统计，中国已有130多个大模型问世，在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型，仅2023年就有超60家创业公司拿到融资，产品更是布满了基础层、模型层和应用层。新一代生成式AI，可能要回头看看上一...

人工智能 2024-09-10 人工智能

889阅读

利用Stable Diffusion AI图像模型评估智能车模型算法表现(下篇)

今天小李哥将介绍亚马逊云科技的Jupyter Notebook机器学习托管服务Amazon SageMaker上，通过AI图像生成模型Stable Diffusion Upscale和Depth、向量知识库和LangChain Agent，生成用于AI 智...

人工智能 2024-09-10 人工智能

1160阅读

ComfyUI教程，如何在 ComfyUI 中如何制作高质量白底图，一篇文章教会你！

前言做电商的朋友都知道，一般平台都会有白底图的要求，在上传白底图后，商品在首页分类页、搜索分类页、品牌馆、电器城等场景中会有更多的露出机会，可能会获得更多的用户流量。制作白底图本质就是要先抠图，一些抠图质量比较高的网站，比如 https://re...

生成式AI 2024-09-09 人工智能

2632阅读

AI日报：Fluxgym傻瓜式训练FLUX Lora；弱智吧成中文AI训练“金矿”；美国法官用AI解读法律

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ 1、12G显存就能玩转AI模型训练...

生成式AI 2024-09-09 人工智能

1140阅读

提高警惕！博主AI换脸三小时骗走女子一年工资

快科技9月7日消息，据媒体报道，博主滤镜粉碎机用一段15秒AI换脸视频，三小时就骗”走自己妈妈一年的收入，该视频上线后引发关注。对此，有60%的受访者表示，凭借肉眼辨认不出AI换脸视频。据了解，AI换脸技术的核心在于图像识别和图像生成。首先，通过计算...

人工智能 2024-09-08 人工智能

795阅读

Llama 3.1 92页技术报告详细解读

引言半个月前，Meta发布了他们的开源大模型Llama3.1，在社区中引起广泛关注和讨论。现在几周的时间过去了，热度逐渐退潮，舆论逐渐降温，整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1，正是理性地来审视一下这款大模型...

人工智能 2024-09-07 人工智能

1571阅读

Llama-factory的yaml配置参数--学习记录

最近llama-factory的配置参数有很多不懂的地方，整理了一些但也有可能有错，仅供大家参考。 # 可选参数 # 模型和适配器相关 --adapter_name_or_path # 描述: 适配器的名称或路径。 --adapter_folder...

人工智能 2024-09-06 人工智能

3730阅读

【Stable diffusion】绘世启动器绘画有多简单？

文章目录目录文章目录概要整体架构流程一、插件与模型集成二、对新手友好三、绘画高手如虎添翼技术细节小结概要随着秋叶大神的绘世启动器4.8版本发布，AI绘画的搭建过程越来越...

大数据 2024-09-06 人工智能

1861阅读

【06】LLaMA-Factory微调大模型——微调模型评估

上文【05】LLaMA-Factory微调大模型——初尝微调模型，对LLama-3与Qwen-2进行了指令微调，本文则介绍如何对微调后的模型进行评估分析。一、部署微调后的LLama-3模型激活虚拟环境，打开LLaMA-Factory的webui页面...

AIGC 2024-09-05 人工智能

2649阅读

Datawhale X 魔搭 AI夏令营AIGC方向task2

第一步：安装安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...

生成式AI 2024-09-05 人工智能

888阅读

AIGC初体验 Datawhale X 魔搭夏令营

跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...

生成式AI 2024-09-05 人工智能

856阅读

AI数据告急，大厂盯上廉价年轻人

为了拿到新数据、训练AI大模型，字节等互联网大厂正在亲自下场，以单次300元不等的价格招募“AI录音员”，定制语料库。坐落于北京大钟寺的字节办公楼，集中了字节的抖音业务团队和火山引擎业务团队，从年初便开始招募素人为豆包大模型录音。两人结组、单次3小时，包...

大数据 2024-09-03 人工智能

792阅读

再融近5亿！清华系AI创业新势力，成最吸金“算力运营商”

一笔近5个亿新融资，投向AI大模型领域。量子位独家获悉，清华系AI创业公司无问芯穹完成了近5亿元A轮融资。加码的股东阵容很全、很豪华: 一口气新增15家股东，涵盖北京上海等地的国资/地方基金，顺为资本/达晨财智等市场化头部VC，还有券商直投和产业CVC。...

人工智能 2024-09-03 人工智能

889阅读

Stable Diffusion模型训练：从数据准备到模型优化

Stable Diffusion模型训练：从数据准备到模型优化开篇引入：探索创意无限的Stable Diffusion 数据集构建秘籍：打造专属训练素材如何收集高质量图像数据？数据预处理小技巧：清洗与标注模型配置与训练实战：让创意流...

AIGC 2024-09-01 人工智能

1329阅读

【Datawhale X 魔搭 AI夏令营第四期-AIGC方向】 Task1笔记：跑通baseline

前言 Datawhale的官方速通文档：https://linklearner.com/activity/14/10/24 本篇文章基于官方文档内容进行归纳总结。跑通代码 Step0：开通阿里云PAI-DSW试用阿里云PAI-DSW（Data...

生成式AI 2024-09-01 人工智能

1044阅读

服务器部署llama3 并利用LLaMA-Factory实现微调

llama3的编译环境要求：需要的软件，硬件资源： python=3.11 pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.2 第一步下载需要的pytho...

生成式AI 2024-08-31 人工智能

1188阅读

6小时完成Llama 3.1-8B适配并开源！MindSpore Transformers大模型套件使能开发者创新

北京时间7月24号, Meta 正式发布 Llama 3.1开源大语言模型, 包含8B、70B 及 405B 参数版本。其中的Llama 3.1 405B模型，在多项基准测试中可以媲美GPT4、Claude3.5等目前最强的闭源大模型。此外，8B 与 70...

生成式AI 2024-08-31 人工智能

1373阅读

AIGC文生图 Task01#Datawhale X 魔搭AI夏令营

从零入门AI生图原理&实践是 Datawhale 2024 年 AI 夏令营第四期的学习活动（“AIGC”方向），基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。以下是笔者对Task01教程的一些记录。 30min速通指...

AIGC 2024-08-31 人工智能

848阅读

国内最大智算中心正式投用：每秒690亿亿次浮点运算可训练万亿参数大模型

快科技8月31日消息，日前，由中国移动承建的国内运营商最大单集群智算中心在哈尔滨正式运营。据悉，该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。单集群智算中心把所有AI加速卡打造成1个集群，用以支持千万亿级参数的大模型进行训练。这...

大数据 2024-08-31 人工智能

878阅读

DataWhaleX魔搭夏令营第四期AIGC方向task01笔记

从零入门AI生图原理&实践是Datawhale AI 夏令营（第四期）“AIGC”方向的学习活动，基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。在task01中，我们主要在魔搭社区搭建PAI实例并体验一下baselin...

人工智能 2024-08-31 人工智能

853阅读

DataWhale多模态赛事Task1

赛事链接：https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述：在当下大数据、大模型时...

生成式AI 2024-08-31 人工智能

875阅读

精通 Stable Diffusion 调优秘籍

一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具，其调优具有至关重要的意义。通过合理的调优，可以显著提升图像生成的质量、速度和准确性，满足用户更加多样化和精细化的需求。调优主要涵盖了...

AIGC 2024-08-31 人工智能

1065阅读

stable diffusion参数说明

文章目录采样方法高清修复放大算法宽度、高度提示词相关性采样迭代步数 Lora模型使用生成批次每批数量提示词相关性随机种子补充参考资料采样方法没有优劣之分，速度不一样。一般Euler a、DPM++ 2M...

人工智能 2024-08-31 人工智能

1321阅读

论文分析｜高效长文本生成的技术与应用

Preface 前言目前大模型公司很多在追求长文a本，对算力需求极大，如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长，它们在训练期间的内存需求呈指数级增加。语言模型训练的瓶颈在于显存占用非常大，这需要创...

生成式AI 2024-08-30 人工智能

1051阅读

鹅厂也下场，文档解析的痛点是什么？

最近，文档解析赛道颇为火热，产品更新迭代频繁，与各类大模型上下游一样发展势头很劲。6月下旬，鹅厂也在多个产品上线了文档解析功能。文档智能交互是企业、学术、个人工作中必不可少的一环，作为大模型应用的典型场景之一，它对准确、高效的文档解析工具有着长期需求。...

大数据 2024-08-29 人工智能

1134阅读

大模型框架汇总：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel

常见的大模型框架：大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel：大模型框架是指用于训练、推理和部署大型语言模型（LLMs）的软件工具和...

生成式AI 2024-08-28 人工智能

1806阅读

液冷技术：迎接AIGC时代数据中心的散热挑战

随着人工智能生成内容（AIGC）的跨越式发展，算力需求呈爆炸式增长，带动了数据中心的功耗和热管理需求的飞速上升。AI模型训练和推理过程中的高计算资源需求，导致服务器发热量大幅增加，对散热技术提出了更高的要求。根据Colocation America发布的数...

生成式AI 2024-08-27 人工智能

845阅读

深度解读 Llama 3.1 技术报告：从405B参数到24000块H100集群

Meta在最近发布了他们的开源大模型Llama 3.1，引起了广泛的关注和讨论。随着热度逐渐退潮，Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面，...

大数据 2024-08-27 人工智能

1396阅读

华为发布AI百校计划：培养AI人才每年获最高100万支持

快科技8月26日消息，华为公司最近正式启动了华为AI百校计划”，向国内高校提供基于昇腾云服务的AI计算资源。该计划致力于解决高校师生在AI领域的科研创新和人才培养过程中，常遇到的算力资源不足等问题。计划将重点资助那些在AI领域有深入研究和影响力的高校团...

人工智能 2024-08-26 人工智能

800阅读

图像检索在ImageNet分类任务中的优势：超越扩散模型生成图像

?在之前AIGC助力ResNet分类任务：跃升10个百分点-CSDN博客文章中，提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强，再进行分类任务，精度上升。 ?而今天要聊到的这篇论文更全面地探究了扩散模型...

AIGC 2024-08-25 人工智能

1295阅读

精读代码，实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记

基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时，也被一些心怀不轨之人当作牟利里的技术，如Deepfake技术。 AI生图最早的工具是机械臂输出作画，现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说，AI生图模型属于多模...

大数据 2024-08-25 人工智能

813阅读

【AIGC】FaceChain:发挥生成式内容的无限可能性

基于图像生成的个性化肖像框架摘要 FaceChaine提供了一系列的生成方案，通过少量的图像输入，就能生成逼真的个性化肖像。它是一个个性化肖像生成框架，包含丰富的人脸感知相关的模型，例如人脸检测，深度人脸向量提取，人脸属性分析等等。输入主要的肖像...

生成式AI 2024-08-25 人工智能

934阅读

DALL·E 2 模型实现与运行指南

DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...

大数据 2024-08-25 人工智能

1663阅读

摩尔线程开源音频理解大模型MooER：38小时训练5000小时数据

快科技8月23日消息，摩尔线程官方宣布，音频理解大模型MooER”（摩耳）已经正式开源，并公布在GitHub上：https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码，以及5000小时数据训练的模型，后续还将...

大数据 2024-08-24 人工智能

884阅读

【课程总结】day24（上）：大模型三阶段训练方法(LLaMa Factory)

前言本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段，包括：预训练、监督微调和偏好纠正。大模型训练回顾训练目标训练一个医疗大模型训练过程实施准备训练框架 LLaMA Factory是一款开源低...

生成式AI 2024-08-24 人工智能

1769阅读

Stable Diffusion【Pony模型】【2.5D模型】：细腻画质&可爱韩版风格的大模型Speciosa 2.5D

大家好我是安琪！！！ Stable Diffusion是一款前沿的AI图像生成技术，它能够根据提示词创造出极具艺术感的图像。本文将探讨如何利用Stable Diffusion的图生图功能和局部重绘（手涂蒙版）技术，为您的艺术创作带来全新的创意和个性化表达...

人工智能 2024-08-24 人工智能

1727阅读

Dreambooth-Stable-Diffusion 使用教程

Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...

人工智能 2024-08-24 人工智能

900阅读

没有算力？我发现一个白PIAO 4090 GPU的机会

最近发现京东云在推他们的GPU算力平台，竟然被我发现一个白嫖的机会，花9块9，可以用两天英伟达4090，太爽了。不知道是不是他们的一个BUG，反正现在亲测有效。我是凌晨1点买的，原以为是第二天凌晨1点就到期了，没想到是第二天晚上12点才到期，应该是他们...

人工智能 2024-08-23 人工智能

920阅读

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

一、前言本篇文章将使用LLaMA-Factory去合并微调后的模型权重，通过阅读本文，您将能够更好地掌握这些关键技术，理解其中的关键技术要点，并应用于自己的项目中。二、术语介绍 2.1. LoRA微调 LoRA (Low-Ra...

AIGC 2024-08-22 人工智能

1314阅读

掌握 Llama 3.1：轻松本地部署与远程使用的全攻略

前言: Llama 3.1 是 Meta（Facebook 的母公司）发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B（80 亿参数）、70B（700 亿参数）和 405B（4050 亿参数）模型。其中，405B 是 Meta 迄...

生成式AI 2024-08-22 人工智能

2485阅读

Datawhale Al夏令营 AIGC方向 task2

1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...

AIGC 2024-08-21 人工智能

937阅读

使用llama factory对语言模型微调，重塑自我认知，并部署于ollama上

本文记录了从环境部署到微调模型、效果测试并部署的全过程。一环境如果使用autodl租赁服务器则不需要如下步骤，但是请注意llama_factory需要python、cuda等版本满足：首先请确报你已经安装好了conda工具...

人工智能 2024-08-21 人工智能

2688阅读