-
火山引擎发布豆包视频生成PixelDance与Seaweed大模型功能介绍及免费使用指南 体验地址入口
豆包视频生成-PixelDance与Seaweed简介 豆包视频生成-PixelDance与Seaweed是火山引擎发布的两款大模型,专注于AI视频生成领域。该产品为企业市场提供了创新的视频生成解决方案,具有高度泛化能力和多镜头生成能力。 豆包视频生成...
-
智能创造的幕后推手:AIGC浪潮下看AI训练师如何塑造智能未来
文章目录 一、AIGC时代的算法与模型训练概览 二、算法与模型训练的关键环节 三、AI训练师的角色与职责 四、AI训练师的专业技能与素养 五、AIGC算法与模型训练的未来展望 《AI训练师手册:算法与模型训练从入门到精通》 亮点 内容简介 作...
-
Stable diffusion生图原理
简介 Stable diffusion 是一种基于扩散技术的深度学习模型,于2022年发布,是Stability AI公司推出的首要产品,它主要用于生成以文本描述为条件的详细图像,同时也可以进行补绘、外绘、重绘等任务,但原理都和文生图原理相似。 S...
-
使用本地 LLM 构建 Llama 3.1 8b Streamlit 聊天应用程序:使用 Ollama 的分
介绍 大型语言模型(LLMs)彻底改变了人工智能领域,提供了令人印象深刻的语言理解和生成能力。 本文将指导您构建一个使用本地LLM的Streamlit聊天应用程序,特别是来自Meta的Llama 3.1 8b模型,通过Ollama库进行集成。...
-
大模型时代下的新一代广告系统
• 歧义词的多意图:多意图query下,基于样本生成逻辑,会偏向主意图,弱化甚至丢失次意图,导致召回问题,例如:小米(粮食or手机?),苹果(水果or手机?); • 长尾类目冷启:由于用户点击数据的马太效应,使得大量的长尾类目没有...
-
AIGC专栏15——CogVideoX-Fun详解 支持图&文生视频 拓展CogVideoX到256~1024任意分辨率生成
AIGC专栏15——CogVideoX-Fun详解 支持图&文生视频 拓展CogVideoX到256~1024任意分辨率生成 学习前言 项目特点 生成效果 相关地址汇总 源码下载地址 CogVideoX-Fun详解 技术储备 Dif...
-
[Sigcomm论文解析] Llama 3训练RoCE网络
最近正在开的Sigcomm上, Meta有一篇论文《RDMA over Ethernet for Distributed AI Training at Meta Scale》[1]详细介绍了它的物理网络部署和相关的拥塞控制机制. 本文来对它进行一些详细的解...
-
【AIGC】MimicMotion:姿态引导的高质量人体运动视频生成技术
资源 论文:https://arxiv.org/pdf/2406.19680 github:https://github.com/Tencent/MimicMotion comfyui:https://github.com/kijai/ComfyUI...
-
Stable Diffusion训练LoRA模型参数详细说明(阿里巴巴堆友AI)
工具:线上模型训练堆友AI 一、训练参数 批量大小 (Batch Size 作用:每次训练中使用的样本数量。 参考值:可以从 8 到 64,取决于显存大小。 训练轮数 (Epochs 作用:完整遍历训练数据的次数。 参考值:通...
-
大模型+小模型协同处理跨文档理解任务,成本更低,性能更高
“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...
-
分享一个AI开发者的强力助手:openMind Library
在人工智能的浪潮中,深度学习开发套件 openMind Library,以其强大的功能和易用性,逐步成为AI开发者们的强力助手。本文将通过魔乐社区近期关注挺高的大模型平台魔乐社区,深入了解openMind Library。 openMind Librar...
-
对标英伟达B200!马斯克:特斯拉2025年末批量装备Dojo 2 AI训练芯片
快科技9月11日消息,据媒体报道,马斯克在出席All-In Summit 2024活动时表示,特斯拉的下代AI芯片Dojo 2将于2025年末批量装备。 马斯克强调,特斯拉的AI生态系统构筑精妙,其中Dojo扮演着模型训练的核心角色,而部署于车辆中的专用芯...
-
AI日报:Vidu推“主体参照”功能;200美元ChatGPT Pro上线;荣耀手机首发 AI 智能体
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Vidu推出“主体参照”功能...
-
欺诈文本分类检测(十一):LLamaFactory多卡微调
1. 引言 前文训练时都做了一定的编码工作,其实有一些框架可以支持我们零代码微调,LLama-Factory就是其中一个。这是一个专门针对大语言模型的微调和训练平台,有如下特性: 支持常见的模型种类:LLaMA、Mixtral-MoE、Qwen、B...
-
AIGC的社会责任:AIGC的社会责任
AIGC的社会责任:AIGC的社会责任 作者:禅与计算机程序设计艺术 1. 背景介绍 1.1 AIGC的兴起与社会影响 近年来,人工智能生成内容(AIGC)技术发展迅速,其应用范围不断扩大,对社会产生了深远的影响。从文本创作、图像生成到音频合成,A...
-
200美元的ChatGPT Pro正式上线,聪明N倍的新模型草莓要来了。
半夜10点,The Information发了个新闻,透露了OpenAI的新模型,草莓,要来了。 两个小时后,我的好朋友@solitude(美东时间),作为一个常年拥有第一手资料和信息的人,跟我说,ChatGPT Pro会员上线了,售价200刀/月,他已...
-
关于大模型和AIGC的36条笔记和真话
行业到底有多卷? 最新统计,中国已有130多个大模型问世,在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产品更是布满了基础层、模型层和应用层。新一代生成式AI,可能要回头看看上一...
-
利用Stable Diffusion AI图像模型评估智能车模型算法表现(下篇)
今天小李哥将介绍亚马逊云科技的Jupyter Notebook机器学习托管服务Amazon SageMaker上,通过AI图像生成模型Stable Diffusion Upscale和Depth、向量知识库和LangChain Agent,生成用于AI 智...
-
ComfyUI教程,如何在 ComfyUI 中如何制作高质量白底图,一篇文章教会你!
前言 做电商的朋友都知道,一般平台都会有白底图的要求,在上传白底图后,商品在首页分类页、搜索分类页、品牌馆、电器城等场景中会有更多的露出机会,可能会获得更多的用户流量。 制作白底图本质就是要先抠图,一些抠图质量比较高的网站,比如 https://re...
-
AI日报:Fluxgym傻瓜式训练FLUX Lora;弱智吧成中文AI训练“金矿”;美国法官用AI解读法律
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、12G显存就能玩转AI模型训练...
-
提高警惕!博主AI换脸三小时骗走女子一年工资
快科技9月7日消息,据媒体报道,博主滤镜粉碎机用一段15秒AI换脸视频,三小时就骗”走自己妈妈一年的收入,该视频上线后引发关注。 对此,有60%的受访者表示,凭借肉眼辨认不出AI换脸视频。 据了解,AI换脸技术的核心在于图像识别和图像生成。 首先,通过计算...
-
Llama 3.1 92页技术报告详细解读
引言 半个月前,Meta发布了他们的开源大模型Llama3.1,在社区中引起广泛关注和讨论。现在几周的时间过去了,热度逐渐退潮,舆论逐渐降温,整个Llama3家族的技术报告也公开出来。报告数据更新到了Llama 3.1,正是理性地来审视一下这款大模型...
-
Llama-factory的yaml配置参数--学习记录
最近llama-factory的配置参数有很多不懂的地方,整理了一些但也有可能有错,仅供大家参考。 # 可选参数 # 模型和适配器相关 --adapter_name_or_path # 描述: 适配器的名称或路径。 --adapter_folder...
-
【Stable diffusion】绘世启动器绘画有多简单?
文章目录 目录 文章目录 概要 整体架构流程 一、插件与模型集成 二、对新手友好 三、绘画高手如虎添翼 技术细节 小结 概要 随着秋叶大神的绘世启动器4.8版本发布,AI绘画的搭建过程越来越...
-
【06】LLaMA-Factory微调大模型——微调模型评估
上文【05】LLaMA-Factory微调大模型——初尝微调模型,对LLama-3与Qwen-2进行了指令微调,本文则介绍如何对微调后的模型进行评估分析。 一、部署微调后的LLama-3模型 激活虚拟环境,打开LLaMA-Factory的webui页面...
-
Datawhale X 魔搭 AI夏令营AIGC方向task2
第一步:安装 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip unins...
-
AIGC初体验 Datawhale X 魔搭夏令营
跟DataWhale的步骤跑通baseline 环境安装 !pip install simple-aesthetics-predictor !pip install -v -e data-juicer !pip uninstall pytorch...
-
AI数据告急,大厂盯上廉价年轻人
为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。 坐落于北京大钟寺的字节办公楼,集中了字节的抖音业务团队和火山引擎业务团队,从年初便开始招募素人为豆包大模型录音。两人结组、单次3小时,包...
-
再融近5亿!清华系AI创业新势力,成最吸金“算力运营商”
一笔近5个亿新融资,投向AI大模型领域。 量子位独家获悉,清华系AI创业公司无问芯穹完成了近5亿元A轮融资。加码的股东阵容很全、很豪华: 一口气新增15家股东,涵盖北京上海等地的国资/地方基金,顺为资本/达晨财智等市场化头部VC,还有券商直投和产业CVC。...
-
Stable Diffusion模型训练:从数据准备到模型优化
Stable Diffusion模型训练:从数据准备到模型优化 开篇引入:探索创意无限的Stable Diffusion 数据集构建秘籍:打造专属训练素材 如何收集高质量图像数据? 数据预处理小技巧:清洗与标注 模型配置与训练实战:让创意流...
-
【Datawhale X 魔搭 AI夏令营第四期-AIGC方向】 Task1笔记:跑通baseline
前言 Datawhale的官方速通文档:https://linklearner.com/activity/14/10/24 本篇文章基于官方文档内容进行归纳总结。 跑通代码 Step0:开通阿里云PAI-DSW试用 阿里云PAI-DSW(Data...
-
服务器部署llama3 并利用LLaMA-Factory实现微调
llama3的编译环境要求: 需要的软件,硬件资源: python=3.11 pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.2 第一步下载需要的pytho...
-
6小时完成Llama 3.1-8B适配并开源!MindSpore Transformers大模型套件使能开发者创新
北京时间7月24号, Meta 正式发布 Llama 3.1开源大语言模型, 包含8B、70B 及 405B 参数版本。其中的Llama 3.1 405B模型,在多项基准测试中可以媲美GPT4、Claude3.5等目前最强的闭源大模型。此外,8B 与 70...
-
AIGC文生图 Task01#Datawhale X 魔搭AI夏令营
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。以下是笔者对Task01教程的一些记录。 30min速通指...
-
国内最大智算中心正式投用:每秒690亿亿次浮点运算 可训练万亿参数大模型
快科技8月31日消息,日前,由中国移动承建的国内运营商最大单集群智算中心在哈尔滨正式运营。 据悉,该智算中心具有单集群算力规模最大、国产化网络设备组网规模最大等特点。 单集群智算中心把所有AI加速卡打造成1个集群,用以支持千万亿级参数的大模型进行训练。 这...
-
DataWhaleX魔搭夏令营第四期AIGC方向task01笔记
从零入门AI生图原理&实践是Datawhale AI 夏令营(第四期)“AIGC”方向的学习活动,基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 在task01中,我们主要在魔搭社区搭建PAI实例并体验一下baselin...
-
DataWhale多模态赛事Task1
赛事链接:https://tianchi.aliyun.com/competition/entrance/532251/introduction?spm=a2c22.12281925.0.0.2f307137p8qZmp 赛事描述:在当下大数据、大模型时...
-
精通 Stable Diffusion 调优秘籍
一、Stable Diffusion 调优概览 Stable Diffusion 作为一款强大的 AI 绘画工具,其调优具有至关重要的意义。通过合理的调优,可以显著提升图像生成的质量、速度和准确性,满足用户更加多样化和精细化的需求。 调优主要涵盖了...
-
stable diffusion参数说明
文章目录 采样方法 高清修复 放大算法 宽度、高度 提示词相关性 采样迭代步数 Lora模型使用 生成批次 每批数量 提示词相关性 随机种子 补充 参考资料 采样方法 没有优劣之分,速度不一样。一般Euler a、DPM++ 2M...
-
论文分析|高效长文本生成的技术与应用
Preface 前言 目前大模型公司很多在追求长文a本, 对算力需求极大,如何能够现实地处理该问题很重要。特别是随着Transformer模型尺寸和复杂性的增长,它们在训练期间的内存需求呈指数级增加。 语言模型训练的瓶颈在于显存占用非常大,这需要创...
-
鹅厂也下场,文档解析的痛点是什么?
最近,文档解析赛道颇为火热,产品更新迭代频繁,与各类大模型上下游一样发展势头很劲。6月下旬,鹅厂也在多个产品上线了文档解析功能。 文档智能交互是企业、学术、个人工作中必不可少的一环,作为大模型应用的典型场景之一,它对准确、高效的文档解析工具有着长期需求。...
-
大模型框架汇总:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel
常见的大模型框架:大模型框架Ollama、大模型框架vLLM、大模型框架LightLLM、大模型框架llama.cpp、大模型框架LocalAI、大模型框架veGiantModel: 大模型框架是指用于训练、推理和部署大型语言模型(LLMs)的软件工具和...
-
液冷技术:迎接AIGC时代数据中心的散热挑战
随着人工智能生成内容(AIGC)的跨越式发展,算力需求呈爆炸式增长,带动了数据中心的功耗和热管理需求的飞速上升。AI模型训练和推理过程中的高计算资源需求,导致服务器发热量大幅增加,对散热技术提出了更高的要求。根据Colocation America发布的数...
-
深度解读 Llama 3.1 技术报告:从405B参数到24000块H100集群
Meta在最近发布了他们的开源大模型Llama 3.1,引起了广泛的关注和讨论。随着热度逐渐退潮,Llama 3.1 的详细技术报告也公开了。这份报告揭示了很多关于Llama 3.1 的技术细节和实现原理。本文将从模型参数、基础设施、预训练、后训练等方面,...
-
华为发布AI百校计划:培养AI人才 每年获最高100万支持
快科技8月26日消息,华为公司最近正式启动了华为AI百校计划”,向国内高校提供基于昇腾云服务的AI计算资源。 该计划致力于解决高校师生在AI领域的科研创新和人才培养过程中,常遇到的算力资源不足等问题。 计划将重点资助那些在AI领域有深入研究和影响力的高校团...
-
图像检索在ImageNet分类任务中的优势:超越扩散模型生成图像
?在之前AIGC助力ResNet分类任务:跃升10个百分点-CSDN博客文章中,提到使用Textual Inversion对COCO、PascalVOC、少样本数据集进行数据增强,再进行分类任务,精度上升。 ?而今天要聊到的这篇论文更全面地探究了扩散模型...
-
精读代码,实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记
基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时,也被一些心怀不轨之人当作牟利里的技术,如Deepfake技术。 AI生图最早的工具是机械臂输出作画,现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说,AI生图模型属于多模...
-
【AIGC】FaceChain:发挥生成式内容的无限可能性
基于图像生成的个性化肖像框架 摘要 FaceChaine提供了一系列的生成方案,通过少量的图像输入,就能生成逼真的个性化肖像。它是一个个性化肖像生成框架,包含丰富的人脸感知相关的模型,例如人脸检测,深度人脸向量提取,人脸属性分析等等。输入主要的肖像...
-
DALL·E 2 模型实现与运行指南
DALL·E 2 模型实现与运行指南 DALLE2-pytorchImplementation of DALL-E 2, OpenAI's updated text-to-image synthesis neural network, in Pytor...
-
摩尔线程开源音频理解大模型MooER:38小时训练5000小时数据
快科技8月23日消息,摩尔线程官方宣布,音频理解大模型MooER”(摩耳)已经正式开源,并公布在GitHub上:https://github.com/MooreThreads/MooER 目前开源的内容包括推理代码,以及5000小时数据训练的模型,后续还将...