模型训练第7页 - AIGC资讯

中国发布《生成式AI安全基本要求》，涵盖训练数据、生成内容等

全国网络安全标准化技术委员会在官网发布了，国家标准《网络安全技术生成式人工智能服务安全基本要求》征求意见稿。该意见稿一共分为《网络安全技术生成式人工智能服务安全基本要求-标准文本》、意见汇总处理表和编制说明三大块。其中，标准文本涵盖训练数据安全要求...

生成式AI 2024-06-03 人工智能

1114阅读

whisper-v3模型部署环境执行

1. 安装whisperV3 github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-ru...

大数据 2024-06-03 人工智能

1670阅读

【AIGC调研系列】XTuner、Unsloth方案对比

XTuner和Unsloth都是用于大型语言模型（LLM）训练和微调的工具，但它们在设计理念、技术实现和性能表现上存在一些差异。技术架构与支持的模型规模： XTuner支持千亿级参数的模型，并能够处理超过百万个tokens的序列。它通过序列...

人工智能 2024-06-03 人工智能

1874阅读

llama-factory学习个人记录

框架、模型、数据集准备 1.llama-factory部署 # 克隆仓库 git clone https://github.com/hiyouga/LLaMA-Factory.git # 创建虚拟环境 conda create --name llama...

人工智能 2024-06-02 人工智能

2289阅读

生成式 AI 安全标准发布，覆盖训练数据和生成内容

中国网络安全标准化技术委员会官网发布了《网络安全技术生成式人工智能服务安全基本要求》征求意见稿。该标准细化了对生成式人工智能服务的安全要求，包括训练数据安全、生成内容安全和模型安全要求。其中，针对训练数据，要求对数据来源进行管理和核验，提高数据来源的多样...

生成式AI 2024-06-02 人工智能

967阅读

Stable Diffusion AnimateDiff-最火文本生成视频插件V3发布

AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型，通过大量短视频剪辑的训练，它能够调整图像生成过程，生成一系列与训练视频剪辑相似的图像。简言之，AnimateDiff通过训练大量短视频来优化图像之间...

生成式AI 2024-06-02 人工智能

937阅读

彻底火了！《AIGC 面试宝典》圈粉无数！

2022 年下半年以来，文本生成图像快速出圈，多款应用持续火爆。国外文生图代表：Midjourney、Stable Diffusion、OpenAI 的 DALL-E：海外模型SD开源，进一步促进了国内大厂的研究热情和应用落地：随着多模态技术迭...

AIGC 2024-06-02 人工智能

1157阅读

007-Wsl-Ubuntu上LLaMA-Factory如何下载、部署、运行【AI超车B计划】

一、目标了解什么是LLaMA-Factory；成功在Wsl-Ubuntu环境下安装并运行LLaMA-Factory；二、路径学习笔记中关于LLaMA-Factory的简介，了解什么是LLaMA-Factory；在Ubun...

生成式AI 2024-06-01 人工智能

1742阅读

AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型轻松文生视频

AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 ?轻松文生视频学习前言源码下载地址技术原理储备（DIT/Lora/Motion Module）什么是Diffusion Transformer (DiT ...

大数据 2024-06-01 人工智能

938阅读

笔记1--Llama 3 超级课堂 | Llama3概述与演进历程

1、Llama 3概述 https://github.com/SmartFlowAI/Llama3-Tutorial.git【Llama 3 五一超级课堂 | Llama3概述与演进历程】 2、Llama 3 改进点【最新【大模型微调】大模...

生成式AI 2024-06-01 人工智能

983阅读

Stable Diffusion简单食用方法

1.下载 1.1打开B站哔哩哔哩 (゜-゜つロ干杯~-bilibili哔哩哔哩（bilibili.com 是国内知名的视频弹幕网站，这里有及时的动漫新番，活跃的ACG氛围，有创意的Up主。大家可以在这里找到许多欢乐。https://www.bil...

生成式AI 2024-05-31 人工智能

1657阅读

AIGC (AI-Generated Content) 技术深度探索：现状、挑战与未来愿景

? 个人主页：空白诗文章目录 ? AIGC技术：塑造未来的创意与内容革命 ? 引言 ? AIGC技术发展现状 ? 核心技术驱动 ? 应用领域拓展 ? 面临的挑战 ❌ 真实性与伦理考量 ? 技术局限性 ? 未来趋势 ?...

人工智能 2024-05-31 人工智能

1056阅读

腾讯云存储面向AIGC全面升级，搭载全面自研存储引擎

云厂商继续为大模型加速落地铺路架桥。 4月8日，腾讯云宣布云存储解决方案面向AIGC场景全面升级，能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持。数据显示，采用腾讯云AIGC云存储解决方案，可将大模型的数据清洗和训...

大数据 2024-05-30 人工智能

755阅读

简单几步微调Llama 3大模型，小白轻松上手

这是面向小白用户的一个超级简单的微调大模型示例，通过这个例子将得到一个速度翻倍，并可以包含自己业务知识数据的微调后llama3模型，可用于本地部署构建私有化的AI智能体。very 的 nice 首先请准备好google账号和网络环境，这个示例基于gool...

人工智能 2024-05-30 人工智能

1164阅读

AI新时代——【深度学习】驱动的【AIGC大模型】与【机器学习】的创新融合

目录 1.机器学习与人工智能的基础 1.机器学习的基本原理 2.人工智能的广泛应用 2.深度学习的崛起 1.深度学习的概念和原理 2.卷积神经网络（CNN） 3.循环神经网络（RNN） 3.AIGC大模型的创新 1.AIGC的概念和应用...

AIGC 2024-05-30 人工智能

952阅读

AlphaFold 3不开源，统一生物语言大模型阿里云先开了！

把169861个生物物种数据装进大模型，大模型竟get到了生物中心法则的奥秘—— 不仅能识别DNA、RNA与相应蛋白质之间的内在联系，在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中也能比肩SOTA模型。模型名为LucaOne，由阿里云...

人工智能 2024-05-30 人工智能

895阅读

Kohya 训练器 Stable Diffusion工作流中训练LoRA模型方法

本文档是关于Stable Diffusion工作流中训练LoRA模型方法的文档一.前置训练集准备第一步：准备训练集：准备训练模型时使用的训练集。注意：训练集应当能尽量涵盖训练对象的“多样化样本”。如角色立绘图，各个角度不同的图片。...

人工智能 2024-05-30 人工智能

2615阅读

手把手教你基于华为云，实现MindSpore模型训练

本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》，作者：沉迷sk。前言学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。并打通一个Ascend910训练到Ascend310推理的全流程...

大数据 2024-05-29 人工智能

900阅读

AIGC重塑金融：AI大模型驱动的金融变革与实践，2024年最新阿里面试二面

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。深知大多数HarmonyOS鸿蒙开发工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不...

AIGC 2024-05-29 人工智能

879阅读

马斯克烧60亿美元难题，国内大厂有解？开源MoE模算效率黑马登场，3.7B参数单挑Llama 3-70B

如今，想训个SOTA的大模型，不仅缺数据和算力，甚至连电都不够用了。最近马斯克就公开表示，因为苦于买不到足够的芯片，xAI只能推迟Gork 2的训练和发布。 Grok 3及更高版本，甚至需要10万个H100，按每台H100售价3万美元来算，仅芯片就要花...

人工智能 2024-05-29 人工智能

887阅读

大模型时代下如何数据治理？|

随着ChatGPT和其他大语言模型(LLM 的快速发展，AI已成为我们工作和生活中不可或缺的一部分，并从简单的文本生成逐渐演变成为能够处理复杂语义理解和生成的高级AI系统。这些模型的能力和应用范围的扩展，不仅标志着技术的进步，也标志着它们在实际业务中...

AIGC 2024-05-29 人工智能

929阅读

AIGC在汽车软件开发的应用举例

AIGC（人工智能生成内容）在汽车软件开发领域的应用主要体现在以下几个方面：个性化和定制化车辆的创造：通过分析大型数据集并生成新内容，AIGC技术使得创造更加个性化和定制化的车辆成为可能。这不仅提高了车辆的安全性和用户体验，还推动了自动驾驶汽车的发展。...

人工智能 2024-05-29 人工智能

914阅读

Stable Diffusion实现模特换衣等功能

Stable Diffusion是一种基于Latent Diffusion Models(潜在扩散模型，LDMs 的文图生成(text-to-image 模型。它使用来自LAION-5B数据库子集的512x512图像进行训练。 Stable Diffus...

大数据 2024-05-28 人工智能

1226阅读

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理（NLP）领域，Transformer架构的模型如Whis...

生成式AI 2024-05-28 人工智能

1165阅读

Meta被曝使用Instagram等照片训练AI模型引发隐私争议

全球社交巨头 Meta 最近因使用用户照片训练 AI 模型 Emu 引发了一场隐私争议。据报道，Meta 正在利用 Instagram 和 Facebook 上的用户照片进行训练，同时还会使用用户对图片的描述、标题等文本数据。这严重违反了数据隐私搜集条例，...

大数据 2024-05-28 人工智能

882阅读

“数字中国”前瞻：谁是AI大模型时代的驯龙高手？

大模型圈最近都在讨论一个议题:GPT-4o为什么要免费? 一个可见的事实是，ChatGPT的版本迭代速度在放缓。这预示着大模型行业进入平台期，向上攀登变得越来越困难。在这样的背景下GPT-4o宣布免费，说白了就是想用好先发优势，尽快训练出更加强大的模型能力...

人工智能 2024-05-28 人工智能

811阅读

智慧建筑：基于YOLOv7的建筑外墙缺陷检测

01 前景概要现有的基于深度学习的方法在识别速度和模型复杂性方面面临一些挑战。为了保证建筑外墙缺陷检测的准确性和速度，我们研究了了一种改进的YOLOv7方法BFD-YOLO。首先，将YOLOv7中原有的ELAN模块替换为轻量级的MobileOne模块，...

生成式AI 2024-05-28 人工智能

1040阅读

利用SpringBoot和TensorFlow进行语音识别模型训练与应用

本专题系统讲解了如何利用SpringBoot集成音频识别技术，涵盖了从基础配置到复杂应用的方方面面。通过本文，读者可以了解到在智能语音填单、智能语音交互、智能语音检索等场景中，音频识别技术如何有效提升人机交互效率。无论是本地存储检索，还是云服务的集成，丰...

大数据 2024-05-28 人工智能

853阅读

马斯克烧几十亿美元造最大超算中心，10万块H100训练Grok追赶GPT-4o

前段时间，OpenAI、谷歌、微软相继开大会，AI圈子的竞争如火如荼。这么热闹的时候，怎么能少得了马斯克。前段时间忙着特斯拉和星链的他，最近好像开始腾出手，而且不鸣则已、一鸣惊人，直接放出一个大消息——自己要造世界上最大的超算中心。今年3月，他旗下...

大数据 2024-05-27 人工智能

867阅读

换了30多种方言，我们竟然没能考倒中国电信的语音大模型

不管你来自哪个城市，相信在你的记忆中，都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说，方言不只是一种语言习惯，也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中，有不少就是来自各地方言。...

人工智能 2024-05-27 人工智能

911阅读

MacOS使用ollama部署codellama+openui以及llama.cpp部署

现在AI这么火，你是不是也渴望能够在本地部署并运行属于自己的大模型，然而，高昂的硬件成本又往往成了一大障碍，限制了你继续在AI领域去探索和创新。如果告诉你，无需换电脑，无需额外花钱买GPU或换显卡，你现在的电脑就可以本地跑一些大模型，那将是多么酷的一...

大数据 2024-05-27 人工智能

1647阅读

LLaMA-Factory参数的解答（命令，单卡，预训练）

前面这个写过，但觉得写的不是很好，这次是参考命令运行脚本，讲解各个参数含义。后续尽可能会更新，可以关注一下专栏！！ *这是个人写的参数解读，我并非该领域的人如果那个大佬看到有参数解读不对或者有补充的请请反馈！谢谢（后续该文章可能会持续更新） * LLaMA...

人工智能 2024-05-25 人工智能

962阅读

Llama3-8B+ LLaMA-Factory 中文微调

Llama3-8B+ LLaMA-Factory 中文微调 Llama3是目前开源大模型中最优秀的模型之一，但是原生的Llama3模型训练的中文语料占比非常低，因此在中文的表现方便略微欠佳！本教程就以Llama3-8B-Instruct开源模型为模...

大数据 2024-05-25 人工智能

818阅读

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was compiled without GPU support. NotImpleme...

生成式AI 2024-05-24 人工智能

3480阅读

Stable Diffusion教程：LoRA模型

LoRA模型是一种微调模型，它不能独立生成图片，常常用作大模型的补充，用来生成某种特定主体或者风格的图片。下载模型在模型下载网站，如果模型是LoRA模型，网站会特别标识出来。以 liblib.ai为例：模型左上角会有一个模型类型的标记，CHE...

大数据 2024-05-24 人工智能

1175阅读

【热门话题】AI作画算法原理解析

?个人主页: 鑫宝Code?热门专栏: 闲话杂谈｜炫酷HTML | JavaScript基础 ?个人格言: "如无必要，勿增实体" 文章目录 AI作画算法原理解析 AI作画算法概述基础原理：机器学习与深度学习卷积...

大数据 2024-05-24 人工智能

905阅读

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

本文经计算机视觉研究院公众号授权转载，转载请联系出处。论文链接：https://arxiv.org/pdf/2405.08768 代码和预训练模型已开源：https://github.com/LeapLabTHU/EfficientTrain 会议...

生成式AI 2024-05-23 人工智能

796阅读

单模型斩获「蛋白质突变预测」榜一！西湖大学提出基于结构词表方法 | ICLR 2024 Spotlight

蛋白质结构相比于序列往往被认为更加具有信息量，因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破，大量的预测结构被发布出来供人研究使用，如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。西湖大学的研究人员利用F...

AIGC 2024-05-23 人工智能

857阅读

掌阅科技携手亚马逊云科技，以生成式 AI 之力重塑阅读体验

在数字化时代，尽管信息获取变得轻而易举，但读者在享受阅读的过程中仍面临着诸多挑战。从挑选书籍的迷茫，到阅读过程中的注意力分散，再到阅读后的知识吸收与整理，构成了读者体验中的一道道难关。作为深耕数字阅读领域的领军企业，掌阅科技深刻洞察用户在阅读方面的不同...

人工智能 2024-05-22 人工智能

980阅读

受生成式AI推动，2024年全球公有云支出将增长到6754亿美元

根据Gartner日前预测，受到生成式人工智能（GenAI）和应用现代化的推动，全球用户今年在公有云服务上的支出将增长到6754亿美元。这一数字与去年的5,610亿美元相比大幅增长了20.4%。这一持续的增长趋势并没有显示出减弱的迹象。到2025年，...

大数据 2024-05-22 人工智能

782阅读

「豆包」拉低价格线全球大模型开卷性价比

大模型也开始打起价格战。 5月15日，字节跳动旗下火山引擎发布豆包大模型，除了针对C端用户的豆包APP可免费使用该模型的应用外，豆包大模型将B端用价拉至行业最低。按照火山引擎总裁谭待的说法，豆包主力模型（≤32K）在企业市场的定价只有0.0008元/千T...

生成式AI 2024-05-22 人工智能

915阅读

国产黑马与GPT-4o称霸中文榜首！Yi-Large勇夺国内LLM盲测桂冠，冲进世界第七

【新智元导读】真正与GPT-4o齐头并进的国产大模型来了!刚刚，LMSYS揭开最新榜单，黑马Yi-Large在中文分榜上与GPT-4o并列第一，而在总榜上位列世界第七，紧追国际第一阵营，并登上了国内大模型盲测榜首。几周前，一个名为「im-also-a-g...

生成式AI 2024-05-21 人工智能

796阅读

案例分享｜Alluxio在自动驾驶模型训练中的应用与部署

分享嘉宾：杨林三-辉羲智能关于辉羲智能：辉羲智能是一家做自动驾驶芯片的初创公司，成立于2022年。致力打造创新车载智能计算平台，提供高阶智能驾驶芯片、易用开放工具链及全栈自动驾驶解决方案，助力车企实现优质高效的自动驾驶量产交付，构建低成本、大规...

生成式AI 2024-05-21 人工智能

824阅读

大模型变天国内厂商纷纷推出“骨折价”

近期，国内云服务厂商之间掀起了一场大模型降价潮，这场价格战的目的是为了快速抢占市场，实现商业化的快速落地。包括火山引擎、阿里云、智谱AI、面壁智能等在内的厂商和创业团队都参与其中。智谱AI首先在 5 月 11 日宣布大幅降价，新注册用户获得的额度从 50...

AIGC 2024-05-21 人工智能

798阅读

To C大模型，将是字节跳动新“王牌”？

字节跳动，“放大招”了! 5月15日，火山引擎发布会上，字节正式对外发布豆包大模型，并宣布了0.0008元/千Tokens的超低定价。火山引擎还做了个类比:一元钱就能买到豆包主力模型的125万Tokens，大约200万个汉字，相当于三本《三国演义》。豆...

人工智能 2024-05-21 人工智能

921阅读

从“天价”到“骨折价”，大模型要变天了

十年后，国内云厂商又打起来了! 近一个月，国内云厂商掀起了新一轮的大模型降价潮。这意味着AI竞争已经不仅仅是一场军备技术竞赛这么简单，各头部厂商也在考虑如何赚钱了。在这场价格战中，包括火山引擎、阿里，还有智谱AI、面壁智能这样的明星创业团队都卷了进来。各...

大数据 2024-05-20 人工智能

815阅读

数据更多更好还是质量更高更好？这项研究能帮你做出选择

对基础模型进行 scaling 是指使用更多数据、计算和参数进行预训练，简单来说就是「规模扩展」。虽然直接扩展模型规模看起来简单粗暴，但也确实为机器学习社区带来了不少表现卓越的模型。之前不少研究都认可扩大神经模型规模的做法，所谓量变引起质变，这种观点也...

大数据 2024-05-20 人工智能

759阅读

腾讯 PCG 搜广推机器学习框架GPU 性能优化实践

一、为什么 GPU 推荐模型训练框架是刚需 1. PCG 算力集群缺点最开始的时候，腾讯 PCG 所有的推荐模型训练都是使用 CPU。但随着业务的深入，以及深度学习模型的发展，PCG 算力集群在做下一代推荐模型时会遇到各种问题：首先，系统网络带宽...

AIGC 2024-05-20 人工智能

875阅读

谷歌Gemini AI 计划为学校提供额外的数据保护和隐私

Google 即将向学校提供 Gemini AI，并专门针对教育工作者和年满18岁的学生提供服务，承诺会将他们的数据用于 AI 模型训练或与他人分享。 Google 将在 Workspace for Education 账户上提供额外的 Gemini 隐私...

生成式AI 2024-05-17 人工智能

847阅读

粘土特效带火AI修图美图距离Remini还差一「手」

上传一张图片，点击黏土特效，你将收获一张“小羊肖恩”风格的全新卡通照，无论是图片里的人、物、景，每个细节都如同黏土捏得一样立体。黏土特效在社交平台风靡，拥有该功能的AI修图应用程序Remini也随即收获了下载量。各种黏土照被产出后，有人嫌丑“不懂为何流行...

大数据 2024-05-16 人工智能

843阅读