训练数据第5页 - AIGC资讯

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他...

人工智能 2024-07-15 人工智能

892阅读

突破AI性能瓶颈揭秘LLaMA-MoE模型的高效分配策略

获取本文论文原文PDF，请在公众号【AI论文解读】留言：论文解读本文介绍了一种名为“LLaMA-MoE”的方法，通过将现有的大型语言模型（LLMs）转化为混合专家网络（MoE），从而解决了训练MoE时遇到的数据饥饿和不稳定性问题。该方法基于著名的LLa...

AIGC 2024-07-13 人工智能

949阅读

论文研读｜以真实图像为参考依据的AIGC检测

前言：这篇文章介绍几篇AIGC检测的相关工作，均是以真实图像的特征作为标准进行检测。目录 Detecting Generated Images by Real Images Only (202311 arXiv Let Real...

大数据 2024-07-13 人工智能

1085阅读

规格拉满！Llama和Sora作者都来刷脸的中国AI春晚，还开源了一大堆大模型成果...

鱼羊明敏发自凹非寺量子位 | 公众号 QbitAI 本周国内最受关注的AI盛事，今日启幕。活动规格之高，没有哪个关心AI技术发展的人能不为之吸引—— Sora团队负责人Aditya Ramesh与DiT作者谢赛宁同台交流，李开复与...

AIGC 2024-07-13 人工智能

899阅读

【Llama 2的使用方法】

Llama 2是Meta AI（Facebook的母公司Meta的AI部门）开发并开源的大型语言模型系列之一。Llama 2是在其前身Llama模型的基础上进行改进和扩展的，旨在提供更强大的自然语言处理能力和更广泛的应用场景。以下是Llama 2的一...

AIGC 2024-07-13 人工智能

858阅读

如何“正确“使用Stable Diffusion？文本到图像扩散模型中记忆化实用分析（浙大）

论文链接：https://arxiv.org/pdf/2405.05846 它能被生成吗？文本到图像扩散模型中记忆化的实用分析过去几年见证了由扩散模型驱动的文本引导图像生成领域的重大进展。然而，已经显示出文本到图像扩散模型容易受到训练图像记忆的影响，引发...

人工智能 2024-07-13 人工智能

1089阅读

深入了解语音识别：Distil-Whisper

Distil-Whisper模型概述 1.1 Distil-Whisper的背景与意义随着语音识别技术的不断发展，模型的大小和计算复杂度成为了制约其广泛应用的重要因素。特别是在边缘设备和实时应用场景中，对模型的效率和性能提出了更高的要求。Dist...

生成式AI 2024-07-12 人工智能

2223阅读

Midjourney prompts 怎么写？怎么优化？

作者先说：这几天想系统整理下mj知识体系，从这篇开始都是对阅读官方文档后的个人解读，跳过了官方的quick start和Community guidelines，从prompt开始写起。才疏学浅，如有错误或更好的方法，拜托大家指正什么是Prompt？...

AIGC 2024-07-12 人工智能

1378阅读

大模型真的在吞噬人类的一切数据吗？

在弗兰克·赫伯特的《沙丘》中，沙漠星球厄拉科斯的沙丘下隐藏着一种无价之宝:香料。这种神秘物质使太空旅行成为可能，能延长寿命，并具有扩展意识的效果，是宇宙中最宝贵的财富。“谁控制了香料，谁就控制了宇宙”。正如香料在《沙丘》宇宙中占据着至关重要的地位一样，在...

AIGC 2024-07-11 人工智能

872阅读

Llama 3 模型微调的步骤

环境准备操作系统：Ubuntu 22.04.5 LTS Anaconda3：Miniconda3-latest-Linux-x86_64 GPU： NVIDIA GeForce RTX 4090 24G Step 1. 准备conda环境创...

人工智能 2024-07-11 人工智能

1000阅读

教你基于MindSpore用DCGAN生成漫画头像

本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十天】DCGAN生成漫画头像》，作者：JeffDing。 DCGAN生成漫画头像在下面的教程中，我们将通过示例代码说明DCGAN网络如何设置网络、优化器、如何计算损失函数以及如何初始化模型...

生成式AI 2024-07-10 人工智能

800阅读

【AIGC 概念理解】Zero-Shot，One-Shot，Few-Shot，In-Context Learning，Tuning-Free/Training-Free/Inference-Only

在人工智能领域，特别是自然语言处理（NLP）和机器学习中，几个重要的概念正在推动研究和应用的前沿发展。以下是few-shot learning, zero-shot learning, in-context learning, tuning-free, t...

大数据 2024-07-09 人工智能

1209阅读

【大语言模型LLM】- Meta开源推出的新一代大语言模型 Llama 3

?博客主页：西瓜WiFi ?系列专栏：《大语言模型》很多非常有趣的模型，值得收藏，满足大家的收集癖！如果觉得有用，请三连?⭐❤️，谢谢！长期不定时更新，欢迎watch和fork！❤️❤️❤️ ❤️感谢大家点赞? 收藏⭐ 评论⭐ ?大语言模...

大数据 2024-07-08 人工智能

838阅读

中国AI大模型数量占全球超1/3！生成式AI专利申请量第一

快科技7月8日消息，根据中国信息通信研究院近日发布的《全球数字经济白皮书》，中国在全球人工智能大模型的占比已超过1/3，达到36%，仅次于美国的44%。在全球AI企业数量上，中国以15%的占比紧随美国之后，位列第二。同时，中国的AI独角兽企业数量也达到了...

人工智能 2024-07-08 人工智能

840阅读

大语言模型的底层原理，ChatGPT，文心一言等人工智能体是如何产生的？本文将详细讲解

文章目录基础介绍一、预训练 1.数据准备质量过滤敏感内容过滤数据去重数据预处理实践质量过滤去重隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度总结参考文献...

AIGC 2024-07-08 人工智能

1306阅读

AI绘画模型，现在发展到哪一步？

随着人工智能技术的飞速发展，AI绘画已成为艺术创作领域的一股新势力。通过模拟人类的绘画技巧和风格，AI绘画模型能够生成令人惊叹的艺术作品。本文将介绍现阶段主流的AI绘画模型，并重点突出MJ绘画模型的优势与特点。一、AI绘画模型概述 AI绘画...

大数据 2024-07-07 人工智能

941阅读

破解ChatGPT惊人耗电！DeepMind新算法训练提效13倍，能耗暴降10倍

【新智元导读】ChatGPT能耗惊人，该怎么解?谷歌DeepMind新算法JEST问世，让LLM训练的迭代次数降低13倍，计算量减少10倍，或将重塑AI未来。 ChatGPT早已成为世界耗能大户:一天用掉超50万度电，相当于1.7万个美国家庭的用电量! 然...

AIGC 2024-07-07 人工智能

924阅读

传知代码-Llama 2：开放基础和微调聊天模型以及法律判决数据集分类实战(论文复现)

代码以及视频讲解本文所涉及所有资源均在传知代码平台可获取本文概述本文首先会介绍一下Llama2大模型，然后会使用一个公开的中文法律判决数据集（部分）进行Llama2提示学习的分类实战。论文主要内容这篇文章介绍了Llama 2，这是...

生成式AI 2024-07-07 人工智能

795阅读

全方位了解 Meta Llama 3

本文将为您提供 Llama 3 的全面概览，从其架构、性能到未来的发展方向，让您一文了解这一革命性大语言模型的所有要点。 Meta Llama 发展历程 Llama 1 Llama 是由 Meta(FaceBook AI 发布的一个开源项目...

AIGC 2024-07-06 人工智能

1198阅读

Stable Diffusion 实操教程：轻松掌握图像生成技术

一、引言 Stable Diffusion 是一种强大的图像生成技术，通过利用扩散模型，能够生成高质量的图像。在当前的人工智能领域，Stable Diffusion 已被广泛应用于艺术创作、图像增强和生成等多个领域。本篇文章将详细介绍 Stable Di...

生成式AI 2024-07-06 人工智能

1117阅读

LLaMA 2-原理&模型&训练-你懂了吗?

LLaMA 2的原理 LLaMA 2是Meta AI开发的大型语言模型，它基于Transformer架构，采用了自注意力机制来处理输入序列中的长期依赖关系。LLaMA 2的核心原理包括自注意力机制、多头注意力、层归一化和残差连接等，这些技术共同使得模型...

大数据 2024-07-06 人工智能

1067阅读

AIGC：生成式模型简介

AIGC：生成式模型简介变分自编码器（VAE）生成对抗网络（GAN）自回归模型（Autoregressive Model）流模型（Flow Model）扩散模型（Diffusion Model）此博客将从原理、优点和缺点几...

大数据 2024-07-06 人工智能

1041阅读

中国版GPT-4o炸场：国内首个流式多模态交互模型，现场实时且丝滑

没等到GPT-4o，商汤先把《Her》给发布出来了! 就在刚刚，商汤直接在现场来了个炸裂的Live Show，话不多说，直接看效果: 不仅声音非常拟人（观众直呼好磁性），而且还是实时、随时可以打断的那种! 它宛如被安上了一对儿眼睛，可以做到精准无误的所见...

生成式AI 2024-07-05 人工智能

965阅读

一文看懂LLaMA 2：大型多模态模型的新里程碑

一文看懂LLaMA 2：大型多模态模型的新里程碑 LLaMA 2是OpenAI继GPT-3之后推出的又一重磅模型，它不仅在文本生成方面有所突破，而且在图像处理和语音识别等领域也展现出了令人印象深刻的能力。本文将全面介绍LLaMA 2的背景、技术细节、应用...

大数据 2024-07-05 人工智能

837阅读

百度李彦宏称AI跑分刷榜乱象不止：今天震撼发布、明天史诗级更新

快科技7月5日消息，在2024年世界人工智能大会上，百度创始人李彦宏发表了演讲，认为业界过分关注模型的评测分数和规模，而忽视了AI技术真正的价值应用。李彦宏指出，当前AI领域存在一种不良风气，即各个公司竞相发布新一代大语言模型，宣称自己的模型参数规模和训...

AIGC 2024-07-05 人工智能

861阅读

一键部署LLaMA 3 Chinese Chat，含中文训练数据集；Food2K数据集下载，含2千类别，100万张图片...

前段时间 Llama 3 的重磅开源让 AI 圈的众人都兴奋了一把，但它对纯中文的支持不是很好，不能灵活地根据中文提问切换至相应语言进行回答。 hyper.ai 本周上线了 Llama 3 中文版——LlaMA 3 Chinese Chat 的部...

生成式AI 2024-07-05 人工智能

889阅读

AIGC工具全面解析: 优缺点一目了然

目录 AIGC工具全面解析: 优缺点一目了然优点 1. 准确性高 2. 多领域支持 3. 自动学习和迭代缺点 1. 可能存在较高的错误率 2. 受限于训练数据 3. 缺乏主动性和创造力结论 AIGC工具全面解析: 优缺点一...

AIGC 2024-07-05 人工智能

1039阅读

文献研读｜AIGC溯源场景及研究进展

前言：本文介绍关于AIGC生成阶段针对不同溯源场景的几篇相关工作。相关文章：针对文生图模型的AIGC检测论文研读，参见此篇文章。如下图所示，在AIGC生成阶段，有4种溯源场景： 1）生成模型溯源训练数据 2）微调模型溯源预训练模型 3）AI...

生成式AI 2024-07-04 人工智能

1369阅读

一文为你深度解析LLaMA2模型架构

本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2 模型架构》，作者： Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展...

人工智能 2024-07-04 人工智能

1182阅读

开源大模型 Llama 3

开源大模型Llama 3是一个在多个领域都展现出卓越性能的大模型。下面将为您介绍Llama 3的特性和一些简单的使用案例。一、Llama 3介绍 Llama 3在Meta自制的两个24K GPU集群上进行预训练，使用了超...

大数据 2024-07-04 人工智能

1116阅读

【LLM教程-llama】如何Fine Tuning大语言模型？

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning ！（代码和详细解释放在后文）目录大语言模型进行微调(Fine Tuning 需要哪些步骤？大语言模型进行微调(Fine Tuning 训练过程及代码...

AIGC 2024-07-04 人工智能

1061阅读

开源之光 Stable Diffusion 3 技术论文全解：公式占一半，实验很充分！

文章链接：https://arxiv.org/pdf/2403.03206 扩散模型通过反转数据到噪声的正向路径来从噪声中创建数据，并已成为处理高维感知数据（如图像和视频）的强大生成建模技术。Rectified flow是一种最近提出的生成模型形式，它将...

大数据 2024-07-04 人工智能

1610阅读

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文！受大模型中的RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。在...

生成式AI 2024-07-04 人工智能

990阅读

AIGC安全研究简述（附资料下载）

2023 AIGC技术实践及展望资料合集（29份）.zip 2023 AIGC大型语言模型(LLM 实例代码合集.zip 2023大模型与AIGC峰会（公开）PPT汇总（25份）.zip AIGC的安全研究是一个复杂且重要的领域，涉及多个关键方面...

大数据 2024-07-04 人工智能

1003阅读

AIGC 011-SAM第一个图像分割大模型-分割一切！

AIGC 011-SAM第一个图像分割大模型-分割一切！文章目录 0 论文工作 1论文方法 2 效果 0 论文工作这篇论文介绍了 Segment Anything (SA 项目，这是一个全新的图像分割任务、模...

人工智能 2024-07-03 人工智能

838阅读

AIGC原理与代码实例讲解

1. 背景介绍随着人工智能技术的不断发展，越来越多的企业开始关注人工智能在业务中的应用。然而，人工智能技术的应用并不是一件容易的事情，需要专业的技术人员进行研究和开发。AIGC（Artificial Intelligence General Compu...

AIGC 2024-07-03 人工智能

1011阅读

深入探索Llama 2：下一代开源语言模型的革新与影响

Llama 2是Meta AI发布的一款先进的开源大模型，属于大型语言模型（LLM）类别。它是Transformer架构的一种变体，经过预先训练并在多种文本和代码数据集上进行微调，旨在提升功能和安全性。Llama 2的关键特点包括：庞大的训练数据集...

AIGC 2024-07-03 人工智能

1029阅读

AIGC重塑金融：AI大模型驱动的金融变革与实践，面试必会

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7 深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙...

人工智能 2024-07-02 人工智能

861阅读

外滩大会举办全球deepfake攻防挑战赛，百万奖金悬赏“AI打假”专家

近日，外滩大会·全球Deepfake攻防挑战赛正式启动报名。该赛事提供百万级的数据集，针对“AI换脸”的欺诈风险进行攻防实战演练，并设立100万元人民币的奖金池，鼓励推动AI向善的技术人才。大赛由蚂蚁集团主办、蚂蚁数科承办，ATEC前沿科技探索社区、蚂...

大数据 2024-07-01 人工智能

821阅读

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问...

生成式AI 2024-07-01 人工智能

980阅读

详解各种LLM系列｜（5）LLaMA 3模型解析（Meta重磅发布！）

一、引言 Blog链接：https://ai.meta.com/blog/meta-llama-3/ MODEL CARD: https://github.com/meta-llama/llama3/blob/main/MODEL_CARD.md 体...

AIGC 2024-07-01 人工智能

1419阅读

文生图算法原理：从扩散模型到Stable Diffusion

导读 Stable Diffusion是扩散模型的一种实现。传统的扩散模型（如DDPM）的做法是在像素空间预测预测噪声图noise_t，输入是每一步的图片image_t和代表step的Time embedding，然后在图片image_t上减去模型预测...

人工智能 2024-06-29 人工智能

1407阅读

大模型应用实战4——开源大模型微调（基于LLaMA-Factory）

所谓微调，通俗理解就是围绕大模型进行参数修改，从而永久性的改变模型的某些性能。而大模型微调又分为全量微调和高效微调两种，所谓全量微调，指的是调整大模型的全部参数，而高效微调，则指的是调整大模型的部分参数，目前常用的高效微调方法包括LoRA、QLoRA、p-...

AIGC 2024-06-28 人工智能

1207阅读

【CV】stable diffusion初步理解

来自gpt-4o Stable diffusion 和DALLE的关系 Stable Diffusion 和 DALL-E 都是生成图像的人工智能模型，但它们有不同的开发背景和技术实现。 Stable Diffusion: 开发者:...

生成式AI 2024-06-27 人工智能

1066阅读

AIGC 训练场景下的存储特征研究

云布道师引言：在传统块存储大行其道的时代，需要针对很多行业的工作负载（Workload）进行调研，包含块大小、随机读、读写比例等等。知道行业的 Workload 对于预估业务的 I/OPS、时延、吞吐等性能有很好的指导意义，其次，也便于制定针对行业的...

生成式AI 2024-06-27 人工智能

893阅读

Stable diffusion 3 正式开源

6月12日晚，著名开源大模型平台Stability AI正式开源了，文生图片模型Stable Diffusion 3 Medium（以下简称“SD3-M”）权重。 SD3-M有20亿参数，平均生成图片时间在2—10秒左右推理效率非常高，同时对硬件的需求...

生成式AI 2024-06-26 人工智能

977阅读

⌈ 传知代码 ⌋ LLaMA 开放高效基础语言模型

?前情提要? 本文是传知代码平台中的相关前沿知识与技术的分享~ 接下来我们即将进入一个全新的空间，对技术有一个全新的视角~ 本文所涉及所有资源均在传知代码平台可获取以下的内容一定会让你对AI 赋能时代有一个颠覆性的认识哦！！！以下内容干货满满...

AIGC 2024-06-26 人工智能

839阅读

深入浅出解析Stable Diffusion中U-Net的核心知识与价值 | 【算法兵器谱】

Rocky Ding 公众号：WeThinkIn 写在前面【算法兵器谱】栏目专注分享AI行业中的前沿/经典/必备的模型&论文，并对具备划时代意义的模型&论文进行全方位系统的解析...

大数据 2024-06-26 人工智能

1203阅读

微软发布Phi-3 Mini，性能媲美GPT-3.5、Llama-3，可在手机端运行

前言微软发布了最新版的Phi系列小型语言模型(SLM - Phi-3。这个系列包括3个不同参数规模的版本：Phi-3 Mini (38亿参数、Phi-3 Small (70亿参数和Phi-3 Medium (140亿参数。 Phi系列模型是微...

大数据 2024-06-26 人工智能

1069阅读

AIGC从入门到实战：自然语言处理和大语言模型简介

AIGC从入门到实战：自然语言处理和大语言模型简介 1.背景介绍 1.1 人工智能生成内容（AIGC）的兴起人工智能生成内容（AIGC，Artificial Intelligence Generated Content）是近年来人工智能领域的一个重...

人工智能 2024-06-26 人工智能

919阅读