bert - AIGC资讯

自监督学习：让ai从无标签数据中自主学习

标题：自监督学习：让AI从无标签数据中自主学习在人工智能的浩瀚宇宙中，监督学习曾长期占据主导地位，它依赖于大量标注精确的数据来训练模型，从而实现高精度的预测或分类任务。然而，随着数据量的爆炸式增长和标注成本的高昂，人们开始探索如何在缺乏明确标签的情况下，让...

人工智能 2025-08-02 人工智能

859阅读

ai与碳排放：大模型训练的能源消耗与优化路径

标题：AI与碳排放：大模型训练的能源消耗与优化路径随着人工智能（AI）技术的飞速发展，尤其是深度学习模型的广泛应用，AI系统已成为现代社会不可或缺的一部分，极大地推动了科技进步和产业升级。然而，AI大模型的训练过程对计算资源的需求极高，随之而来的是巨大的能...

生成式AI 2025-07-21 人工智能

1277阅读

人工智能与语言：从nlp到通用语义理解

标题：人工智能与语言：从NLP到通用语义理解的跨越在科技的浩瀚星空中，人工智能（AI）无疑是最璀璨的星辰之一，而语言作为人类智慧的结晶与交流的基石，与AI的交汇点——自然语言处理（NLP），则成为了探索智能边界的关键领域。从最初的词汇匹配、句法分析，到如今...

生成式AI 2025-07-10 人工智能

769阅读

深度学习新突破：神经网络架构的进化之路

标题：深度学习新突破：神经网络架构的进化之路在人工智能的浩瀚星空中，深度学习无疑是最为璀璨的星辰之一。它以其强大的数据处理能力和模式识别能力，正逐步改变着我们的生活与工作方式。而在这场智能革命的浪潮中，神经网络架构的进化无疑扮演着核心角色。从最初的简单感知...

人工智能 2025-06-30 人工智能

846阅读

ai模型市场：从开源到商业化的交易平台

标题：AI模型市场：从开源到商业化的交易平台演变随着人工智能技术的飞速发展，AI模型市场正经历着一场从开源共享到商业化交易的深刻变革。这一转变不仅反映了技术进步带来的商业模式创新，也深刻影响着AI技术的普及与应用深度。本文将探讨AI模型市场的发展轨迹，分析...

人工智能 2025-06-30 人工智能

912阅读

自监督学习：减少对标注数据的依赖

自监督学习：减少对标注数据的依赖在人工智能和机器学习的广阔领域中，数据标注一直是一个核心而复杂的环节。传统的监督学习方法依赖于大量经过精心标注的数据来训练模型，然而，高质量的标注数据往往稀缺且成本高昂。为了解决这一问题，自监督学习作为一种新兴范式，正逐渐...

AIGC 2025-06-26 人工智能

881阅读

自监督学习：从无标注数据中挖掘知识

自监督学习：从无标注数据中挖掘知识的艺术在人工智能领域，数据标注一直是一个既耗时又昂贵的环节。然而，随着技术的不断进步，一种名为“自监督学习”的方法正在悄然改变这一现状。自监督学习通过巧妙设计算法，使模型能够从无标注数据中自动挖掘出有价值的信息和知识，从而...

生成式AI 2025-06-26 人工智能

876阅读

文本数据的特征工程方法

标题：文本数据的特征工程方法：解锁数据背后的深层信息在大数据与人工智能日益融合的今天，文本数据作为信息的重要载体，其处理与分析能力成为了衡量技术先进性的关键指标之一。文本数据特征工程，作为连接原始文本与机器学习模型的桥梁，扮演着至关重要的角色。它不仅关乎模...

人工智能 2025-06-21 大数据

743阅读

数据增强技术：提升ai模型的泛化能力

标题：数据增强技术：提升AI模型的泛化能力在人工智能领域，模型的泛化能力是衡量其性能的重要指标之一。泛化能力指的是模型在未见过的数据上也能做出准确预测的能力。为了实现这一目标，训练数据的质量和多样性至关重要。然而，在实际应用中，高质量、多样化的数据集往往难...

人工智能 2025-06-13 大数据

631阅读

可信数据空间与ai大模型的协同进化

标题：可信数据空间与AI大模型的协同进化：塑造智能未来的新篇章在数字化浪潮席卷全球的今天，人工智能（AI）作为技术革命的核心驱动力，正以前所未有的速度改变着我们的生活、工作乃至整个社会结构。AI大模型，作为这一领域的巅峰之作，以其强大的数据处理能力、复杂模...

生成式AI 2025-06-12 大数据

733阅读

llama-factory实战: 基于qwen2.5-7b 手把手实战自定义数据集清洗微调

基于qwen2.5 手把手实战自定义数据集微调（llama-factory）准备工作 1.数据集准备（例:民法典.txt） 2.服务器准备（阿里云 DSW 白嫖） 3.环境配置 pip 升级模型下载微调助手 4.数据集处理脚...

生成式AI 2024-10-03 人工智能

2152阅读

腾讯HunyuanDit代码解析

注意：本文仅供自己记录学习过程使用。训练全参训练过程输入图像用VAE编码得到输入的x_start(1,4,128,128 ；文本的两个特征：bert的encoder feature(1,77,1024 和T5 的feature(1,256...

人工智能 2024-09-30 人工智能

1415阅读

【论文阅读笔记 + 思考 + 总结】MoMask: Generative Masked Modeling of 3D Human Motions

创新点： VQ-VAE ? Residual VQ-VAE，对每个 motion sequence 输出一组 base motion tokens 和 v 组 residual motion tokens bidirectional 的 Masked...

人工智能 2024-09-29 人工智能

1754阅读

[从0开始AIGC][LLM]：LLM中Encoder-Only or Decoder-Only？为什么主流LLM是Decoder-Only？

LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only？文章目录 LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Dec...

大数据 2024-09-28 人工智能

1759阅读

【记录贴 | 持续更新】搜广推/aigc 面试题记录

目录 nlp/搜广推 transformer结构？位置编码的作用？解释 self-attention？ attention中 /√(d_k 的作用是什么？解释Multi-Head Attention？ FeedForward的作用...

AIGC 2024-09-28 人工智能

1820阅读

国内外大模型汇总（包括科大星火、文心一言、通义千问、智普清言、华为大模型）

国内外大模型汇总 1. 科大讯飞星火认知大模型主要特点：多语言能力：以中文为核心，同时支持多语言处理，能够进行跨语种的语言理解和生成。广泛的任务能力：具备内容生成、语言理解、知识问答、推理、数学计算、代码理解与生成等多种能力，能够处理复杂的自...

大数据 2024-09-27 人工智能

1742阅读

【笔记】扩散模型（七）：Latent Diffusion Models（Stable Diffusion）论文解读与代码实现

论文链接：High-Resolution Image Synthesis with Latent Diffusion Models 官方实现：CompVis/latent-diffusion、CompVis/stable-diffusion 这一...

人工智能 2024-09-22 人工智能

1479阅读

Stable Diffusion训练LoRA模型参数详细说明（阿里巴巴堆友AI）

工具：线上模型训练堆友AI 一、训练参数批量大小 (Batch Size 作用：每次训练中使用的样本数量。参考值：可以从 8 到 64，取决于显存大小。训练轮数 (Epochs 作用：完整遍历训练数据的次数。参考值：通...

人工智能 2024-09-18 人工智能

2425阅读

1000个Agent圈地模拟人类社会，北大校友创业AI版「我的世界」

北大校友打造的1000个智能体「我的世界」，火爆AI圈! 随便一条推文，都能引来几十万网友围观: 在这里，有着真正意义上的虚拟社会，包括文化、经济、宗教…… 每个智能体在GPT-4加持下，都是社会中独立自主的个体。比如这位名叫Olivia的农民，受探...

大数据 2024-09-16 人工智能

1050阅读

揭秘AI世界：一网打尽大模型、AIGC等热门概念，快速提升你的学习力！

AI（人工智能）人工智能 (AI 是对人类智慧行为的仿真。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。本质就是帮人工作做事的工具。 AGI（通用人工智能） AGI，全称为Artificial General Inte...

人工智能 2024-09-14 人工智能

1131阅读

心理健康问答系统-AIGC大模型-小程序制作

制作一个心理健康问答系统的小程序，涉及到多个环节和技术领域。这里将从需求分析、技术选型、开发流程、API调用等方面进行详细说明。一、需求分析与规划在开始任何项目之前，首先需要明确的是你的小程序想要解决什么样的问题，提供哪些功能给用户。对于心理健康...

大数据 2024-09-14 人工智能

1328阅读

Llama开源代码详细解读（2）

FlashAttention if is_flash_attn_available( : # 检查flashattention的可用性 from flash_attn import flash_attn_func, flash_attn_var...

生成式AI 2024-09-13 人工智能

1721阅读

大模型+小模型协同处理跨文档理解任务，成本更低，性能更高

“Synergetic Event Understanding: A Collaborative Approach to Cross-Document Event Coreference Resolution with Large Language Mod...

大数据 2024-09-13 人工智能

1480阅读

与AI一起肝了300分钟《我的世界》：AI游戏搭子可以拯救手残党吗？

玩游戏“手残”，AI能不能来帮忙? 有着“中国第一款3A游戏”之称的《黑神话:悟空》上线后，不少此前没有太多ARPG游戏经验的玩家被其堪比电影的视听效果圈粉入坑，踏上了重走九九八一难的西游路。《黑神话:悟空》发售版包含超过80个BOSS。对苦练技术的玩家...

人工智能 2024-09-11 人工智能

1035阅读

浅谈AIGC的底层技术

人工智能生成内容（Artificial Intelligence Generated Content, 简称AIGC）是近年来AI技术发展的一个重要领域，它利用机器学习和自然语言处理等技术，让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...

人工智能 2024-09-06 人工智能

1380阅读

DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示

目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...

AIGC 2024-09-04 人工智能

1510阅读

基于大模型的原神对话系统尝试

一.简介该项目为一次大模型+游戏的尝试，成功实现了一个与原神内角色的对话系统。演示视频：https://www.bilibili.com/video/BV1b48CeuELL github地址：https://github.com/goodlu...

生成式AI 2024-09-04 人工智能

1708阅读

AIGC大模型产品经理高频面试大揭秘‼️

近期有十几个学生在面试大模型产品经理（薪资还可以，详情见下图），根据他们面试（包括1-4面）中出现高频大于3次的问题汇总如下，一共32道题目（有答案）。 29.讲讲T5和Bart的区别，讲讲Bart的DAE任务 T5（Text-to-Text Tr...

人工智能 2024-08-31 人工智能

1120阅读

全网最全RAG评估指南：全面解析RAG评估指标并提供代码示例

一、RAG痛点介绍最近我一直在关注和优化RAG（Retrieval-Augmented Generation）相关的内容，总结了一下RAG的痛点和最佳实践，然后重点会介绍如何评估RAG。二、RAG痛点优化认识了RAG的痛点，就知道如...

AIGC 2024-08-28 人工智能

1808阅读

Datawhale X 魔搭 AI夏令营-AIGC方向-LoRA学习笔记

LoRA（Low-Rank Adaptation）是一种用于优化大规模预训练模型的微调技术，特别适用于在资源有限的情况下，对模型进行高效且低成本的微调。LoRA的核心思想是通过低秩分解方法，仅微调模型的少数参数，从而显著减少计算成本和内存占用。 1. 背...

人工智能 2024-08-26 人工智能

1029阅读

LLAMA 3.1 论文的见解

这有什么大不了的？ LLAMA 3.1 的发布标志着 AI 开发的一个重要里程碑。开源模型首次接近领先的闭源模型的性能水平。这一转变预示着未来开源模型同样有效，任何人都可以灵活地修改和调整它们。马克·扎克伯格将此与 Linux 的开源性质进行了比较，...

AIGC 2024-08-26 人工智能

1112阅读

7天创收10万美金，新增25万用户，Wordware要做第一款AI OS

“每天发那么多推文，是想以量取胜吗?可惜质量没有跟上。你的深度分析就像把别人的观点重新包装了一下。” “每天都在转发那些你半懂不懂的AI新闻，是想让我们相信你真的懂吗?55000多个粉丝?我打赌他们一半都是机器人。你对AI的痴迷程度，让我怀疑你是不是想把自...

人工智能 2024-08-23 人工智能

1281阅读

Anthropic工程师分享沉浸式体验，和「AI搭子」Claude共度完美一天

【新智元导读】沉浸式体验Anthropic提示词工程师与「完美拍档」Claude共度的一天! AI聊天机器人只能用来写文案和找资料? 那说明你对AI工具的开发还不到1%! 昨天，Anthropic工程师Alex Albert，在X上分享了他如何与「AI搭子...

大数据 2024-08-23 人工智能

1004阅读

知识图谱大模型系列之 17 使用 Llamaindex、Neo4j 和 Llama 3 构建具有知识图谱的高级 RAG 聊天机器人(教程含源码)

简介通过集成知识图谱来构建高级检索增强生成 (RAG 聊天机器人的分步指南。在检索增强生成 (RAG 解决方案中集成知识图谱可通过提供结构化和关系上下文显著提高响应的相关性和深度。知识图谱在 RAG 解决方案中非常有用，例如在医疗保健领域。例如，...

生成式AI 2024-08-21 人工智能

1252阅读

论文阅读-Transformer Layers as Painters

1. 摘要尽管大语言模型现在已经被广泛的应用于各种任务，但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响，本文设计了一系列的实验。通过实验表明，预训练语言模型中的lower和final layers与中间层分布不一致，并且...

大数据 2024-08-20 人工智能

1025阅读

Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现，后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（...

人工智能 2024-08-20 人工智能

1127阅读

微调（一）

微调有两种办法，一是模型全部参数的微调，二是少量参数高效的微调。前者由于参数多，需要的GPU多，并且全参数微调可能把模型带偏，后者只需要微调少量参数，需要的GPU少，还可能达到不错的效果，成为大家研究的重点，取了个专有名词Parameter-Effic...

AIGC 2024-08-20 人工智能

1185阅读

如何使用 Llama 3 构建本地文件生成式搜索引擎（附源码&文档）

系统设计为了构建一个本地生成式搜索引擎或助手，我们需要几个组建：包含本地文件内容的索引，具有信息检索引擎，用于检索给定查询/问题的最相关文档。大语言模型，用于从本地文档中选择内容并生成摘要答案一个用户界面这些组件的交互方式如下...

大数据 2024-08-14 人工智能

1170阅读

AIGC大模型面经汇总，太全了！

字节暑期实习多模态算法 (二面凉经一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文，中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...

大数据 2024-08-13 人工智能

1669阅读

AIGC技术的现状、应用与未来发展

AIGC是一个充满魅力愿景。想象一下，通过先进的人工智能技术，不仅可以创造出吸引人的文本、生动的图像、动感的视频，还能制作出悦耳的音频——所有这些都是自动生成的！我们来介绍这些技术背后的原理，它们是如何运作的，以及它们在我们的生活中能扮演什么样的角色。从娱...

生成式AI 2024-08-13 人工智能

1188阅读

爆火毒舌AI每小时赚2.8万！每分钟36个新用户，火遍全球只因改了一句提示词

爆款AI应用开发者来晒收入了: 每小时赚4000美元!（约2.8万元）说的就是病毒式传播的“毒舌AI”Twitter Personality，只需输入一个推特用户名，就能得到AI根据历史发言做的犀利点评。而且只要是公开账号就行，并不需要获取任何权限，...

大数据 2024-08-12 人工智能

877阅读

llama_fastertransformer对话问答算法模型

LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进，并用于不同的模型，例如 PaLM。以下是与原始架构的主要区别：预归一化。为了提高...

人工智能 2024-08-08 人工智能

907阅读

LLM大模型实战项目--基于Stable Diffusion的电商平台虚拟试衣

本文详细讲解LLM大模型实战项目，基于Stable Diffusion的电商平台虚拟试衣一、项目介绍二、阿里PAI平台介绍三、阿里云注册及开通PAI 四、PAI_DSW环境搭建五、SD+LORA模型微调一、项目介绍 ...

大数据 2024-07-31 人工智能

1223阅读

【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析

上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。一、llama-3微调后的模型导出首先进入虚拟环境，打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...

生成式AI 2024-07-31 人工智能

1951阅读

AIGC生成式人工智能

AIGC生成式人工智能什么是生成式AI，什么是AIGC？今天我们来详细的认识一下：生成式人工智能AIGC（Artificial Intelligence Generated Content）是人工智能1.0时代进入2.0时代的重要标志。...

人工智能 2024-07-29 人工智能

1089阅读

秘密打造「AI陶哲轩」震惊数学圈！谷歌IMO梦之队首曝光，菲尔兹奖得主深度点评

【新智元导读】19秒破解几何难题，谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩，前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测，若谷歌继续加码研究，应该可以造出一个「AI陶哲轩」。谷歌DeepMind正在做的，是要打造出...

人工智能 2024-07-29 人工智能

844阅读

AI大模型原理（通俗易懂版）——AIGC

传送门：AI大模型原理（通俗易懂版）-CSDN博客 AIGC 说起近期的热门科技词汇，AIGC当之无愧位列其中。从某一天开始，我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。这些AI生...

人工智能 2024-07-29 人工智能

1523阅读

【AI绘画教程】Stable Diffusion 1.5 vs 2

在本文中，我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因，但如果您想直接了解实际差异，您可以跳下否定提示部分。让我们开始吧！ Stable Diffusion 2.1 发布与1.5相比，2.1旨...

生成式AI 2024-07-27 人工智能

2911阅读

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

9次迭代后，模型开始出现诡异乱码，直接原地崩溃!就在今天，牛津、剑桥等机构的一篇论文登上了Nature封面，称合成数据就像近亲繁殖，效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI，模型会崩溃? 牛津、剑桥、帝国理工、多...

人工智能 2024-07-25 人工智能

979阅读

一文看懂 LLaMA 2：原理与模型训练介绍

近年来，人工智能领域的进展使得自然语言处理（NLP）技术得到了显著提升。LLaMA 2 是一种先进的语言模型，它在处理语言生成和理解任务上表现出色。本文将介绍 LLaMA 2 的基本原理、模型结构以及训练方法，帮助你全面了解这一技术。 1. LLaMA...

大数据 2024-07-24 人工智能

1269阅读