注意力机制 - AIGC资讯

ai驱动的蛋白质折叠：alphafold的突破

标题：AI驱动的蛋白质折叠：AlphaFold的突破在生命科学的浩瀚宇宙中，蛋白质作为生命活动的主要执行者，其结构与功能的研究一直是科学家们探索的核心领域。蛋白质折叠，这一从线性氨基酸序列到复杂三维结构的转变过程，蕴含着生命奥秘的钥匙。然而，由于蛋白质折叠...

生成式AI 2025-07-25 人工智能

825阅读

多模态大模型：文本、图像与语音的终极融合

标题：多模态大模型：文本、图像与语音的终极融合——开启智能交互新时代随着人工智能技术的飞速发展，我们正逐步迈入一个前所未有的智能时代。在这个时代里，信息的传递与处理不再局限于单一维度，而是向着多元化、综合化的方向迈进。多模态大模型，作为这一趋势的集大成者，...

人工智能 2025-07-10 人工智能

861阅读

人工智能算法的“黑箱”问题：可解释性研究进展

标题：人工智能算法的“黑箱”问题：可解释性研究进展在科技日新月异的今天，人工智能（AI）已经渗透到我们生活的方方面面，从智能推荐系统到自动驾驶汽车，从医疗诊断辅助到金融风险评估，AI以其强大的数据处理能力和模式识别能力，展现出了前所未有的价值。然而，随着A...

大数据 2025-07-01 人工智能

851阅读

深度学习新突破：神经网络架构的进化之路

标题：深度学习新突破：神经网络架构的进化之路在人工智能的浩瀚星空中，深度学习无疑是最为璀璨的星辰之一。它以其强大的数据处理能力和模式识别能力，正逐步改变着我们的生活与工作方式。而在这场智能革命的浪潮中，神经网络架构的进化无疑扮演着核心角色。从最初的简单感知...

人工智能 2025-06-30 人工智能

747阅读

稀疏激活模型：大模型推理效率的优化

标题：稀疏激活模型：大模型推理效率的优化探索随着人工智能技术的飞速发展，深度学习模型，尤其是大型语言模型，在自然语言处理、计算机视觉等领域展现出了前所未有的能力。然而，这些大型模型在带来高精度预测的同时，也伴随着巨大的计算资源和时间消耗，尤其是在推理阶段。...

人工智能 2025-06-29 人工智能

972阅读

亚马逊的数据采集与推荐系统

标题：亚马逊的数据采集与推荐系统的深度剖析在电子商务的浩瀚星空中，亚马逊无疑是一颗璀璨的明星。其成功背后，强大的数据采集能力和精密的推荐系统功不可没。这两大支柱不仅塑造了亚马逊独特的竞争优势，也深刻影响了全球电商行业的发展格局。本文将深入探讨亚马逊如何通过...

生成式AI 2025-06-27 大数据

646阅读

ai可视化工具：让复杂模型“一目了然”

标题：AI可视化工具：让复杂模型“一目了然”在当今这个数据驱动的时代，人工智能（AI）技术以其强大的数据处理能力和模式识别能力，在众多领域展现出了巨大的潜力与价值。然而，随着AI模型的复杂度日益增加，如何有效地理解和解释这些模型成为了一个亟待解决的问题。A...

大数据 2025-06-26 人工智能

798阅读

deepmind的alphafold：蛋白质结构预测的里程碑

标题：DeepMind的AlphaFold：蛋白质结构预测的里程碑在科学的浩瀚星空中，每一次技术突破都如同璀璨星辰，照亮人类探索未知的征途。近年来，人工智能（AI）技术在各个领域的飞速进展，无疑为这一探索之旅增添了强大的动力。其中，DeepMind公司的A...

人工智能 2025-06-26 人工智能

690阅读

医疗影像分析中的数据挖掘实践

标题：医疗影像分析中的数据挖掘实践探索在当今医疗科技飞速发展的时代，医疗影像分析作为诊断疾病、制定治疗方案的关键环节，正经历着前所未有的变革。随着大数据与人工智能技术的不断进步，数据挖掘技术在医疗影像分析中的应用日益广泛，极大地提高了诊断的准确性和效率。本...

生成式AI 2025-06-22 大数据

578阅读

数据挖掘中的多模态数据融合

标题：数据挖掘中的多模态数据融合：挑战、方法与未来展望随着信息技术的飞速发展，数据呈现出爆炸性增长，且形式多样，包括但不限于文本、图像、音频、视频等，这些数据被统称为多模态数据。在数据挖掘领域，多模态数据融合成为了一个热门且至关重要的研究方向。它旨在通过整...

生成式AI 2025-06-21 大数据

528阅读

数据可解释性：让ai决策更透明

标题：数据可解释性：让AI决策更透明随着人工智能（AI）技术的飞速发展，其在各行各业中的应用日益广泛，从医疗诊断到金融风控，从自动驾驶到智能推荐系统，AI正深刻改变着我们的生活与工作方式。然而，AI系统的“黑箱”特性——即其决策过程的不透明性，成为制约其进...

生成式AI 2025-06-14 大数据

568阅读

数据与深度学习：如何构建高效神经网络

标题：数据与深度学习：构建高效神经网络的策略与实践在人工智能领域，深度学习与大数据的结合正引领着一场技术革命。深度学习，作为机器学习的一个分支，通过构建多层神经网络模型来模拟人脑的学习过程，实现了对复杂数据的高效处理与精准预测。而这一切成就的背后，离不开高...

大数据 2025-06-12 大数据

418阅读

数据预测分析模型发展趋势：深度学习与强化学习

标题：数据预测分析模型的发展趋势：深度学习与强化学习的融合与创新随着大数据时代的到来，数据预测分析模型已成为企业决策、科学研究及众多领域不可或缺的工具。在这一浪潮中，深度学习与强化学习作为人工智能领域的两大核心技术，正引领着数据预测分析模型向更高层次迈进。...

人工智能 2025-06-10 大数据

478阅读

数据预测分析模型发展趋势预测：深度学习与强化学习

标题：数据预测分析模型的发展趋势：深度学习与强化学习的融合前景在大数据时代背景下，数据预测分析模型已成为企业决策、科学研究乃至日常生活的核心工具。随着技术的不断进步，尤其是人工智能领域的飞速发展，深度学习与强化学习作为两大前沿技术，正引领着数据预测分析模型...

大数据 2025-06-08 大数据

534阅读

大模型培训讲师叶梓:Llama Factory 微调模型实战分享提纲

LLaMA-Factory ——一个高效、易用的大模型训练与微调平台。它支持多种预训练模型，并且提供了丰富的训练算法，包括增量预训练、多模态指令监督微调、奖励模型训练等。 LLaMA-Factory的优势在于其简单易用的界面和强大的功能。用户可以在不编写...

大数据 2024-10-06 人工智能

1324阅读

Stable Diffusion原理说明

本文参考：深入浅出讲解Stable Diffusion原理，新手也能看明白 - 知乎目录 1、Stable Diffusion能做什么？ 2、扩散模型（Diffusion model）（1）前向扩散（Forward Diffusion）...

人工智能 2024-10-05 人工智能

1779阅读

【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画

GitHub：https://github.com/BadToBest/EchoMimic 论文： https://arxiv.org/pdf/2407.08136 comfyui： https://github.com/smthemex/ComfyU...

大数据 2024-10-04 人工智能

1743阅读

从零预训练一个tiny-llama#Datawhale组队学习Task2

完整的教程请参考：datawhalechina/tiny-universe: 《大模型白盒子构建指南》：一个全手搓的Tiny-Universe (github.com 这是Task2的学习任务目录 Qwen-blog Tokenizer（分词器...

AIGC 2024-10-03 人工智能

1351阅读

LLaMA- Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

发表时间：14 Jun 2023 论文链接：https://arxiv.org/pdf/2303.16199 作者单位：Shanghai Artificial Intelligence Laboratory Motivation：最近，指令跟踪模型取...

大数据 2024-10-01 人工智能

1454阅读

[从0开始AIGC][LLM]：LLM中Encoder-Only or Decoder-Only？为什么主流LLM是Decoder-Only？

LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Decoder-Only？文章目录 LLM中Encoder-Only or Decoder-Only & 为什么主流LLM是Dec...

大数据 2024-09-28 人工智能

1658阅读

AIGC时代算法工程师的面试秘籍（第二十二式2024.9.2-9.15） |【三年面试五年模拟】

写在前面【三年面试五年模拟】旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试经验，力求让读者在获得心仪offer的同时，增强技术基本面。也欢迎大家提出宝贵的优化建议，一起交流学习? 欢迎大家关注Rock...

生成式AI 2024-09-26 人工智能

1358阅读

LLaMA 数据集

LLaMA的训练数据集来源多样，涵盖了多个不同的数据集和预处理步骤。以下是详细的描述：公开数据来源和预处理 CommonCrawl [67%]：使用CCNet管道（Wenzek等人，2020年）对2017年至2020年间的五个Comm...

生成式AI 2024-09-25 人工智能

987阅读

llama网络结构及源码

目录模型初始化 config lm_head transformer wte h rms_1/rms_2 attn c_attn c_proj 线性层mlp ln_f rope_cache mask_cache kv_cac...

大数据 2024-09-24 人工智能

1511阅读

单GPU一分钟生成16K高清图像！新加坡国立发布LinFusion:无缝兼容Stable Diffusion插件

论文链接：https://arxiv.org/pdf/2409.02097 Git链接：https://lv-linfusion.github.io/ 亮点直击本文研究了Mamba的非因果和归一化感知版本，并提出了一种新颖的线性注意力机制...

人工智能 2024-09-23 人工智能

1071阅读

【HuggingFace Transformers】LlamaModel源码解析

LlamaModel源码解析 1. LlamaModel 介绍 2. LlamaModel类源码解析 3. 4维因果注意力掩码生成 1. LlamaModel 介绍 LlamaModel 是一个基于 Transformer 架构...

AIGC 2024-09-21 人工智能

2236阅读

探索和构建 LLaMA 3 架构：深入探究组件、编码和推理技术

Meta 正在加大在人工智能 (AI 竞赛中的力度，推出了新的开源 AI 模型 Llama 3 以及新版 Meta AI。这款虚拟助手由 Llama 3 提供支持，现已在所有 Meta 平台上可用。以下是您需要了解的有关 Meta 最新大型语言模...

大数据 2024-09-14 人工智能

1170阅读

Llama开源代码详细解读（2）

FlashAttention if is_flash_attn_available( : # 检查flashattention的可用性 from flash_attn import flash_attn_func, flash_attn_var...

生成式AI 2024-09-13 人工智能

1630阅读

一文彻底搞懂大模型 - GPT和LlaMA的模型架构

GPT vs LlaMA GPT与LlaMA，作为大语言模型的两大巨擘，均基于Transformer架构却各有千秋。GPT系列以强大的生成能力著称，通过不断增大的参数规模引领复杂语言与推理任务的前沿；而Llama则以开源姿态，通过技术创新提升模型性能，预...

人工智能 2024-09-12 人工智能

1175阅读

【AIGC】因果注意力（Causal Attention）原理及其代码实现

概述因果注意力（Causal Attention）是一种自注意力机制，广泛应用于自回归模型中，尤其是在自然语言处理和时间序列预测等任务中。它的核心思想是在生成每个时间步的输出时，只关注当前时间步及之前的时间步，确保生成过程的因果性，从而避免模型在预测...

人工智能 2024-09-11 人工智能

1812阅读

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯!相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因:LLM没有足够空间，来存储...

人工智能 2024-09-10 人工智能

881阅读

ACL 2024 | CoCA：自注意力的缺陷与改进

近年来，在大语言模型（LLM）的反复刷屏过程中，作为其内核的 Transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 Transformer 诞生之初，被视为天然具备的长度外推能力，...

AIGC 2024-09-09 人工智能

1130阅读

【AIGC从零开始】AIGC小白学习心得第二讲：3D生成模型

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Video 3D（sv3d）二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...

大数据 2024-09-08 人工智能

1233阅读

混合专家模型（MoE）入门

模型规模是提升LLM大语言模型性能的关键因素，但也会增加计算成本。Mixture of Experts (MoE 架构通过分布式专家层和动态门控机制，有效降低了计算资源，使模型能够在扩展参数规模的同时保持高效的运行。 Mixtral of Exper...

生成式AI 2024-09-06 人工智能

1010阅读

如何在复杂对话中准确识别每位说话人的声音？OpenAI Whisper系统带来新突破，尽管在面对重叠声音时仍需进一步优化。

在复杂对话中准确识别每位说话人的声音是一个挑战，尤其是在面对重叠声音的情况下。OpenAI的Whisper系统虽然在自动语音识别（ASR）方面取得了显著进展，但在处理重叠声音时仍需进一步优化。 Whisper系统通过利用大规模预训练模型和弱监督学习来提取...

生成式AI 2024-09-05 人工智能

926阅读

一文看懂llama2(原理&模型&训练）

一文看懂Llama2（原理&模型&训练）一、引言 Llama2是Meta（原Facebook AI）最新开源的大型语言模型，它基于Transformer架构进行了多项优化和改进，旨在提供更高效、更准确的自然语言处理能力。Llama2...

生成式AI 2024-09-01 人工智能

908阅读

LORA模型在Stable Diffusion中的注意力机制优化

LORA模型在Stable Diffusion中的注意力机制优化引言 1.1 Stable Diffusion在生成模型领域的地位和作用 1.2 介绍LORA模型及其在微调预训练模型时的效率和灵活性 1.3 强调注意力机制在LORA模型优化...

人工智能 2024-08-28 人工智能

1308阅读

一文看懂llama2 (原理&模型&训练)

LLaMA2是一种基于Transformer架构的先进语言模型，广泛应用于自然语言处理（NLP）任务，如文本生成、机器翻译和问答系统等。本文将从其核心原理、模型结构以及训练方法三个方面进行详细探讨。一、核心原理 LLaMA2的核心原理是基于自注意力机...

人工智能 2024-08-27 人工智能

1020阅读

非Transformer时代到来！全新无注意力模式超越Llama传奇

来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了？自 2023 年 12 月首次推出以来，Mamba 便成为了 Transformer 的强有力竞争对手。此后，采用 Mamba 架构的模型...

生成式AI 2024-08-22 人工智能

1008阅读

如何高效微调多模态Transformers模型：从入门到实践指南

多模态大模型（Multimodal Large Models）是能够处理多种类型数据（如文本、图像、音频等）的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。目录 Transformers简介多模态Transforme...

AIGC 2024-08-22 人工智能

1594阅读

一文看懂llama2（原理&模型&训练）

Llama2（大型语言模型2） Llama2（大型语言模型2）主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理： Transformer 架构: Llama2采用了Transformer网络，它通过自注意力机制来处理...

人工智能 2024-08-22 人工智能

910阅读

stable diffusion--小白学习步骤

1.看一下Unet网络的讲解_哔哩哔哩_bilibili，了解Unet网络 2.看一下【生成式AI】Diffusion Model 原理剖析 (1/4 _哔哩哔哩_bilibili，起码要看前3/6个视频 3.看一下超详细的扩散模型（Diffusion...

大数据 2024-08-21 人工智能

757阅读

江大白 | 视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）

本文来源公众号“江大白”，仅用于学术分享，侵权删，干货满满。原文链接：视觉Transformer与Mamba的创新改进，完美融合（附论文及源码）以下文章来源于微信公众号：AI视界引擎作者：AI引擎链接：https://mp.weixin.q...

大数据 2024-08-21 人工智能

1521阅读

Positional Encoding | 位置编码【详解】

文章目录 1、位置编码的2种方案 2、位置编码 3、公式详解：绝对位置、相对位置 4、代码 4.1 代码1 4.2 代码2 1、位置编码的2种方案 transformer的作者刚开始说固定的位置编码和可学习的位置...

人工智能 2024-08-20 人工智能

1684阅读

人类还在怕鬼，AI已经开始害怕自己了。

昨天中元节，我本来一直打算做一个关于中式恐怖的视频，来呼应一下这个节日氛围。带着这个想法，我开始在网上搜寻灵感。然而，我在B站上看到的一个视频彻底改变了我的计划。这个视频，是这样的，来自B站UP主@明天的心声-，名字叫做:《随手拍的一张医院走廊的照片...

生成式AI 2024-08-19 人工智能

965阅读

面完 AIGC 大模型算法岗，心态崩了。。。

大家好，今天我们继续聊聊 AI 科技圈发生的那些事。内容包括：AI 科技圈最新动态和最新面试题总结。 Meta 推新一代 SAM 2 图像识别再进化！Meta 推新一代SAM 2 官方链接：https://ai.meta.com/blog/se...

人工智能 2024-08-19 人工智能

823阅读

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3

探索中文大模型的新高度：Chinese-LLaMA-Alpaca-3 Chinese-LLaMA-Alpaca-3中文羊驼大模型三期项目 (Chinese Llama-3 LLMs developed from Meta Llama 3项目地址:ht...

大数据 2024-08-12 人工智能

978阅读

「AIGC」大语言模型系列-Transformer详解

Transformer模型相对复杂，下面我将提供一个简化版的Transformer模型的Python代码示例，使用PyTorch库实现。这个示例将包括模型的基本结构，如编码器和解码器，自注意力机制，位置编码，以及前馈网络。请注意，这个示例主要用于教...

AIGC 2024-08-12 人工智能

785阅读

Stable Diffusion之最全详细图解

Stable Diffusion是一种生成模型，用于生成高质量的图像。这种模型基于扩散过程，能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解，涵盖其原理、模型结构、训练过程及应用示例。一、Stable Diffusi...

人工智能 2024-08-11 人工智能

1587阅读

stable diffusion中的UNet2DConditionModel代码解读

UNet2DConditionModel总体结构图片来自于 https://zhuanlan.zhihu.com/p/635204519 stable diffusion 运行unet部分的代码。 noise_pred = self.unet(...

人工智能 2024-08-07 人工智能

2178阅读

比OpenAI的Whisper快50%，最新开源语音模型

生成式AI初创公司aiOla在官网开源了最新语音模型Whisper-Medusa，推理效率比OpenAI开源的Whisper快50%。 aiOla在Whisper的架构之上进行了修改采用了“多头注意力”机制的并行计算方法，允许模型在每个推理步骤中预测多个t...

人工智能 2024-08-04 人工智能

950阅读