-
与AI一起肝了300分钟《我的世界》:AI游戏搭子可以拯救手残党吗?
玩游戏“手残”,AI能不能来帮忙? 有着“中国第一款3A游戏”之称的《黑神话:悟空》上线后,不少此前没有太多ARPG游戏经验的玩家被其堪比电影的视听效果圈粉入坑,踏上了重走九九八一难的西游路。 《黑神话:悟空》发售版包含超过80个BOSS。对苦练技术的玩家...
-
浅谈AIGC的底层技术
人工智能生成内容(Artificial Intelligence Generated Content, 简称AIGC)是近年来AI技术发展的一个重要领域,它利用机器学习和自然语言处理等技术,让计算机能够自主创作文章、音乐、图像等多种类型的内容。本文将深入浅...
-
DIFFUSION 系列笔记| Latent Diffusion Model、Stable Diffusion基础概念、数学原理、代码分析、案例展示
目录 Latent Diffusion Model LDM 主要思想 LDM使用示例 LDM Pipeline LDM 中的 UNET 准备时间步 time steps 预处理阶段 pre-process 下采样过程 down sampl...
-
基于大模型的原神对话系统尝试
一.简介 该项目为一次大模型+游戏的尝试,成功实现了一个与原神内角色的对话系统。 演示视频:https://www.bilibili.com/video/BV1b48CeuELL github地址:https://github.com/goodlu...
-
AIGC大模型产品经理高频面试大揭秘‼️
近期有十几个学生在面试大模型产品经理(薪资还可以,详情见下图),根据他们面试(包括1-4面)中出现高频大于3次的问题汇总如下,一共32道题目(有答案)。 29.讲讲T5和Bart的区别,讲讲Bart的DAE任务 T5(Text-to-Text Tr...
-
全网最全RAG评估指南:全面解析RAG评估指标并提供代码示例
一、RAG痛点介绍 最近我一直在关注和优化RAG(Retrieval-Augmented Generation)相关的内容,总结了一下RAG的痛点和最佳实践,然后重点会介绍如何评估RAG。 二、RAG痛点优化 认识了RAG的痛点,就知道如...
-
Datawhale X 魔搭 AI夏令营-AIGC方向-LoRA学习笔记
LoRA(Low-Rank Adaptation)是一种用于优化大规模预训练模型的微调技术,特别适用于在资源有限的情况下,对模型进行高效且低成本的微调。LoRA的核心思想是通过低秩分解方法,仅微调模型的少数参数,从而显著减少计算成本和内存占用。 1. 背...
-
LLAMA 3.1 论文的见解
这有什么大不了的? LLAMA 3.1 的发布标志着 AI 开发的一个重要里程碑。开源模型首次接近领先的闭源模型的性能水平。这一转变预示着未来开源模型同样有效,任何人都可以灵活地修改和调整它们。马克·扎克伯格将此与 Linux 的开源性质进行了比较,...
-
7天创收10万美金,新增25万用户,Wordware要做第一款AI OS
“每天发那么多推文,是想以量取胜吗?可惜质量没有跟上。你的深度分析就像把别人的观点重新包装了一下。” “每天都在转发那些你半懂不懂的AI新闻,是想让我们相信你真的懂吗?55000多个粉丝?我打赌他们一半都是机器人。你对AI的痴迷程度,让我怀疑你是不是想把自...
-
Anthropic工程师分享沉浸式体验,和「AI搭子」Claude共度完美一天
【新智元导读】沉浸式体验Anthropic提示词工程师与「完美拍档」Claude共度的一天! AI聊天机器人只能用来写文案和找资料? 那说明你对AI工具的开发还不到1%! 昨天,Anthropic工程师Alex Albert,在X上分享了他如何与「AI搭子...
-
知识图谱大模型系列之 17 使用 Llamaindex、Neo4j 和 Llama 3 构建具有知识图谱的高级 RAG 聊天机器人(教程含源码)
简介 通过集成知识图谱来构建高级检索增强生成 (RAG 聊天机器人的分步指南。在检索增强生成 (RAG 解决方案中集成知识图谱可通过提供结构化和关系上下文显著提高响应的相关性和深度。知识图谱在 RAG 解决方案中非常有用,例如在医疗保健领域。例如,...
-
论文阅读-Transformer Layers as Painters
1. 摘要 尽管大语言模型现在已经被广泛的应用于各种任务,但是目前对其并没有一个很好的认知。为了弄清楚删除和重组预训练模型不同层的影响,本文设计了一系列的实验。通过实验表明,预训练语言模型中的lower和final layers与中间层分布不一致,并且...
-
Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍
越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了科技巨头们所使用的模型后训练配方。 随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(...
-
微调(一)
微调有两种办法, 一是模型全部参数的微调,二是少量参数高效的微调。前者由于参数多,需要的GPU多,并且全参数微调可能把模型带偏,后者只需要微调少量参数,需要的GPU少,还可能达到不错的效果,成为大家研究的重点,取了个专有名词Parameter-Effic...
-
如何使用 Llama 3 构建本地文件生成式搜索引擎(附源码&文档)
系统设计 为了构建一个本地生成式搜索引擎或助手,我们需要几个组建: 包含本地文件内容的索引,具有信息检索引擎,用于检索给定查询/问题的最相关文档。 大语言模型,用于从本地文档中选择内容并生成摘要答案 一个用户界面 这些组件的交互方式如下...
-
AIGC大模型面经汇总,太全了!
字节 暑期实习 多模态算法 (二面凉经 一面 2024/3/28 下午17:00-18:00 1.上来没有自我介绍 2.直接介绍NeurIPS论文,中间穿插着一些提问 3.说一下Transformer的整体结构 4.了解有哪些位置编码方式吗 5.说一...
-
AIGC技术的现状、应用与未来发展
AIGC是一个充满魅力愿景。想象一下,通过先进的人工智能技术,不仅可以创造出吸引人的文本、生动的图像、动感的视频,还能制作出悦耳的音频——所有这些都是自动生成的!我们来介绍这些技术背后的原理,它们是如何运作的,以及它们在我们的生活中能扮演什么样的角色。从娱...
-
爆火毒舌AI每小时赚2.8万!每分钟36个新用户,火遍全球只因改了一句提示词
爆款AI应用开发者来晒收入了: 每小时赚4000美元!(约2.8万元) 说的就是病毒式传播的“毒舌AI”Twitter Personality,只需输入一个推特用户名,就能得到AI根据历史发言做的犀利点评。 而且只要是公开账号就行,并不需要获取任何权限,...
-
llama_fastertransformer对话问答算法模型
LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进,并用于不同的模型,例如 PaLM。以下是与原始架构的主要区别: 预归一化。为了提高...
-
LLM大模型实战项目--基于Stable Diffusion的电商平台虚拟试衣
本文详细讲解LLM大模型实战项目,基于Stable Diffusion的电商平台虚拟试衣 一、项目介绍 二、阿里PAI平台介绍 三、阿里云注册及开通PAI 四、PAI_DSW环境搭建 五、SD+LORA模型微调 一、项目介绍 ...
-
【07】LLaMA-Factory微调大模型——微调模型导出与微调参数分析
上文介绍了如何对微调后的模型进行使用与简单评估。本文将介绍对微调后的模型进行导出的过程。 一、llama-3微调后的模型导出 首先进入虚拟环境,打开LLaMA-Factory的webui页面 conda activate GLM cd LLaMA-F...
-
AIGC生成式人工智能
AIGC生成式人工智能 什么是生成式AI,什么是AIGC?今天我们来详细的认识一下: 生成式人工智能AIGC(Artificial Intelligence Generated Content)是人工智能1.0时代进入2.0时代的重要标志。...
-
秘密打造「AI陶哲轩」 震惊数学圈!谷歌IMO梦之队首曝光,菲尔兹奖得主深度点评
【新智元导读】19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。 谷歌DeepMind正在做的,是要打造出...
-
AI大模型原理(通俗易懂版)——AIGC
传送门:AI大模型原理(通俗易懂版)-CSDN博客 AIGC 说起近期的热门科技词汇,AIGC当之无愧位列其中。从某一天开始,我们突然发现AI可以帮忙生成文字图片音频视频等等内容了。而且让人难以分清背后的创作者到底是人类还是AI。 这些AI生...
-
【AI绘画教程】Stable Diffusion 1.5 vs 2
在本文中,我们将总结稳定扩散 1 与稳定扩散 2 辩论中的所有要点。我们将在第一部分中查看这些差异存在的实际原因,但如果您想直接了解实际差异,您可以跳下否定提示部分。让我们开始吧! Stable Diffusion 2.1 发布与1.5相比,2.1旨...
-
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
9次迭代后,模型开始出现诡异乱码,直接原地崩溃!就在今天,牛津、剑桥等机构的一篇论文登上了Nature封面,称合成数据就像近亲繁殖,效果无异于投毒。有无破解之法?那就是——更多使用人类数据! 用AI生成的数据训练AI,模型会崩溃? 牛津、剑桥、帝国理工、多...
-
一文看懂 LLaMA 2:原理与模型训练介绍
近年来,人工智能领域的进展使得自然语言处理(NLP)技术得到了显著提升。LLaMA 2 是一种先进的语言模型,它在处理语言生成和理解任务上表现出色。本文将介绍 LLaMA 2 的基本原理、模型结构以及训练方法,帮助你全面了解这一技术。 1. LLaMA...
-
AIGC领域综述
AIGC领域综述 2023 1. A Survey of Large Language Models 2. A Complete Survey on Generative AI (AIGC : Is ChatGPT from GPT-4 to...
-
AIGC的行业发展
1. AIGC的行业发展 AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术来自动生成内容的一种新型内容创作方式。它基于生成对抗网络(GAN 、大型预训练模型等技术,通过对已...
-
【小沐学AI】Python实现语音识别(whisper+HuggingFace)
文章目录 1、简介 1.1 whisper 2、HuggingFace 2.1 安装transformers 2.2 Pipeline 简介 2.3 Tasks 简介 2.3.1 sentiment-analysis 2.3.2 zero-...
-
专访诺奖得主:大模型是记忆还是理解?
物理学家理查德·费曼曾将自然世界比作众神的游戏,比如国际象棋——我们不知道游戏规则,但却可以观察棋盘,也许只是其中的一角,然后根据这些观察,试图找出游戏规则。 费曼的比喻,道出了科学研究的核心,也生动描绘了许多经济学家的工作,他们同样致力于从纷繁复杂的经济...
-
AIGC从入门到实战:关于企业和组织
作者:禅与计算机程序设计艺术 Artificial Intelligence (人工智能 G: Generation (生成 C: Content (内容 背景介绍 随着全球数字化转型的加速,企业与组织面临着前所未有的机遇与挑战。人工智能(A...
-
AIGC各个应用场景下的模型选择
需要注意的是,下述模型可以在不同任务和领域中灵活应用,它们的归属也会根据模型的设计和主要应用领域而有所变化,并不绝对。 自然语言处理模型 模型层中自然语言理解(Natural LanguageUnderstanding,NLU 和自然语言生成(N...
-
AIGC从入门到实战:ChatGPT 简介:从 GPT1 到 GPT4 的发展历程和应用领域
AIGC从入门到实战:ChatGPT 简介:从 GPT1 到 GPT4 的发展历程和应用领域 1. 背景介绍 1.1 问题的由来 自然语言处理(Natural Language Processing, NLP 是人工智能(Artificial...
-
LLaMA原理与代码实例讲解
LLaMA原理与代码实例讲解 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 关键词:大模型、LLaMA、Transformer、预训练、微调 1. 背景介绍 1.1 问题的由来...
-
基于MindSpore实现BERT对话情绪识别
本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》,作者:JeffDing。 模型简介 BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder...
-
新研究:AI测谎能力比人类更强 但需谨慎使用
快科技7月15日消息,据媒体报道,德国维尔茨堡大学当地时间12日公布的最新研究显示,在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代,人工智能在测谎方面的表现比人类更佳。 这项发表在《iScience》期刊上的研究,精心设计了一场实验:参与者被要求撰...
-
文心一言、Kimi等4款AI大模型测评对比及推荐(AI大模型训练)
现在,国内已经有海量大模型诞生,那么,哪款大模型的表现会更好?这篇文章里,作者站在自媒体人的角度,对四款大模型做了评估和对比,一起来看一下。 说到AI,很多人会想到ChatGPT,而我们现在也有许多好用的国产AI大模型。 在2023年的中国,8个月...
-
从头开始学习扩散模型 Stable Diffusion
今天我们来揭开 Stable Diffusion 技术的神秘面纱。 1.稳定扩散原理 Stable Diffusion 在2022年发表,一种基于Latent Diffusion Models的新兴机器学习技术。它基于扩...
-
近屿OJAC带你解读:AIGC核心知识点LLM
近年来,人工智能(AI)领域经历了令人瞩目的增长,尤其是自然语言处理(NLP)。你知道是什么推动了NLP领域的这种飞速发展吗?没错,那就是大型语言模型LLM。这些模型可能会彻底改变我们与科技的互动方式! 这些模型是如何工作的呢?它们为何如此流行?在本文中...
-
调研分析:LLama大模型
1. 引言 在当前的自然语言处理(NLP)研究中,大规模预训练模型如BERT、GPT-3和RoBERTa已经展示了其卓越的性能和广泛的应用。随着技术的发展,新的模型不断涌现,推动了NLP领域的持续进步。本文将聚焦于LLama模型,分析其结构、预训练策略、优...
-
LLaMA-Adapter:零初始注意机制的语言模型高效微调
23年6月来自上海AI实验室,香港中文大学和UCLA的论文“LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention“。 LLaMA-Adapter是...
-
半小时教你手搓AI视频通话,还有懒人版代码已开源
GPT-4o的“AI视频通话”一鸽再鸽,但网友却是急不可耐想要体验。 于是,一位名叫Santiago(我们叫他三哥)的博主,用160行Python代码尝试了复刻。 虽然技术路线和《Her》有所差别,但从直观效果来看,也算得上是给网友们带来了新的玩具。 而...
-
大语言模型的底层原理,ChatGPT,文心一言等人工智能体是如何产生的?本文将详细讲解
文章目录 基础介绍 一、预训练 1.数据准备 质量过滤 敏感内容过滤 数据去重 数据预处理实践 质量过滤 去重 隐私过滤 2.词元化 BPE 分词 WordPiece 分词 Unigram 分词 3.数据调度 总结 参考文献...
-
视频多模态模型: VideoChat、Video-LLaMA、Video-ChatGPT、Video-LLaVA等
VideoChat VideoChat🦜: 基于视频指令数据微调的聊天机器人 https://arxiv.org/pdf/2305.06355.pdf https://github.com/OpenGVLab/Ask-Anything/tr...
-
深入探索Llama 2:下一代开源语言模型的革新与影响
Llama 2是Meta AI发布的一款先进的开源大模型,属于大型语言模型(LLM)类别。它是Transformer架构的一种变体,经过预先训练并在多种文本和代码数据集上进行微调,旨在提升功能和安全性。Llama 2的关键特点包括: 庞大的训练数据集...
-
Mozilla 开源 llamafile:大语言模型分发与部署新范式
引言 随着 ChatGPT、BERT 等大型语言模型(Large Language Model, LLM 在自然语言处理领域掀起巨大波澜,AI 技术正以前所未有的速度走近大众生活。然而,这些 LLM 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...
-
基于Python和TensorFlow实现BERT模型应用
本文分享自华为云社区《使用Python实现深度学习模型:BERT模型教程》,作者: Echo_Wish。 BERT(Bidirectional Encoder Representations from Transformers)是Google提出的一种用...
-
LLM2Vec介绍和将Llama 3转换为嵌入模型代码示例
嵌入模型是大型语言模型检索增强生成(RAG 的关键组成部分。它们对知识库和用户编写的查询进行编码。 使用与LLM相同领域的训练或微调的嵌入模型可以显著改进RAG系统。然而,寻找或训练这样的嵌入模型往往是一项困难的任务,因为领域内的数据通常是稀缺的。 但...
-
最新开源!Cover Agent 自动生成代码!开源的Copilot!
原文链接:(更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号!) 最新开源!Cover Agent 自动生成代码!开源的Copilot! 🌟 Cover Agent是一个更广泛的实用程序套件的 ** 一部分 ** ,旨...