nlp 第4页 - AIGC资讯

用 Unsloth 微调 LLaMA 3 8B

用 Unsloth 微调 LLaMA 3 8B 今年4月份，Meta 公司发布了功能强大的大型语言模型（LLM）Llama-3，为从事各种 NLP 任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。然而，传统的 LLM 微调过程既耗时又耗费资...

生成式AI 2024-06-14 人工智能

1230阅读

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码：绝对位置、相对位置、旋转位置编码

[从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码文章目录 [从0开始AIGC][Transformer相关]：一文看懂Transformer中的位置编码 1. 位置编码 1.1 绝对位...

生成式AI 2024-06-13 人工智能

1265阅读

大模型算法(一)：从Transformer到ViT再到LLaMA

单任务/单领域模型深度学习最早的研究集中在针对单个领域或者单个任务设计相应的模型。对于CV计算机视觉领域，最常用的模型是CNN卷积模型。其中针对计算机视觉中的不同具体任务例如分类任务，目标检测任务，图像分割任务，以CNN作为骨干backbone，加...

AIGC 2024-06-11 人工智能

1188阅读

AIGC时代桌面软件开发技术展望

AIGC技术催生新一代桌面软件现代大模型技术本质上是一种“NLP”技术，基于这个观点，文本描述驱动引擎就是AI技术落地无法规避的一道墙，每一个AI技术都必须实际的面对这个事实。就文本驱动技术而言，在一个token的两侧，分别插入一个...

生成式AI 2024-06-11 人工智能

893阅读

AIGC时代已至，你准备好抓住机遇了吗？

一、行业前景 AIGC，即人工智能生成内容，是近年来人工智能领域中发展迅猛的一个分支。随着大数据、云计算、机器学习等技术的不断进步，AIGC已经取得了显著的成果，并且在广告、游戏、自媒体、教育、电商等多个领域实现了广泛应用。特别是在2024年，随着技术...

人工智能 2024-06-10 人工智能

877阅读

自然语言处理（NLP）技术在AIGC中的突破

本文收录于专栏：精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践...

生成式AI 2024-06-10 人工智能

1069阅读

LLaMA 2语言大模型的微调策略：LoRA与全参数选择

随着自然语言处理（NLP）技术的飞速发展，大型语言模型（LLMs）在各个领域都展现出了强大的能力。LLaMA 2作为其中的佼佼者，具有巨大的潜力。然而，如何有效地对LLaMA 2进行微调，以适应特定的任务或数据集，成为了一个关键问题。本文将对LoRA技术与...

人工智能 2024-06-10 人工智能

924阅读

使用LLM2Vec将Llama 3转变为一个嵌入模型

文章目录 LLM2Vec：您的LLM也是一个嵌入模型使用LLM2Vec将Llama 3转变为文本嵌入模型为 RAG 设置 Llama 3 文本嵌入模型结论原文：Benjamin Marie Turn Llama 3 into a...

AIGC 2024-06-10 人工智能

853阅读

AIGC从入门到实战：AI 辅助写作：基于 ChatGPT 的自动创作和文本扩展

1. Background Introduction In the rapidly evolving digital age, artificial intelligence (AI has become an indispensable tool i...

生成式AI 2024-06-09 人工智能

925阅读

LLaMa系列模型详解（原理介绍、代码解读）：LLaMa

LLaMA详解 LLaMA（Large Language Model Meta AI）是由Meta（前身为Facebook）开发的一种大规模语言模型，旨在提高自然语言处理（NLP）任务的性能。LLaMA基于变换器（Transformer）架构，并经过大...

生成式AI 2024-06-09 人工智能

1260阅读

AIGC从入门到实战：利用 ChatGPT 来生成前后端代码

AIGC从入门到实战：利用 ChatGPT 来生成前后端代码作者：禅与计算机程序设计艺术 1. 背景介绍 1.1 人工智能生成内容(AIGC 的兴起 1.1.1 AIGC的定义与发展历程 1.1.2 AIGC在各领域的应用现状 1.1.3 A...

AIGC 2024-06-08 人工智能

772阅读

探索未来网页浏览的新型助手——WebLlama

探索未来网页浏览的新型助手——WebLlama 项目地址:https://gitcode.com/McGill-NLP/webllama ?‍? WebLlama ? 构建能遵循指令并与您对话的网络浏览代理 | ? GitHub | ?...

生成式AI 2024-06-08 人工智能

976阅读

深度学习突破：LLaMA-MoE模型的高效训练策略

在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。 LLaMA-MoE是一种基于...

人工智能 2024-06-07 人工智能

900阅读

解锁AI写作新纪元的文心一言指令

解锁AI写作新纪元的文心一言指令在人工智能（AI）飞速发展的今天，自然语言处理（NLP）技术取得了显著的进步。文心一言，作为NLP领域的一颗璀璨明星，以其强大的文本生成和指令理解能力，为写作领域带来了革命性的变革。本文主要讲解启动创新模型...

人工智能 2024-06-07 人工智能

898阅读

一文讲清楚，AI、AGI、AIGC与AIGC、NLP、LLM，ChatGPT等概念

前言随着chatgpt3.5的横空出试，大模型爆火，这个风暴传递到了各行各业。各类公众号、帖子，也涌现出了各种概念，AI、大模型、LLM、AI、AIGC、AGI、GPT、ChatGPT等等。总觉得被这些概念搞得头晕。我花了点时间，梳理了下...

大数据 2024-06-07 人工智能

1245阅读

首次证实白盒Transformer可扩展性！马毅教授CRATE-α：鲸吞14亿数据，性能稳步提升

在过去的几年里，Transformer架构在自然语言处理（NLP）、图像处理和视觉计算领域的深度表征学习中取得了显著的成就，几乎成为了AI领域的主导技术。然而，虽然Transformer架构及其众多变体在实践中取得了巨大成功，但其设计大多是基于经验的，...

人工智能 2024-06-06 人工智能

781阅读

LlamaFactory源码解析 PPO

class CustomPPOTrainer(PPOTrainer, Trainer : r""" Inherits PPOTrainer. """ def __init__( self,...

生成式AI 2024-06-04 人工智能

1778阅读

让大模型发挥更大作用，离不开知识库这个关键要素

在大模型的世界里，有一些黑话，比如“抽卡”和“炼丹”。这些术语听起来轻松有趣，但要让“仙丹”真正发挥作用，背后离不开一个关键要素——知识库。从自然语言处理（NLP）、内容生成到图像识别，大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问...

大数据 2024-06-03 人工智能

838阅读

ICML2024高分！魔改注意力，让小模型能打两倍大的模型

改进Transformer核心机制注意力，让小模型能打两倍大的模型！ ICML 2024高分论文，彩云科技团队构建DCFormer框架，替换Transformer核心组件多头注意力模块（MHA），提出可动态组合的多头注意力（DCMHA）。 DCMHA解除...

AIGC 2024-06-03 人工智能

795阅读

探索文心一言指令：AI与自然语言处理的新篇章

引言：自然语言处理与文心一言指令的探索（1）自然语言处理的发展及其重要性自然语言处理（NLP）是人工智能（AI）的一个关键领域，致力于使机器能够理解、解释和响应人类语言的方式。自从20世纪50年代计算机科学诞生以来，NLP已经从简单的模式识...

大数据 2024-06-03 人工智能

1149阅读

AIGC如何改变人类生活20240529

AIGC如何改变人类生活随着人工智能技术的不断发展，人类生活正经历着前所未有的变革。在这个过程中，AIGC（人工智能生成内容）的概念应运而生，它已经在很多领域产生了深远的影响。本文将探讨AIGC如何改变人类生活，以期为读者提供更多关于这一创新技术的启...

大数据 2024-06-02 人工智能

869阅读

AIGC 技术及应用初探

ChatGPT 相关话题近一年多来被刷爆，利用 AI 技术生成内容，引起了各行各业的关注。其实，自2022 年 4 月起，OpenAI、Google、Microsoft 相继发布了文生图模型，视觉创作就已经开始持续火热了。国内 AIGC 相关的技术和应用也...

人工智能 2024-06-01 人工智能

852阅读

AI、AGI、AIGC、AI Agent、Prompt、LLM 名词解释

啊！ChatGPT 最近很火呀，你们说的 AGI、AIGC、AI Agent、Prompt、LLM … 到底是什么意思啊？还有 Midjourney、Lensa、Sora、DALL-E、Llama … 又是什么鬼？ AI（Artificial Int...

人工智能 2024-06-01 人工智能

1143阅读

深入解析“TSCMS爬虫”技术与应用

在数字化信息爆炸的时代，数据获取与处理成为了各行各业不可或缺的环节。而爬虫技术，作为自动化获取网络数据的重要手段，日益受到人们的关注。今天，我们就来深入解析“TSCMS爬虫”这一特定领域的爬虫技术及其应用。一、TSCMS爬虫简介TSCMS，即某特定内容管理...

AIGC 2024-05-31 大数据

917阅读

如何看待AIGC技术？未来已来，请做好准备！

文章目录前言令人震撼无限可能核心优势背后力量双刃剑总结前言我正在写一篇关于人工智能对人类工作影响的文章，突然，我的电脑屏幕上弹出一条消息：“嘿，伙计，介意让我写一点吗？” 我吓了一跳，然后意识到是我自己的...

生成式AI 2024-05-31 人工智能

841阅读

每天都看模型评分，但你真的了解吗？OpenAI研究员最新博客，一文读懂LLM评估

上周六，OpenAI研究院Jason Wei在个人网站上发表了一篇博客，讨论了他眼中「成功的语言模型评估」应该具备哪些因素，并总结出了阻碍好的评估在NLP社区获得关注的「七宗罪」。 Jason Wei在最近的斯坦福NLP研讨会上展示了这篇文章，Open...

生成式AI 2024-05-30 人工智能

866阅读

超详细！AIGC面试系列大模型进阶(2)

本期问题快览 1. 如何让大模型处理更长的文本？ 2. 如果想要在某个模型基础上做全参数微调，究竟需要多少显存？ 3. 什么是有监督微调SFT 4. SFT 指令微调数据如何构建? 5. 领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘...

人工智能 2024-05-30 人工智能

1738阅读

详解各种LLM系列｜LLaMA 2模型架构、预训练、SFT内容详解 (PART1)

作者 | Sunnyyyyy 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/670002922 大家好，这里是 NewBeeNLP。之前我们分享了详解各种LLM系列｜...

生成式AI 2024-05-29 人工智能

1449阅读

手把手教你基于华为云，实现MindSpore模型训练

本文分享自华为云社区《【昇腾开发全流程】MindSpore华为云模型训练》，作者：沉迷sk。前言学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。并打通一个Ascend910训练到Ascend310推理的全流程...

大数据 2024-05-29 人工智能

897阅读

== 探索eyoucms爬虫：开启智能内容抓取新时代

==在数字化信息时代，数据已经成为一种宝贵的资源，而内容的获取与管理更是每个网站运营者不可忽视的环节。eyoucms作为一款知名的内容管理系统，其强大的功能与灵活的扩展性备受用户青睐。而结合了爬虫技术的eyoucms，则为用户打开了一扇高效、智能内容抓取的...

大数据 2024-05-29 大数据

799阅读

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具

探秘Faster Whisper：一款加速 Whisper 模型训练的高效工具项目地址:https://gitcode.com/SYSTRAN/faster-whisper 在自然语言处理（NLP）领域，Transformer架构的模型如Whis...

生成式AI 2024-05-28 人工智能

1162阅读

深入解析“boaphp爬虫”：原理、应用与未来趋势

在当今数字化时代，网络爬虫已成为数据获取与分析领域的重要工具。作为一种自动化程序，爬虫能够遍历互联网，抓取并解析网页数据，为各行各业提供丰富的数据资源。在众多爬虫框架中，“boaphp爬虫”以其高效、稳定、易用的特点，受到了广大开发者的青睐。本文将深入解析...

大数据 2024-05-28 大数据

834阅读

解读注意力机制原理，教你使用Python实现深度学习模型

本文分享自华为云社区《使用Python实现深度学习模型：注意力机制（Attention）》，作者：Echo_Wish。在深度学习的世界里，注意力机制（Attention Mechanism）是一种强大的技术，被广泛应用于自然语言处理（NLP）和计算机视...

AIGC 2024-05-28 人工智能

826阅读

一文读懂 Arthur Bench LLM 评估框架

Hello folks，我是 Luga，今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 评估。众所周知，LLM 评估是人工智能领域的一个重要议题。随着 LLM 在各个场景中的广泛应用,评估它们的能力和局限性变得越来越重要。作为一款新兴...

生成式AI 2024-05-27 人工智能

798阅读

全面超越DPO：陈丹琦团队提出简单偏好优化SimPO，还炼出最强8B开源模型

为了将大型语言模型（LLM）与人类的价值和意图对齐，学习人类反馈至关重要，这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面，一种有效的方法是根据人类反馈的强化学习（RLHF）。尽管经典 RLHF 方法的结果很出色，但其多阶段的过程依然带来了一些...

大数据 2024-05-27 人工智能

855阅读

Llama大型语言模型原理详解

Llama大型语言模型是一种基于深度学习的自然语言处理模型，它在文本生成、问答、摘要等多种NLP任务中展现出强大的性能。本文将详细解析Llama模型的原理，包括其结构、训练过程以及工作机制，帮助读者深入理解这一先进的模型。一、模型结构 Llama模型...

人工智能 2024-05-27 人工智能

876阅读

在Mac电脑上本地部署Llama大型语言模型

Llama大型语言模型以其出色的性能和广泛的应用场景，吸引了众多NLP研究者和开发者的关注。在Mac电脑上本地部署Llama模型，可以让我们更加便捷地利用这一强大工具进行各种NLP任务。本文将详细介绍在Mac电脑上本地部署Llama模型的步骤和注意事项。...

大数据 2024-05-26 人工智能

1010阅读

深入剖析“多多客CMS爬虫”：技术原理、应用场景与未来趋势

随着互联网技术的飞速发展，数据已经成为当今时代最宝贵的资源之一。为了获取海量数据，各种爬虫技术应运而生，其中“多多客CMS爬虫”以其高效、稳定的特点，在众多爬虫工具中脱颖而出。本文将深入探讨多多客CMS爬虫的技术原理、应用场景以及未来发展趋势，带领大家一探...

AIGC 2024-05-26 大数据

879阅读

探索 Obsidian Copilot：智能笔记的新里程碑

探索 Obsidian Copilot：智能笔记的新里程碑项目地址:https://gitcode.com/logancyang/obsidian-copilot 项目简介 Obsidian Copilot 是一个创新的插件，为流行的 markdo...

人工智能 2024-05-26 人工智能

1468阅读

Llama 3开源！手把手带你推理，部署，微调

节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学，针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。汇总合集《大模型面试...

大数据 2024-05-25 人工智能

956阅读

阿里投资Kimi AI开发商月之暗面细节曝光：8亿美元换36%股权

快科技5月24日消息，日前阿里巴巴发布了2024财年年报，其中披露了一项投资细节：阿里巴巴在2024财年向AI初创公司月之暗面（Moonshot AI）投资约8亿美元，以此换取了该公司约36%的股权。并且此次投资为优先股投资，显示了阿里巴巴对月之暗面及其...

AIGC 2024-05-24 人工智能

747阅读

Hugging Face全攻略：轻松下载Llama 3模型，探索NLP的无限可能！【实操】

Hugging Face：自然语言处理的强大开源模型库在数字化时代，自然语言处理（NLP）技术的崛起为人工智能的发展注入了新的活力。而Hugging Face，作为这一领域的佼佼者，凭借其强大的模型仓库、易用的API以及活跃的社区支持，成为无数NL...

人工智能 2024-05-24 人工智能

1444阅读

LLamaFactory：当下最容易上手的大模型微调工具

近日，国内的一款微调框架发布了自己的论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》，对他们的框架做了系统性的总结。该框架自推出后迅速出圈，现已斩获15.6k的s...

人工智能 2024-05-24 人工智能

1334阅读

中国AI独角兽资本大冒险

冰火两重天。成立不过一年多时间，月之暗面已然成为中国大模型赛道上，最炙手可热的明星公司。 5 月 21 日，华尔街见闻获悉，月之暗面将按照投前估值 30 亿美元（合217. 3 亿人民币）进行融资，完成后依然是当前中国估值最高的AI创业公司。过去一年，...

大数据 2024-05-24 人工智能

816阅读

250行代码从头搭建Llama 3，GitHub一天4.6k星！Karpathy大赞

Llama系列作为为数不多的优质开源LLM，一直受到开发者们的追捧。在Hugging Face社区的文本生成模型中，几乎是「霸榜」的存在。就在520这天，一位名叫Nishant Aklecha的开发者在推特上宣布了自己的一个开源项目，名为「从头开始实...

人工智能 2024-05-21 人工智能

950阅读

150B token从头训练，普林斯顿Meta发布完全可微MoE架构Lory

不同于大多数模型使用字母缩略起名，论文作者在脚注中解释道，Lory是一种羽毛有彩虹颜色的鹦鹉，和「软MoE」的精神非常相似。论文的作者团队也可以称之为「明星阵容」。论文地址：https://arxiv.org/abs/2405.03133 主要作者...

生成式AI 2024-05-20 人工智能

892阅读

深入解析“QueryPHP爬虫”：原理、应用与未来发展

在当今数字化信息时代，数据已经成为驱动一切的关键要素。随着互联网技术的不断进步，如何高效、准确地抓取与利用网络数据，成为了众多开发者和企业关注的焦点。在这个背景下，基于QueryPHP的爬虫技术以其独特的优势，逐渐受到业界的青睐。本文将从QueryPHP爬...

人工智能 2024-05-20 大数据

740阅读

“蓝宝石留言本爬虫”探索与数据处理

随着互联网的蓬勃发展，网络留言本已成为人们交流信息、分享观点的重要平台。在这个信息爆炸的时代，如何从海量的留言数据中高效获取有价值的信息，成为数据分析领域的一大挑战。本文将围绕“蓝宝石留言本爬虫”的构建与应用，深入探讨爬虫技术的实现原理、留言数据的处理分析...

生成式AI 2024-05-18 大数据

819阅读

又被 OpenAI 截胡，Google推出开源视觉语言模型：PaliGemma

前言该模型结合了 SigLIP 视觉模型和 Gemma 语言模型，这两种模型都是开放组件，使得PaliGemma在处理视觉与语言结合的任务上表现出色。 PaliGemma的使用场景包括图像字幕、图像标签和视觉问答等。这些应用场景利用了PaliGemm...

生成式AI 2024-05-17 人工智能

935阅读

「大模型」之所短，「知识图谱」之所长

最近一年以来，大语言模型技术突飞猛进，被广泛地认为开启了人工智能研究的新阶段。大语言模型时代的到来，给知识图谱技术也带来了新的机遇与挑战。我们在 5 月份的时候曾经发布过知识图谱与 AIGC 大模型的知识地图，其中包括了文本生成、图像生成等技术。本次分享...

人工智能 2024-05-16 人工智能

986阅读