nlp 第9页 - AIGC资讯

五种资源类别，如何提高大语言模型的资源效率，超详细综述来了

近年来，大型语言模型（LLM）如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型，具有庞大的参数量（例如 1750 亿个参数），在复杂度和能力上实现了飞跃。随着 LLM 的发展趋势朝着不断增大的模型规模前进，这些模型在从智能聊天机器...

大数据 2024-01-15 人工智能

1162阅读

ChatGPT探索系列之六：思考ChatGPT的未来发展趋势和挑战

文章目录前言一、未来发展趋势 1. ChatGPT重塑数据分析之道 2. ChatGPT颠覆企业运用人工智能和机器学习的途径 3. ChatGPT颠覆自动化商业流程 4. ChatGPT引领企业决策迈向新纪元二、ChatGPT掀开未来...

人工智能 2024-01-15 人工智能

929阅读

大模型相关技术综述

多模态大模型&大模型训练语料持续迭代已经开始整理多模态-视觉部分：主要分为一下几块多模态信息压缩模型（clip、vit、swiT）生成模型（vae、gan、flow、ddpm、sde... 其它多模态大模型（语音...

AIGC 2024-01-14 人工智能

1124阅读

LexisNexis 迎接生成式人工智能挑战

正在寻找抵御生成式人工智能破坏性威胁的突破口的 IT 领导者可能会从身为 LexisNexis 执行副总裁兼 CTO 的 Jeff Reihl 的建议中获益：快速采用该技术，以领先于潜在的破坏者。 Reih 指出，自 20 世纪 70 年代初成立以来，L...

AIGC 2024-01-14 人工智能

860阅读

AIGC技术研究与应用 ---- 下一代人工智能：新范式！新生产力！（2.4 -大模型发展历程之多模态）

文章大纲什么是多模态为什么 Transformer 也是多模态模型的基础架构视觉 Transformer 和 Text Transformer 如何结合 - contrastive learning 对比学习 stable diffu...

生成式AI 2024-01-13 人工智能

1076阅读

为大模型恶补数学，上交开源MathPile语料库，95亿tokens，还可商用

在当前智能对话模型的发展中，强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库，而如何构建这样的语料库，已成为行业中的一大挑战。在备受瞩目的 AI for Math 领域，由于高质量的数学语料相对稀缺，这限制了生成式...

AIGC 2024-01-13 人工智能

858阅读

为什么人工智能如此需要资源？

截至2023年底，任何关于生成式人工智能需要多少能源的预测都是不准确的。头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时，数据中心新闻等专业出版物的报道称，功率密度将上升到每机架50千瓦或100千...

人工智能 2024-01-13 人工智能

804阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

969阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1264阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

1016阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

892阅读

法国一公司发布全球首款 AI 智能镜子：可识别用户情绪、缓解压力

1 月 8 日消息，在 CES 2024 期间，法国一家名为 Baracoda 的智慧健康科技公司发布了全球首款 AI 智能镜子 BMind，按照官方的说法，这是一款专为心理健康而设计，能够识别情绪、帮助管理压力的“健康伴侣”。 BMind 由生成式...

AIGC 2024-01-08 人工智能

828阅读

【好书推荐-第二期】《实战AI大模型》：带你走进大模型GPTs、AIGC的世界（李开复、周鸿祎、颜水成倾力推荐）

? 作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号：程序员洲洲。 ? 本文专栏：本文收录于洲洲的《送书福利》系列专栏，该专栏福利多多，只需...

生成式AI 2024-01-08 人工智能

1208阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1447阅读

十个值得收藏的AI人工智能网站（AI绘画、AI插件）

1、伯乐 AI 伯乐 AI（https://ai.bleai.cn）是一种基于文心大模型的知识增强大语言模型，专注于自然语言处理（NLP）领域的技术研发。它具备强大的语义理解和生成能力，能够处理各种复杂的自然语言任务。伯乐 AI在NLP领域有着广泛的应用...

大数据 2024-01-08 人工智能

1641阅读

Llama~transformers搭建

本例从零开始基于transformers库逐模块搭建和解读Llama模型源码(中文可以翻译成羊驼。并且训练它来实现一个有趣的实例：两数之和。输入输出类似如下：输入："12345+54321=" 输出："66666" 我们把这个任务当做一个...

AIGC 2024-01-07 人工智能

1113阅读

2024 CSRankings全球计算机科学排名发布！AI领域中国高校霸榜，清华排名第一

【新智元导读】CSRankings2024结果出炉!全世界计算机科学机构的排名进行了大更新。在AI板块，清华、北大、上交分列TOP3，CMU和浙大并列第4。AI TOP10中的中国高校，还包括人大、南京大学、复旦大学、哈工大等。 2024CSRanking...

人工智能 2024-01-07 人工智能

1047阅读

【人工智能革命】：AIGC时代的到来 | 探索AI生成内容的未来

? 屿小夏：个人主页 ?个人专栏： IT杂谈 ? 莫道桑榆晚，为霞尚满天！文章目录 ?前言一. AIGC 技术的概述和发展趋势 1.1 AIGC 技术的概述 1.2 AI...

大数据 2024-01-07 人工智能

980阅读

第二证券|ChatGPT被“玩坏”，美图大涨45%，AIGC赛道风口来了？

AIGC（人工智能主动生成内容）近期被ChatGPT带火了！近来明星人工智能公司OpenAI发布了全新的谈天机器人模型ChatGPT。该模型能够主动生成代码以及绘画、答复一系列问题、承认自己的错误、质疑不正确的假设，乃至回绝不合理的要求，且支撑中文。...

大数据 2024-01-07 人工智能

842阅读

万字长文谈自动驾驶BEV感知

本文经自动驾驶之心公众号授权转载，转载请联系出处。 prologue 这有可能是更的最长的文章系列了，先说为什么，一方面是看到分割大模型对小模型的提升效果需要时间，另一方面是之前对自动驾驶的BEV算法做了很长时间的预研，自己也应该好好梳理一下了。（很...

生成式AI 2024-01-07 人工智能

1109阅读

AI平台：文心大模型-产业级知识增强大模型

文心大模型-产业级知识增强大模型···大模型···产品中心···星河社区···合作咨询···文心一言，你的智能伙伴有用、有趣、有温度写方案、想点子、问万事、闲聊天现已全面开放，快来和我聊天吧查看详情两小时玩转大模型创意应用学习课程文心一言向全社会开放文心一...

生成式AI 2024-01-06 人工智能

1160阅读

《Cocos Creator游戏实战》AIGC之将草稿内容转为真实内容

目录前言训练AI 从识别结果中提取必要数据发送图片并生成最终代码总结与提高资源下载前言当创作灵感来的时候，我们可能会先把灵感记录在草稿上，之后再去实现它。比方说有一天，我突然来了游戏创作灵感，想着那可以先把一些简单的组件...

大数据 2024-01-06 人工智能

893阅读

aAMUSEd官网体验入口 AI自然语言处理工具软件免费下载地址

aAMUSEd是一个开源平台，提供各种自然语言处理（NLP）模型、数据集和工具。它包含一个基于MUSE的轻量级遮蔽图像模型（MIM），专用于文本到图像的生成。与潜在扩散（latent diffusion）方法相比，MIM需要更少的推理步骤，且更易于解释。此...

AIGC 2024-01-05 人工智能

803阅读

图解tinyBERT模型——BERT模型压缩精华

译者 | 朱先忠审校 | 重楼简介近年来，大型语言模型的发展突飞猛进。BERT成为最受欢迎和最有效的模型之一，可以高精度地解决各种自然语言处理（NLP）任务。继BERT模型之后，一组其他的模型也先后出现并各自展示出优秀的性能。不难看到一个明显趋势...

AIGC 2024-01-05 人工智能

1030阅读

OpenAI的ChatGPT、微软的New Bing、百度的文心一言、Google的Bard、阿里云的通义千问

随着 ChatGPT 热潮卷起来，微软发布New Bing、百度发布了文心一言、Google 发布了 Bard，阿里云官方终于也宣布了，旗下的 AI 大模型“通义千问”也正式开启测试！ ChatGPT ChatGPT是一种由OpenAI训练的大...

大数据 2024-01-04 人工智能

976阅读

大模型中幻觉缓解技术的综合调查

大型语言模型（LLMs）是具有大量参数和数据的深度神经网络，能够在自然语言处理（NLP）领域实现多种任务，如文本理解和生成。近年来，随着计算能力和数据规模的提升，LLMs取得了令人瞩目的进展，如GPT-4、BART、T5等，展现了强大的泛化能力和创造力。...

人工智能 2024-01-04 人工智能

1245阅读

维基百科+大模型打败幻觉！斯坦福WikiChat性能领先GPT-4

斯坦福大学的研究人员利用维基百科数据训练了一个大模型，命名为WikiChat，通过优化和改进，成功解决了大模型的幻觉问题，并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性，远远超过了GPT-4的66.1%。此外...

大数据 2024-01-04 人工智能

854阅读

从ChatGPT说起，AIGC生成模型如何演进

ChatGPT是继stable diffusion 之后，又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子，包括投资圈都为之震惊，大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了，小猿经过高强度的网络冲浪，整理出了A...

人工智能 2024-01-04 人工智能

850阅读

AAAI 2024 Fellow公布，清华大学朱军教授入选

AAAI（Association for the Advancement of Artificial Intelligence）是国际人工智能领域最权威的学术组织之一，Fellow 是该学会给予会员的最高荣誉，仅颁给对人工智能做出「非同寻常的卓越贡献者」...

生成式AI 2024-01-03 人工智能

934阅读

AIGC初探：提示工程 Prompt Engineering

简介提升工程是什么提示工程（Prompt Engineering）是人工智能领域中的一个概念，特别是在自然语言处理（NLP）领域中。它是一种通过设计和优化输入提示来提高AI模型表现的方法。对于基于转换器的大型语言模型（如OpenAI的GPT...

AIGC 2024-01-03 人工智能

1169阅读

基础模型+机器人：现在已经走到哪一步了

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU 的 Yonatan Bisk 和 Google DeepMind...

大数据 2024-01-01 人工智能

768阅读

手把手教你通过PaddleHub快速实现输入中/英文本生成图像（Stable Diffusion）

近来，基于Diffusion的文图生成模型比较火，用户输入一句话，模型就可以生成一副对应的图像，还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程，以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...

大数据 2024-01-01 人工智能

1266阅读

一文通透位置编码：从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long

前言关于位置编码和RoPE 应用广泛，是很多大模型使用的一种位置编码方式，包括且不限于LLaMA、baichuan、ChatGLM等等我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的，一篇是关于transformer从零实现...

人工智能 2024-01-01 人工智能

1106阅读

每个开发者都应该知道的6个生成式AI框架和工具

译者 | 晶颜审校 | 重楼在快速发展的技术领域，生成式人工智能是一股革命性的力量，它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界，揭示了对每个开发人员都必不可少的框架和工具。一、LangChain 图片 LangCh...

AIGC 2024-01-01 人工智能

1094阅读

基于Huggingface完成text-to-image的文本生成图像实例(AIGC)--零基础

AIGC指人工智能生成创造力（Artificial Intelligence Generated Creativity，AIGC），是一个涵盖多个领域的跨学科领域，它将人工智能和计算机科学与创造力和艺术结合起来，旨在通过算法生成具有创造力和艺术性的作品，例...

大数据 2024-01-01 人工智能

911阅读

LLaMA, ChatGLM, BLOOM的参数高效微调实践

作者：回旋托马斯x（腾讯NLP算法工程师）项目地址：https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比大语言模型的训练分为两个阶段：（1）在海量文本语料上的无监督预训练，学习通用的语义表...

人工智能 2024-01-01 人工智能

1278阅读

AIGC盛行，带你轻松调用开发

文章目录前言一、?AIGC简介二、?开通体验开通模型获取API-KEY 三、?基于java实现调用 1.设置API-KEY 2.体验大语言模型多轮对话演示补充流式输出 3.体验通义千问VL 使用官方提供照片本地文件多轮对...

生成式AI 2023-12-30 人工智能

1105阅读

语音识别之百度语音试用和OpenAiGPT开源Whisper使用

0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包和OpenAI近期免费开源的语言识别Whisper(真香警告介绍了常见的语言识别实现原理 1.NLP 自然语言处理(人类语言处理你好不同人...

生成式AI 2023-12-29 人工智能

926阅读

字节具身智能新成果：用大规模视频数据训练GR-1，复杂任务轻松应对

最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练，然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征，进而让其轻松迁移到下游的任务上。但相比自然语言数据，机器人数据是十分稀缺的。而且机器...

人工智能 2023-12-29 人工智能

800阅读

谁能撼动Transformer统治地位？Mamba作者谈LLM未来架构

在大模型领域，一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。这个挑战者就是一项名为「Mamba」的研究，其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面，无论是预训练还是下游评估，Mamba-3B 模...

人工智能 2023-12-29 人工智能

1050阅读

深言科技“语鲸大模型”通过备案将陆续向公众开放服务

12月26日，深言科技“语鲸大模型”正式通过《生成式人工智能服务管理暂行办法》备案，将陆续面向社会公众开放服务。 “语鲸大模型”具备强大的语义理解与文本生成、代码理解与生成、逻辑推理等能力，提供文本创作、数学计算、代码补全等服务，在中文理解和生成能力上行业...

生成式AI 2023-12-28 人工智能

887阅读

不止大模型，亚马逊云科技布局AIGC底座能力

“大模型只是客户需求的其中一个部分，但远远不是所有，客户还需要更广泛的基础能力。亚马逊云科技推出自研芯片、生成式AI服务Bedrock以及大模型Titan，都在致力于推动AIGC技术的普惠化，够降AIGC的技术门槛和资金门槛，让更多的人更容易的...

AIGC 2023-12-27 人工智能

862阅读

LLaMa、Qwen、ChatGLM、ChatGLM2的区别

LLaMa、Qwen、ChatGLM、ChatGLM2的区别以下比较的前提是首先和BERT(transfomer 的对比感谢帮忙给我github repository的star，更多最新模型长期更新：https://github.com/zysN...

人工智能 2023-12-27 人工智能

1676阅读

AIGC - 入门向量空间模型

文章目录向量和向量空间向量的运算什么是向量空间？向量空间的几个重要概念向量之间的距离曼哈顿距离（Manhattan Distance）欧氏距离（Euclidean Distance）切比雪夫距离（Chebyshev Dist...

AIGC 2023-12-26 人工智能

830阅读

一文读懂常用的 “生成式 AI 库”

Hello folks，我是 Luga，今天我们继续来聊一下人工智能（AI）生态领域相关的技术 - GenerativeAI Library（生成式 AI 库），本文将继续聚焦在针对 Gen AI Library 的技术进行解析，使得大家能够了解 G...

AIGC 2023-12-26 人工智能

1222阅读

挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

在大模型领域，Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显，比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷，研究者们开发出了很多...

生成式AI 2023-12-25 人工智能

1125阅读

一篇综述，看穿基础模型+机器人的发展路径

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU 的 Yonatan Bisk 和 Google DeepMind...

大数据 2023-12-25 人工智能

872阅读

OCR终结了？旷视提出支持文档级OCR的多模态大模型，支持中英文，已开源！

想将一份文档图片转换成Markdown格式？以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次，只需一句话命令，多模态大模型Vary直接端到端输出结果：图片无论是中英文的大段文字：图片还是包含了公式的文档图片...

AIGC 2023-12-25 人工智能

979阅读

到2030年，六项技术工作将由AI/自动化终结

译者 | 晶颜审校 | 重楼如今，人工智能和自动化已进入高速发展阶段，很多人都在担心它们将会取代部分专业角色。虽然预测某些工作将彻底消失似乎有些夸张，但明智的做法是，对未来可能发生的情况保持现实视角，以便为接下来发生的任何事情做好准备。考虑到这一...

人工智能 2023-12-25 人工智能

952阅读

LLaMA 简介：一个具有 650 亿参数的基础大型语言模型官网介绍

2023 年 2 月 24 日更新：我们刚刚推出了Llama 2 - 有关最新信息的更多信息，请参阅我们关于 Llama 2 的博客文章。作为 Meta 致力于开放科学的一部分，今天我们公开发布 LL...

人工智能 2023-12-25 人工智能

1230阅读