-
维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4
斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性,远远超过了GPT-4的66.1%。此外...
-
从ChatGPT说起,AIGC生成模型如何演进
ChatGPT是继stable diffusion 之后,又一个火出圈的人工智能算法。这火爆程度不仅仅是科研圈子,包括投资圈都为之震惊,大家惊呼人工智能可能真的要取代人类了。网上关于ChatGPT的分析文章已经非常多了,小猿经过高强度的网络冲浪,整理出了A...
-
AAAI 2024 Fellow公布,清华大学朱军教授入选
AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最权威的学术组织之一,Fellow 是该学会给予会员的最高荣誉,仅颁给对人工智能做出「非同寻常的卓越贡献者」...
-
AIGC初探:提示工程 Prompt Engineering
简介 提升工程是什么 提示工程(Prompt Engineering)是人工智能领域中的一个概念,特别是在自然语言处理(NLP)领域中。它是一种通过设计和优化输入提示来提高AI模型表现的方法。 对于基于转换器的大型语言模型(如OpenAI的GPT...
-
基础模型+机器人:现在已经走到哪一步了
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
手把手教你通过PaddleHub快速实现输入中/英文本生成图像(Stable Diffusion)
近来,基于Diffusion的文图生成模型比较火,用户输入一句话,模型就可以生成一副对应的图像,还是很有意思的。本文记录了通过PaddleHub快速实现上述任务的过程,以供参考。 1、安装PaddlePaddle PaddleHub底层依赖于百度自研的...
-
一文通透位置编码:从标准位置编码、旋转位置编码RoPE到ALiBi、LLaMA 2 Long
前言 关于位置编码和RoPE 应用广泛,是很多大模型使用的一种位置编码方式,包括且不限于LLaMA、baichuan、ChatGLM等等 我之前在本博客中的另外两篇文章中有阐述过(一篇是关于LLaMA解读的,一篇是关于transformer从零实现...
-
每个开发者都应该知道的6个生成式AI框架和工具
译者 | 晶颜 审校 | 重楼 在快速发展的技术领域,生成式人工智能是一股革命性的力量,它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界,揭示了对每个开发人员都必不可少的框架和工具。 一、LangChain 图片 LangCh...
-
基于Huggingface完成text-to-image的文本生成图像实例(AIGC)--零基础
AIGC指人工智能生成创造力(Artificial Intelligence Generated Creativity,AIGC),是一个涵盖多个领域的跨学科领域,它将人工智能和计算机科学与创造力和艺术结合起来,旨在通过算法生成具有创造力和艺术性的作品,例...
-
LLaMA, ChatGLM, BLOOM的参数高效微调实践
作者:回旋托马斯x(腾讯NLP算法工程师) 项目地址:https://zhuanlan.zhihu.com/p/635710004 1. 开源基座模型对比 大语言模型的训练分为两个阶段: (1)在海量文本语料上的无监督预训练,学习通用的语义表...
-
AIGC盛行,带你轻松调用开发
文章目录 前言 一、?AIGC简介 二、?开通体验 开通模型获取API-KEY 三、?基于java实现调用 1.设置API-KEY 2.体验大语言模型 多轮对话演示 补充流式输出 3.体验通义千问VL 使用官方提供照片 本地文件 多轮对...
-
语音识别之百度语音试用和OpenAiGPT开源Whisper使用
0.前言: 本文作者亲自使用了百度云语音识别,腾讯云,java的SpeechRecognition语言识别包 和OpenAI近期免费开源的语言识别Whisper(真香警告 介绍了常见的语言识别实现原理 1.NLP 自然语言处理(人类语言处理 你好不同人...
-
字节具身智能新成果:用大规模视频数据训练GR-1,复杂任务轻松应对
最近 GPT 模型在 NLP 领域取得了巨大成功。GPT 模型首先在大规模的数据上预训练,然后在特定的下游任务的数据上微调。大规模的预训练能够帮助模型学习可泛化的特征,进而让其轻松迁移到下游的任务上。 但相比自然语言数据,机器人数据是十分稀缺的。而且机器...
-
谁能撼动Transformer统治地位?Mamba作者谈LLM未来架构
在大模型领域,一直稳站 C 位的 Transformer 最近似乎有被超越的趋势。 这个挑战者就是一项名为「Mamba」的研究,其在语言、音频和基因组学等多种模态中都达到了 SOTA 性能。在语言建模方面,无论是预训练还是下游评估,Mamba-3B 模...
-
深言科技“语鲸大模型”通过备案 将陆续向公众开放服务
12月26日,深言科技“语鲸大模型”正式通过《生成式人工智能服务管理暂行办法》备案,将陆续面向社会公众开放服务。 “语鲸大模型”具备强大的语义理解与文本生成、代码理解与生成、逻辑推理等能力,提供文本创作、数学计算、代码补全等服务,在中文理解和生成能力上行业...
-
不止大模型,亚马逊云科技布局AIGC底座能力
“大模型只是客户需求的其中一个部分,但远远不是所有,客户还需要更广泛的基础能力。亚马逊云科技推出自研芯片、生成式AI服务Bedrock以及大模型Titan,都在致力于推动AIGC技术的普惠化,够降AIGC的技术门槛和资金门槛,让更多的人更容易的...
-
LLaMa、Qwen、ChatGLM、ChatGLM2的区别
LLaMa、Qwen、ChatGLM、ChatGLM2的区别 以下比较的前提是首先和BERT(transfomer 的对比 感谢帮忙给我github repository的star,更多最新模型长期更新:https://github.com/zysN...
-
AIGC - 入门向量空间模型
文章目录 向量和向量空间 向量的运算 什么是向量空间? 向量空间的几个重要概念 向量之间的距离 曼哈顿距离(Manhattan Distance) 欧氏距离(Euclidean Distance) 切比雪夫距离(Chebyshev Dist...
-
一文读懂常用的 “生成式 AI 库”
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - GenerativeAI Library(生成式 AI 库) ,本文将继续聚焦在针对 Gen AI Library 的技术进行解析,使得大家能够了解 G...
-
挑战Transformer的Mamba是什么来头?作者博士论文理清SSM进化路径
在大模型领域,Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长,Transformer 的局限性也逐渐凸显,比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷,研究者们开发出了很多...
-
一篇综述,看穿基础模型+机器人的发展路径
机器人是一种拥有无尽可能性的技术,尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑,帮助机器人感知和理解这个世界并制定决策和进行规划。 近日,CMU 的 Yonatan Bisk 和 Google DeepMind...
-
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型Vary直接端到端输出结果: 图片 无论是中英文的大段文字: 图片 还是包含了公式的文档图片...
-
到2030年,六项技术工作将由AI/自动化终结
译者 | 晶颜 审校 | 重楼 如今,人工智能和自动化已进入高速发展阶段,很多人都在担心它们将会取代部分专业角色。虽然预测某些工作将彻底消失似乎有些夸张,但明智的做法是,对未来可能发生的情况保持现实视角,以便为接下来发生的任何事情做好准备。 考虑到这一...
-
LLaMA 简介:一个具有 650 亿参数的基础大型语言模型 官网介绍
2023 年 2 月 24 日 更新:我们刚刚推出了Llama 2 - 有关最新信息的更多信息,请参阅我们关于 Llama 2 的博客文章。 作为 Meta 致力于开放科学的一部分,今天我们公开发布 LL...
-
大火的AIGC是什么?能用到工作中哪些地方?
一.AIGC是什么? AIGC(即Artificial Intelligence Generated Content),中文译为人工智能生成内容。简单来说,就是以前本来需要人类用思考和创造力才能完成的工作,现在可以利用人工智能技术来替代我们完成。 在...
-
ChatGPT vs Bard 背后的技术
自 2022 年 11 月推出以来,OpenAI 的 Chat GPT 引起了广泛关注。但现在,谷歌已经加强了 Bard AI,这是其最新发布的产品之一。 OpenAI 的Chat GPT是一种 AI 语言模型,能够以对话的方式执行文本摘要、语言翻译和问...
-
最强英文开源模型LLaMA架构探秘,从原理到源码
导读:LLaMA 65B是由Meta AI(原Facebook AI)发布并宣布开源的真正意义上的千亿级别大语言模型,发布之初(2023年2月24日)曾引起不小的轰动。LLaMA的横空出世,更像是模型大战中一个搅局者。虽然它的效果(performance)...
-
【LLM】LLaMA简介:一个650亿参数的基础大型语言模型
LLaMA简介:一个650亿参数的基础大型语言模型 Paper Setup 其他资料 作为 Meta 对开放科学承诺的一部分,今天我们将公开发布 LLaMA (大型语言模型 Meta AI ,这是一个最先进的大型语言基础模型,旨在帮...
-
关于生成式语言大模型的一些工程思考 paddlenlp & chatglm & llama
生成式语言大模型,随着chatgpt的爆火,市场上涌现出一批高质量的生成式语言大模型的项目。近期百度飞桨自然语言处理项目paddlenlp发布了2.6版本。更新了以下特性:全面支持主流开源大模型Bloom, ChatGLM, GLM, Llama, OPT...
-
Gemini AI免费测试入口在哪 谷歌Gemini软件怎么样
谷歌Gemini AI是一款由谷歌人工智能部门开发的大型语言模型(LLM)。它是在一个包含文本、代码、音频、图像和视频的庞大数据集上训练的。Gemini AI可以用于各种任务,包括自然语言处理(NLP 、机器翻译、代码生成、创意写作和问题回答。Google...
-
【大模型AIGC系列课程 3-7】领域&私域对话数据收集与生成
重磅推荐专栏: 《大模型AIGC》;《课程大纲》本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深...
-
【AI大模型】Google Bard (PaLM2) 大模型写代码能力实测: LSM Tree, DAG Scheduler, AI大模型加持自然语言零代码平台设计(福利O:文末附PaLM2访问链接)
禅与计算机程序设计艺术评测结论:当前AI大模型写代码能力当之无愧的 No.1. Google Bard (PaLM2 文章目录 禅与计算机程序设计艺术评测结论:当前AI大模型写代码能力当之无愧的 No.1. Google Bard...
-
开源与闭源大模型之战:Llama 2 vs. GPT-4 vs. Claude-2
人工智能一直在以惊人的速度发展,特别是在自然语言处理(NLP)领域。这场革命的领跑者包括三种杰出的人工智能语言模型:Llama 2、GPT-4 和 Claude-2。在这篇博客中,我们将探索这些人工智能巨头,了解他们独特的能力以及他们对各个领域的潜在影响...
-
【AIGC未来的发展方向】面向人工智能的第一步,一文告诉你人工智能是什么以及未来的方向分析
人工智能的概念 当人们提到“人工智能(AI)”时,很多人会想到机器人和未来世界的科幻场景,但AI的应用远远不止于此。现在,AI已经广泛应用于各种行业和生活领域,为我们带来了无限可能。 AI是一个广泛的概念,它包括很多不同的技术,例如机器学习、深度学习...
-
AI绘画:StableDiffusion炼丹Lora攻略-实战萌宠图片生成
Lora攻略-实战萌宠图片生成 写在前面的话 一:准备 二、Lora作用 1.AI模特 2.炼衣服Lora 3.改变画风/画面背景 Lora模型究竟是什么? 三、如何炼制自己的Lora模型? 四、炼丹前的准备(**下载整合包**) 五、选择...
-
【EMNLP 2023】面向垂直领域的知识预训练语言模型
近日,阿里云人工智能平台PAI与华东师范大学数据科学与工程学院合作在自然语言处理顶级会议EMNLP2023上发表基于双曲空间和对比学习的垂直领域预训练语言模型。通过比较垂直领域和开放领域知识图谱数据结构的不同特性,发现在垂直领域的图谱结构具有全局稀疏,局部...
-
你真的会写 Prompt ? 剖析 RAG 应用中的指代消解
随着 ChatGPT 等大语言模型(LLM 的不断发展,越来越多的研究人员开始关注语言模型的应用。 其中,检索增强生成(Retrieval-augmented generation,RAG)是一种针对知识密集型 NLP 任务的生成方法,它通过在生成过程中...
-
大语言模型训练数据常见的4种处理方法
本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》,作者: 码上开花_Lancer。 大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然,截止到2023 年9 月为止,还...
-
每个开发人员都应该知道的六个生成式AI框架和工具
译者 | 晶颜 审校 | 重楼 在快速发展的技术领域,生成式人工智能是一股革命性的力量,它改变了开发人员处理复杂问题和创新的方式。本文深入探讨了生成式AI的世界,揭示了对每个开发人员都必不可少的框架和工具。 LangChain LangChain由H...
-
AIGC与搜索深度融合,百度定义“生成式搜索”
设想一下,当你搜索“公司活动通知怎么写”时,搜索引擎直接“写”了一篇送到眼前是什么体验?百度的“生成式搜索”正在让这样的场景成为现实。 日前,百度宣布,百度搜索将升级“生成式搜索”能力,基于百度自研的生成式模型能力,为用户开放式的搜索提问或定制化...
-
word2vec作者爆料:seq2seq是我的想法、GloVe抄袭技巧,反击来了
随着 NeurIPS 2023 获奖论文的公布,十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Com...
-
通俗理解DDPM到Stable Diffusion原理
?关注公众号funNLPer畅度阅读? 代码1:stabel diffusion 代码库 代码2:diffusers 代码库 论文:High-Resolution Image Synthesis with Latent Diffusion Mo...
-
阿里「通义千问」大战百度「文心一言」15个回合后,GPT4沉默了
文|卖萌酱 这几天风闻阿里的AI大模型要发布,我刷了这把老脸,成功成为了第一批吃到螃蟹的人! 测试界面长这样: 传送门:https://tong...
-
「X」Embedding in NLP|神经网络和语言模型 Embedding 向量入门
在「X」Embedding in NLP 进阶系列中,我们介绍了自然语言处理的基础知识——自然语言中的 Token、N-gram 和词袋语言模型。今天,我们将继续和大家一起“修炼”,深入探讨神经网络语言模型,特别是循环神经网络,并简要了解如何生成 Embe...
-
Hugging Face 首席执行官希望实现人工智能民主:将 AI 的力量集中在少数人手中是有风险的
Hugging Face 的首席执行官 Clément Delangue 对大型科技公司像商业专利一样保留机器学习代码的做法持反对态度。相反,他正在努力构建一个世界,在这个世界中,每个开发者或初创公司都可以自由访问人工智能模型,并有效地帮助 AI 实现开源...
-
Stable Diffusion 的提示词使用技巧
推荐Stable Diffusion自动纹理工具: DreamTexture.js自动纹理化开发包 什么是提示语? 提示语是人工智能中的一个重要组成部分,尤其是自然语言处理 (NLP)。在AI自人工智能中,想要获得好的效果,简洁、准确的提示语尤...
-
OpenAI 的超级对齐团队在做什么
今年11月17日,OpenAI 首席执行官萨姆·奥尔特曼 (Sam Altman 在首席科学家伊利亚·苏茨克韦尔 (Ilya Sutskever 的政变下被罢免,但三天后复职。不到一个月,OpenAI 宣布一切恢复正常,而这一切导火索是团队内部的有...
-
word2vec作者曝与Ilya等十年积怨:seq2seq也是我的想法
里程碑式论文word2vec获得NeurIPS时间检验奖,可谓实至名归。 但一作Tomas Mikolov在Facebook上发表的长篇获奖感言,却充满了失望和不满。 图片 论文最初被ICLR拒稿都算小事了,他还暗讽了OpenAI首席科学家Ilya Su...
-
我们聊聊如何增强ChatGPT处理模糊问题能力
提示工程技术可帮助大语言模型在检索增强生成系统中处理代词等复杂核心参照物。 译自Improving ChatGPT’s Ability to Understand Ambiguous Prompts,作者 Cheney Zhang 是 Zilliz 的一...
-
AIGC/ChatGPT这么火,相关的AI产品岗,真的有变多吗?_最新AI产品经理求职动态(28)...
最近咱们社群的“AI产品经理求职季”活动里,有些特别的发现和感触,近期求职的AI产品经理或AI企业需求方,值得看看—— 目录 一、最近AIGC/ChatGPT这么火,相关的AI产品岗,真的有变多吗? 二、还有哪些方向的招聘需求,相...