-
恒生电子首席科学家白硕:长文本和多模态是生成式AI落地金融的两大利器
嘉宾丨白硕 采访/撰稿丨张洁 编辑丨千山 出品 | 51CTO技术栈(微信号:blog51cto) 在千行百业中,金融业一贯是新技术的早期采用者。无论是在数字化水平,还是在关于产业AI化的探索上,都走在了前列。因此,金融业也被视为生成式AI应用落地的潜力...
-
首席人工智能官的基本技能和特质
首席人工智能官(CAIO)需要多维的技能来推动创新、建立和领导AI就绪的文化,并且利用复杂且快速发展的技术取得切实的组织性成果。 AI(尤其是生成式AI)的快速崛起促使许多组织雇用或晋升了首席人工智能官(CAIO)。 迄今为止,很多类似职位都是集中在技术...
-
知识图与大型语言模型的协同作用
从非结构化文本中提取有价值的见解是金融行业的关键应用。然而,这项任务往往超出了简单的数据提取,需要高级推理能力。 一个典型的例子是确定信贷协议中的到期日,这通常涉及破译一个复杂的指令,如“到期日应在生效日期三周年之前的最后一个工作日”。这种级别的复杂推...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
生成式AI模型大PK——GPT-4、Claude 2.1和Claude 3.0 Opus
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 简介 当前,RAG(检索增强生成 系统的新评估似乎每天都在发布,其中许多都集中在有关框架的检索阶段。然而,生成方面——模型如何合成和表...
-
《2024年人工智能准备度报告》发布!6成企业拟采用AI,投入生产的仅占其中三分之一;OpenAI稳坐王位;比起RAG更爱微调…
整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 最近,人工智能公司 Scale AI发布 《2024年人工智能准备度报告》。 该系列报告已经是连续第三年进行发布,本次报告调查采访了1800 多名在企业中构建或应用人...
-
最懂打工人的AI特助万知来了,李开复在线催更!2分钟手机直出PPT效率×10
【新智元导读】这款最适合中国宝宝体质的AI个人特助,直接让打工效率原地×10!5000页长文档速读,2分钟搞定PPT,表格公式代码全输出。而且,CEO李开复还亲自出任首席体验官,倾听你的反馈。 快节奏的生活已经成为当今时代的常态,职场中的我们不仅要应对工作...
-
开发者的LlamaIndex入门指南
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ LlamaIndex是一个专注于检索增强生成(RAG 的工具,可以协助您丰富大模型的数据提示。本文将用实例向您展示和介绍。 众所周知,...
-
理解GraphRAG(一):RAG的挑战
检索增强生成(RAG)是一种通过外部知识源增强现有大型语言模型(LLM)的方法,以提供和上下文更相关的答案。在RAG中,检索组件获取额外的信息,使响应基于特定来源,然后将这些信息输入到LLM提示中,以使LLM的响应基于这些信息(增强阶段)。与其他技术(例...
-
LLM和RAG技术的比较探索
作者 | Ashok Gorantla 整理 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能(AI)的动态环境中,两种开创性的技术——大型语言模型(LLM)和检索增强生成(RAG)——在理解和生成类人文本方面脱颖而出。本...
-
Nvidia GTC 24:你准备好迎接AI未来了吗?
2024 年 Nvidia GTC 大会涵盖了围绕 AI 时代的主题,这引出了以下总体问题:各行业组织的云和 IT 基础设施是否已为 AI 的未来做好准备? 在主题演讲中,Nvidia 首席执行官黄仁勋在加州圣何塞 SAP 中心向观众发表了两个小时的...
-
LinkedIn在利用大型语言模型服务十亿用户中的收获
LinkedIn 在全球拥有超过10亿用户,不断挑战当今企业技术的极限。很少有公司能够像LinkedIn那样运营,或者拥有类似的大量数据资源。 对这个专注于商业和就业的社交媒体平台来说,将合格的候选人与潜在雇主连接起来,帮助填补职位空缺是其核心业务。同...
-
Llama 3没能逼出GPT-5!OpenAI怒“卷”To B战场,新企业级 AI 功能重磅推出!
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) Meta 是本周当之无愧的AI巨星!刚刚推出的 Llama 3 凭借着强大的性能和开源生态的优势在 LLM 排行榜上迅速跃升。 按理说,Llama 3在开源的状态下做到了 GPT-...
-
RAG 2.0架构详解:构建端到端检索增强生成系统
关于检索增强生成(RAG)的文章已经有很多了,如果我们能创建出可训练的检索器,或者说整个RAG可以像微调大型语言模型(LLM)那样定制化的话,那肯定能够获得更好的结果。但是当前RAG的问题在于各个子模块之间并没有完全协调,就像一个缝合怪一样,虽然能够工作...
-
提高 RAG 应用准确度,时下流行的 Reranker 了解一下?
检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。 基本的 RAG 应用包括四个关键技术组成部分: Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量...
-
Anthropic Claude 3 Opus基础模型在Amazon Bedrock上正式可用
北京——2024年4月17日 亚马逊云科技宣布,在Amazon Bedrock上正式推出来自Anthropic的Claude 3 Opus模型,该模型是Claude 3家族中最智能的模型,在高度复杂的任务上表现卓越,并拥有惊人的流畅性和类似人类的理解能力...
-
开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单
能打得过GPT-4的开源模型出现了! 大模型竞技场最新战报: 1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。 图片 这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。 大模型竞...
-
Intel发布Gaudi 3 AI加速器:4倍性能提升、无惧1800亿参数大模型
快科技4月10日消息,美国当地时间4月9日,Intel举办了一场面向客户和合作伙伴的Intel Vision 2024产业创新大会,做出多项重磅宣布,包括全新的Gaudi 3 AI加速器,包括全新的至强6品牌,以及涵盖全新开放、可扩展系统,下一代产品和一系...
-
Cohere推出大模型Command R+ 优化高级检索增强生成功能
Cohere推出了专为企业级工作负载设计的大型语言模型Command R+,该模型优化了高级检索增强生成(RAG)功能,以减少错误生成,并支持10种关键语言的多语言覆盖。 公告地址:https://top.aibase.com/tool/command-...
-
Harvey公司与OpenAI合作 为法律专业人士打造定制训练的案例法模型
近日,Harvey公司与OpenAI宣布合作,共同为法律专业人士打造了一款定制训练的案例法模型。这款AI系统不仅具备复杂的推理能力,还能够处理广泛的法律领域知识,并具备超越单一模型调用的能力。 它能够起草法律文件、回答复杂的诉讼场景问题,甚至识别数百份合同...
-
Yuan2.0大模型,联合向量数据库和Llama-index,助力检索增强生成技术
1. 背景 在大模型爆发的时代,快速准确地从大量数据中检索出有价值的信息变得至关重要。检索增强生成(RAG)技术,结合了传统的信息检索和最新的大语言模型(LLM),不仅能够回答复杂的查询,还能在此基础上生成信息丰富的内容。 RAG技术的核心在于其能够将...
-
实施稳健的AI治理以实现数据民主化
根据Gartner的数据,到2026年,超过80%的企业将使用GenAI API和模型,或在生产中部署启用GenAI的应用程序,而去年这一比例不到5%。GenAI的自然语言界面允许非技术用户,从部门负责人到一线工作人员,更轻松地访问和使用数据。这...
-
一文读懂大型语言模型微调技术挑战与优化策略
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI 生态领域相关的技术 - LLM Fine-Tuning ,本文将继续聚焦在针对 LLM Fine-Tuning 技术进行剖析,使得大家能够了解 LLM Fine-Tuning...
-
llama_index 官方文档阅读笔记 (持续更新版)
llama 0.10.17🦙版本 阅读 链接: LlamaIndex 🦙 v0.10.17 LlamaIndex 是一个基于 LLM 的应用程序的数据框架,它受益于上下文增强。这种LLM系统被称为RAG系统,代表“检索-增强生成”。LlamaIndex...
-
大模型“路由器”OpenRouter 为LLM何其他AI模型提供统一接口
OpenRouter是一个创新性的项目,它为大语言模型(LLM)和其他AI模型提供了一个统一的接口。通过这个接口,用户可以直接访问和使用几十种AI模型,包括GPT、LLama、Claude、Command-R等80多个模型,未来还将扩展到数百种。 Open...
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为...
-
谷歌云数据库增加更多人工智能功能
谷歌云正在加强其分析和事务数据库,包括BigQuery, AlloyDB和Spanner,旨在推动其客户生成人工智能应用程序的开发。 BigQuery是谷歌云的顶级数据库,用于支持分析和人工智能工作负载,它开发了几项人工智能增强功能。首先,该公司推出了...
-
花旗高管表示:生成式AI在银行业具有变革性,但在客户支持方面存在风险
在花旗银行,生成式人工智能(Gen AI)已经在推动数据驱动决策方面取得了积极而深远的影响。花旗银行的首席分析技术与创新负责人Promiti Dutta表示,Gen AI的出现引起了银行内部的一场大变革,将数据和分析置于所有事务的前沿。 Dutta在VB的...
-
Cohere 与埃森哲合作加速企业 AI 应用
Cohere 很高兴宣布与 埃森哲合作,旨在将我们最先进的 Command 和 Embed 模型以及业界领先的检索增强生成(RAG)功能带给企业,助力企业跨部门推广生成式人工智能的应用。这两家公司将联手为企业提供由 Cohere 的旗舰专有生成 LLM 模...
-
倪光南院士探讨RAG技术、AI代理及AI伦理挑战
中国工程院院士倪光南在第二届北京人工智能产业创新发展大会上,分享了他对人工智能发展的看法和体会。 倪光南表示:由人工智能引领的新一轮科技革命和产业变革正在全球范围内蓬勃兴起。当前世界各国都在作出重大部署,将人工智能领域作为提升国家竞争的科创高地。不久前...
-
让GenAI提供更好答案的诀窍
GenAI作为一种界面提供了巨大的潜力,使用户能够以独特的方式查询你的数据,以接收针对他们的需求的答案,例如,作为查询助手,GenAI工具可以帮助客户使用简单的问答格式更好地导航广泛的产品知识库。 但在使用GenAI回答有关数据的问题之前,重要的是首先...
-
金融分析多模态LLM FinTral:基于Mistral-7B模型 得分接近GPT-4
近日,来自不列颠哥伦比亚大学和Invertible AI的研究人员推出了一款具有突破性的大型语言模型(LLM)——FinTral,专为金融领域量身定制。FinTral采用了多模态方法,能够处理文本、数字、表格和视觉数据,以应对金融文件的复杂性。该模型引入了...
-
掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台
通过我们的指南了解如何为您的企业释放人工智能的力量。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程。非常适合负责任地拥抱人工智能的企业。 为企业打造AI-Ready平台 企业在引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这...
-
企业数据在生成人工智能中的关键作用
大量基于GenAI的工具和应用涌入市场。其中一些应用非常聪明且富有创意,但它们大多是ChatGPT等应用背后的大型语言模型(LLM 的包装器。这并不是要贬低LLM的语言、概念和单词关系知识可以提供新的效率和生产力的数千种潜在场景。 但LLM和ChatGP...
-
GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况
众所周知,大型语言模型(LLM)的推理通常需要使用自回归采样,这个推理过程相当缓慢。为了解决这个问题,推测解码(Speculative Decoding)已经成为 LLM 推理的一种新型采样方法。这种方法在每个采样步骤中,会先预测几个可能的 token,...
-
Nomic AI 发布首个完全开源的长文本嵌入模型,超越 OpenAI Ada-002在各项基准测试中的表现
在自然语言处理(NLP)领域不断发展的背景下,理解和处理广泛的文本内容至关重要。最近的一些进展显著提升了语言模型的能力,特别是通过文本嵌入的发展。这些嵌入成为许多应用的基础,包括大型语言模型(LLMs 的检索增强生成和语义搜索。它们将句子或文档转换为低维向...
-
使用LlamaIndex和ChatGPT的无代码检索增强生成(RAG)
检索增强生成(RAG 是使用大型语言模型(LLM 的关键工具。RAG使LLM能够将外部文档合并到它们的响应中,从而更紧密地与用户需求保持一致。这个功能在传统上使用LLM犹豫不决的领域尤其有益,尤其是在事实很重要的时候。 自从ChatGPT和类似的LLM推...
-
揭开向量索引概念的神秘面纱
自从ChatGPT公开发布以来,人们几乎没有一天不讨论LLM(大型语言模型)、RAG(检索增强生成:Retrieval Augmented Generation)和向量数据库的新内容。技术世界充斥着LLM的可能性,LLM被视为将改变我们生活的最新技术:...
-
用通俗易懂的方式讲解:使用Llama-2、PgVector和LlamaIndex,构建大模型 RAG 全流程
近年来,大型语言模型(LLM)取得了显著的进步,然而大模型缺点之一是幻觉问题,即“一本正经的胡说八道”。其中RAG(Retrieval Augmented Generation,检索增强生成)是解决幻觉比较有效的方法。 本文,我们将深入研究使用trans...
-
AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 🤖📱💼AI应用 通义千问团队发布...
-
生成式AI公司Galileo推出检索增强生成工具
生成式AI公司Galileo最近推出了一项新的工具,旨在帮助企业开发可信赖的人工智能(AI)解决方案。这项名为检索增强生成(RAG 和代理分析的解决方案旨在应对RAG系统的复杂性,该系统已成为大型语言模型(LLMs 开发者越来越受欢迎的工具。 RAG系统通...
-
GPT-4/Gemini大翻车,做旅行攻略成功率≈0%!复旦OSU等华人团队:Agent不会复杂任务规划
AI智能体,是目前学界炙手可热的前沿话题,被众多专家视为大模型发展的下一个方向。 然而,最近复旦、俄亥俄州立大学、宾夕法尼亚州立大学、Meta AI的研究者们发现,AI智能体在现实世界的规划能力还很差。 他们对GPT-4 Turbo、Gemini Pro...
-
开源版GPTs人人免费用!Hugging Face发布定制个人助手,点两下轻松创建
去年,OpenAI发布GPTs之后,短短几个月,全网诞生了300万+个GPT。 而现在,「开源低配版」的GPTs来了! 最近,世界最大的开源社区Hugging Face推出了开源、可定制的AI 助手——Hugging Chat Assistants。 图...
-
AI「导师」进哈佛!7x24小时辅导CS课程,RAG或成AI教育最后一块拼图
去年,哈佛大学做了件大事。 他们在自己的CS50课程中引入了一整套AI工具,堪称学生个人的个性化「导师」。 一开始,这套工具服务的对象是70来个上暑校的学生。后来逐渐开放,数千名线上学生也得以拥有属于自己的学习导师。 到了秋季,AI工具又面向了几百位本校...
-
击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
一周前,OpenAI 给广大用户发放福利,在下场修复 GPT-4 变懒的问题后,还顺道上新了 5 个新模型,其中就包括更小且高效的 text-embedding-3-small 嵌入模型。 我们知道,嵌入是表示自然语言或代码等内容中概念的数字序列。嵌入使...
-
Prompt 驱动架构设计:探索复杂 AIGC 应用的设计之道?
你是否曾经想过,当你在 Intellij IDEA 中输入一个段代码时,GitHub 是如何给你返回相关的结果的?其实,这背后的秘密就是围绕 Prompt 生成而构建的架构设计。 Prompt 是一个输入的文本段落或短语,用于引导 AI...
-
AIGC内容分享(三):AIGC应用:基于RAG构建个人知识库
目录 前言 Collect (收集 收集是什么? Organize (组织 组织信息 Distill (提炼 提炼信息 Express (表达 表达见解 Finetune调优 调整输出内容 总结一下 前言 在信息爆炸的...
-
无需人工标注!LLM加持文本嵌入学习:轻松支持100种语言,适配数十万下游任务
文本嵌入(word embedding)是自然语言处理(NLP)领域发展的基础,可以将文本映射到语义空间中,并转换为稠密的矢量,已经被广泛应用于各种自然语言处理(NLP)任务中,如信息检索(IR)、问答、文本相似度计算、推荐系统等等, 比如在IR领域,第...
-
让知识图谱成为大模型的伴侣
大型语言模型(LLM 能够在短时间内生成非常流畅和连贯的文本,为人工智能的对话、创造性写作和其他广泛的应用开辟了新的可能性,然而,LLM也有着一些关键的局限性。它们的知识仅限于从训练数据中识别出的模式,这意味着缺乏对世界的真正理解。同时,推理能力也是有限...
-
GPT-4不偷懒了!OpenAI连甩五个大模型,价格最低打两折
OpenAI深夜更新!一口气连甩五个大模型: 新的GPT-4 Turbo预览模型 新的GPT-3.5 Turbo型号 新的文本审核模型 两种新文本嵌入模型 实打实地来了个加量又减价,甚至有模型直接来了个骨折价——降到了原来的五分之一。 开发者狂喜!...