-
CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做到了「敏捷而安全」。...
-
人工智能大时代——AIGC综述
生成式AI分类 模型按照输入输出的数据类型分类,目前主要包括9类。 有趣的是,在这些已发布大模型的背后,只有六个组织(OpenAI, Google, DeepMind, Meta, runway, Nvidia)参与部署了这些最先进的模型。...
-
详解“小而优”的大语言模型Zephyr 7B
Zephyr是Hugging Face发布的一系列大语言模型,使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练,显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码,以应对ChatGPT...
-
像人类一样在批评中学习成长,1317条评语让LLaMA2胜率飙升30倍
现有的大模型对齐方法包括基于示例的监督微调(SFT)和基于分数反馈的强化学习(RLHF)。然而,分数只能反应当前回复的好坏程度,并不能明确指出模型的不足之处。相较之下,我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数,还包...
-
【书籍】强化学习第二版(英文版电子版下载、github源码)-附copilot翻译的中英文目录...
Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载:http://incompleteideas.net/bo...
-
张晴晴:对话数据推动AIGC——大模型底层数据探索
“Training data is technology” . 数据即科技,OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球,一周前惊艳亮相的GPT-4更是...
-
LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比
12.10更新:Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理:数据频率和质量,使用聚类和去重方法,基于LSH和dense embedding方...
-
学习AIGC大模型必知的强化学习RL的核心代码示例,速进!!!
Look!?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??? 在人工智能的发展历程中,强化学习(RL)已成为推动技术突破的关键动力,尤其在自动化内容生成(AIGC)和大型语言模型(LLM)的领域中...
-
对比分析ChatGPT 和文心一言。
目录 ChatGPT 和文心一言哪个更好用? ChatGPT 文心一言 对人工智能的看法 ChatGPT 和文心一言哪个更好用? ChatGPT和文心一言是目前两种比较流行的大语言模型,他们的出现迎来了人工智能时代。那么,这两种语言哪...
-
AIGC内容分享(四十):生成式人工智能(AIGC)应用进展浅析
目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构 (1)数据层 (2)算力基础设施层 (3)算法及大模型层 (4)AI...
-
ChatGPT is not all you need,一文看尽SOTA生成式AI模型:6大公司9大类别21个模型全回顾(三)
文章目录 ChatGPT is not all you need,一文看尽SOTA生成式AI模型:6大公司9大类别21个模型全回顾(三) Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...
-
多模态LLM多到看不过来?先看这26个SOTA模型吧
当前 AI 领域的关注重心正从大型语言模型(LLM)向多模态转移,于是乎,让 LLM 具备多模态能力的多模态大型语言模型(MM-LLM)就成了一个备受关注的研究主题。 近日,腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...
-
【探索科技 感知未来】文心一言大模型
【探索科技 感知未来】文心大模型 ?本文介绍 文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型,其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力,可以理解并生成自然语言,为用户提供自然、流畅的语言交...
-
大家都在用的AI作画Python几行代码就可实现
一、通过openai实现的作品: 要想快速实现功能,咱们先了解一下OpenAI,OpenAI是一家人工智能公司,专注于开发强化学习、机器学习、自然语言处理等技术。OpenAI的主要目标是创造一套安全的人工智能系统,以帮助人们在各行各业中利用这项技术.接...
-
百川智能发布千亿参数大模型,中文能力超越GPT-4!
“追上ChatGPT水平,我觉得今年内可能就能够实现,但对于GPT-4或者GPT-5,我认为可能需要3年左右的时间,应该不会低于两年。”去年4月,百川智能创始人王小川当初曾这样判断自己入局大模型赛道后的进度。就在昨天,千亿参数规模的百川大模型终于来了!...
-
链世界:一种简单而有效的人类行为Agent模型强化学习框架
强化学习是一种机器学习的方法,它通过让智能体(Agent)与环境交互,从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用,例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为,帮助人类实现他们的长期目标,例如戒烟、减...
-
PAI-ChatLearn :灵活易用、大规模 RLHF 高效训练框架(阿里云最新实践)
PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的,灵活易用、大规模模型 RLHF 高效训练框架,支持大模型进行 SFT(有监督指令微调)、RM(奖励模型)、RLHF(基于人类反馈的强化学习)完整训练流程。PAI-ChatLear...
-
2024年1月17日Arxiv最热论文推荐:清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作
本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。 论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台(saibomaliang.com)上的智能体 「AI论文解读达人」 提供。 如需查看其他热门论文,欢迎移步 ...
-
CMU华人18万打造高能机器人,完爆斯坦福炒虾机器人!全自主操作,1小时学会开12种门
比斯坦福炒虾机器人还厉害的机器人来了! 最近,CMU的研究者只花费2.5万美元,就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。 论文地址:https://arxiv.org/abs/2401.14403 厉害之处就在于,它是完全自主完成操作...
-
百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和...
-
大模型开山鼻祖!InstructGPT发布两周年了
今天是InstructGPT发布两周年的纪念日,它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片,我也顺...
-
LLM巫师,代码预训练是魔杖!UIUC华人团队揭秘代码数据三大好处
大模型时代的语言模型(LLM)不仅在尺寸上变得更大了,而且训练数据也同时包含了自然语言和形式语言(代码)。 作为人类和计算机之间的媒介,代码可以将高级目标转换为可执行的中间步骤,具有语法标准、逻辑一致、抽象和模块化的特点。 最近,来自伊利诺伊大学香槟分校...
-
Llama 2: Open Foundation and Fine-Tuned Chat Models
文章目录 TL;DR Introduction 背景 本文方案 实现方式 预训练 预训练数据 训练细节 训练硬件支持 预训练碳足迹 微调 SFT SFT 训练细节 RLHF 人类偏好数据收集 奖励模型 迭代式微调(RLHF) 拒...
-
强化学习和世界模型中的因果推断
一、世界模型 “世界模型”源于认知科学,在认知科学里面有一个等价的词汇 mental models,也就是心智模型。那么什么是心智模型?在认知科学里有一个假设,认为人在大脑内部会有一个对于真实外在世界的表征,它对于认知这个世界,特别是推理和决策有很关...
-
全世界机器人共用一个大脑,谷歌DeepMind已经完成了第一步
过去一年,生成式人工智能发展的核心关键词,就是「大」。 人们逐渐接受了强化学习先驱 Rich Sutton 充分利用算力「大力出奇迹」的思潮,庞大的数据量是 AI 模型展现出惊人智慧的核心原因。数据规模越大、质量越高、标注越细,模型就能了解到更全面的世界...
-
马作的卢飞快!上海AI Lab发布首个模仿人类学习范式的自动驾驶决策框架DiLu
本文经自动驾驶之心公众号授权转载,转载请联系出处。 DiLu(的卢)是首个基于AI Agent范式的知识驱动自动驾驶框架,其结合了常识知识和大语言模型,通过记忆模块以实现闭环自动驾驶决策制定并拥有持续进化的能力。通过不断对环境的交互积累经验,自我反思纠...
-
多智能体系统的合作之道:对MAS不确定性、社会机制与强化学习的探索
多智能体系统(MAS)是由多个自主智能体组成的系统,它们可以相互交互和协作,以完成一些共同或个人的目标。多智能体系统在许多领域都有广泛的应用,如机器人、交通、电力、社交网络等。但是如何促进智能体之间的合作行为一直是这一领域的难题,特别是在激励机制不确定的...
-
人工智能数学基础 - 线性代数之矩阵篇
本文将从矩阵的本质、矩阵的原理、矩阵的应用三个方面,带您一文搞懂人工智能数学基础-线性代数之矩阵。 一、矩阵的本质 点积(Dot Product):点积作为向量间的一种基本运算,通过对应元素相乘后求和来刻画两向量的相似度和方向关系。 点积(Dot Pr...
-
使用SPIN技术对LLM进行自我博弈微调训练
2024年是大型语言模型(llm 的快速发展的一年,对于大语言模型的训练一个重要的方法是对齐方法,它包括使用人类样本的监督微调(SFT 和依赖人类偏好的人类反馈强化学习(RLHF 。这些方法在llm中发挥了至关重要的作用,但是对齐方法对人工注释数据有的大...
-
清华、小米、华为、 vivo、理想等多机构联合综述,首提个人LLM智能体、划分5级智能水平
嘿 Siri、你好小娜、小爱同学、小艺小艺、OK Google、小布小布…… 想必这些唤醒词中至少有一个曾被你的嘴发出并成功呼唤出了一个能给你导航、讲笑话、添加日程、设置闹钟、拨打电话的智能个人助理(IPA)。可以说 IPA 已经成了现代智能手机不可或缺...
-
AIGC的初识
?欢迎来到自然语言处理的世界 ?博客主页:卿云阁 ?欢迎关注?点赞?收藏⭐️留言? ?本文由卿云阁原创! ?首发时间:?2023年12月26日? ✉️希望可以和大家一起完成进阶之路! ?作者水平很有限,如果发现错误,请留言轰炸哦!万分...
-
网络安全人士必知的AI专业术语
随着人工智能的迅猛发展,我们正置身于第四次工业革命的浪潮中。在这个数字化的时代,网络安全成为各行业至关重要的议题。作为网络安全从业人员,不仅需要熟练掌握传统安全领域的知识,更需要深刻理解和运用人工智能,以在风云变幻的网络战场中保护信息资产。人工智能不仅为...
-
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文,提出关于“Sleeper Agen...
-
人工智能如何应用于机器人?
由于人工智能(AI ,机器人现在可以自己学习、适应和做出决策,而不需要人类或预先编程的指令。已启用AI的机器人配备了算法,使其能够分析和了解来自其环境的数据,并采取适当的行动。这些算法可能被认为类似于人类大脑,其从感官上解释信息,寻找模式,并产生结果。...
-
一文了解AIGC与ChatGPT
关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...
-
一张图500元是目前AIGC最高“回报”?小冰李笛:调用API的商业模式不适用于未来 | MEET 2024...
编辑部 发自 凹非寺量子位 | 公众号 QbitAI AIGC在商业界中,最大的一笔回报是多少? 答案可能是:一张图片,500元。 而且这就是发生在最近、号称人工智能著作权第一案的真实案例: A利用人工智能技术生成了一张图片,...
-
AIGC内容分享(三十):推荐四本人工智能和AIGC相关的书籍
目录 《AI创意》 《人工智能创意》 《人工智能革命》 《AI生成内容》 《AI创意》 一. 近年来,随着人工智能技术的快速发展,越来越多的人开始关注AI在创意领域的应用,也就是所谓的“AIGC”(Artificial Intellige...
-
大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。 最近,来自 Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。 在新方法中,作者...
-
AIGC、ChatGPT、GPT系列?我的认识
AIGC(AI generated content),新型内容生产方式。AIGC是利用人工智能技术来生成内容,也就是,它可以用输入数据生成相同或不同类型的内容,比如输入文字、生成文字,输入文字、生成图像等。 GPT-3是生成型的预训练变换模型,是...
-
大型语言模型中最大的瓶颈:速率限制
作者 | Matt Asay策划 | 言征 速率限制意味着每个人都在等待更好的计算资源或不同的生成人工智能模型。 大型语言模型(LLM),如OpenAI的GPT-4和Anthropic的Claude 2,凭借其生成类人文本的能力,吸引了公众的想象力。...
-
游戏+人工智能AI如何影响我们的未来:(二)游戏将成为 AIGC 的重要应用场
人工智能在诞生之初就已展现出了与电子游戏的亲密关系。—方面,其开创者们长期利用游戏 来测试人工智能程序的性能,如今的人工智能也已经具备了在各种复杂游戏中击败人类玩家的 能力。另—方面,随着人工智能技术的发展,人们也发现可以利用这项技术来辅助游戏设计 和游戏...
-
免费商用 Meta 发布开源大语言模型 Llama 2
Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。 Llama 2 论文地址:Llama 2: Open Foundation and Fine-Tuned Chat Models 据介...
-
自动泊车全面调研!汇集行业标准趋势、评测指标、系统介绍各个方面!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 自动泊车系统是指在没有人工干预的情况下,车辆本身可以自主的实现停车位的寻找并完成准确的泊车,同时该系统也可以根据用户的需求准确移动到用户指定的位置上。如果自动泊车技术成熟后,可以极大缓解人们...
-
基于大语言模型赋能智体的建模和仿真:综述和展望
本文经自动驾驶之心公众号授权转载,转载请联系出处。 23年12月论文“Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspecti...
-
大模型“藏毒”:“后门”触发,猝不及防!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 跟大模型会产生幻觉相比,更可怕的事情来了,最新的一项研究证明:在用户不知情的情况下,最初觉得很得力的大模型助手,将化身“间谍”,产生破坏性代码。 具体来讲,一组研究人员对LL...
-
使用 DPO 微调 Llama 2
简介 基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback,RLHF 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步,它可以确保语言模型的输出符合人类在闲聊或安全...
-
腾讯最新AI工具PhotoMaker:上传图片即可生成多样化风格个人照片
腾讯最新推出的AI照片生成工具PhotoMaker引发了不少关注,该应用利用强化学习(RL)技术,只要上传照片就可以生成多种风格的个人照片,无需进行额外的LoRA训练,用户可以迅速进行定制。 PhotoMaker还具有多样的功能,包括混合不同人物特征生成全...
-
张钹院士:生成式人工智能的三大能力与一大缺点
网易科技1月16日报道,在智谱AI技术开放日,中国科学院院士、清华大学教授张钹针对《从大语言模型到通用人工智能》话题发表演讲,针对生成式人工智能的现状和未来发表见解。 张钹院士认为,如果我们不能创造它,就不可能理解它,我们之所以发展生成式人工智能,重要...
-
广义人工智能时代:通往通用人工智能(AGI)之路
人工智能(AI 将于2024年进一步改进,大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年,特别是那些采用大型语言模型(LLM 架构的人工智能,比如来自开放人工智能(GPT 4 、Anthropic(Claud...
-
史上超全自动驾驶岗位介绍
本文经自动驾驶之心公众号授权转载,转载请联系出处。 1.背景 近日分享如何高新转型到自动驾驶领域时,几位朋友不约而同的问到了我同一个问题:“L2~L4自动驾驶的岗位都有哪些?对应着具体的什么 工作内容?需要哪方面的技能?”今天就针对这个大家都很想了解的...