强化学习第5页 - AIGC资讯

十年内出现AGI？下一代Gemini能感知环境？DeepMind CEO哈萨比斯畅谈AI

「如果我们在未来十年内拥有类似 AGI 的系统，我不会感到惊讶。」Google DeepMind 联合创始人和 CEO Demis Hassabis 近日在人工智能播客节目 Dwarkesh Podcast 上如是说。在长达一个小时的节目中，Hassa...

人工智能 2024-03-05 人工智能

925阅读

大视频模型是世界模型？DeepMind/UC伯克利华人一作：预测下一帧就能改变世界

没人怀疑，OpenAI开年推出的史诗巨作Sora，将改变视频相关领域的内容生态。但Google DeepMind、UC伯克利和MIT的研究人员更进一步，在他们眼里，「大视频模型」也许能够像世界模型一样，真正的做到理解我们身处的这个世界。论文地址：h...

生成式AI 2024-03-05 人工智能

912阅读

Think2Drive：首个用于自动驾驶的基于模型的RL方法（上海交大）

本文经自动驾驶之心公众号授权转载，转载请联系出处。在CARLA v2中以专家级的熟练程度运行。题目：Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World...

人工智能 2024-02-29 人工智能

940阅读

LLaMa 3或将推迟到7月发布，剑指GPT-4，从Gemini吸取教训

过去的图像生成模型常被人们诟病人物主要以「白人」为主，而谷歌 Gemini 正在因为它的矫枉过正而深陷翻车风波。它「过度谨慎」的文生图结果会与历史事实出现极大偏差，让用户们瞠目结舌。谷歌表示，该模型变得比开发者预期的更加谨慎。这不仅体现在生成图片的问题上...

AIGC 2024-02-29 人工智能

767阅读

研究人员开发AI攻击方法BEAST：可在一分钟内绕过LLM防护栏

研究人员在美国马里兰大学成功开发了一种高效的方法，可以在一分钟内诱导大型语言模型（LLM）产生有害反应，他们将这一技术命名为BEAST(BEAm Search-based adversarial aTtack 。BEAST技术利用Nvidia RTX A6...

AIGC 2024-02-29 人工智能

977阅读

与人类贴身热舞！人形机器人进阶到街头耍宝，6华人组团出品

注意看，小帅一个转身，卫衣帽子里面居然空无一头：好啦，这不是惊悚恐怖片，而是来自UCSD（加州大学圣地亚哥分校）全华人团队的最新研究成果。他们提出一种特别的全身控制策略（ExBody），能对人形机器人进行全身控制。策略主要训练人形机器人上半...

生成式AI 2024-02-28 人工智能

811阅读

近屿智能发布AIGC大模型工程师和产品经理学习路径图

近日，上海近屿智能科技有限公司（下称“近屿智能”），基于其在大模型研发和产品设计领域深厚的专业积累，终于总结出AIGC大模型工程师与产品经理的学习路线图。该学习路线图不仅为追求专业发展的学习者提供了一条清晰明确的AIGC大模型学习路径，更为整个AIGC大模...

生成式AI 2024-02-28 人工智能

919阅读

南大俞扬深度解读：什么是「世界模型」？

随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是「world simulator」，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是world simulator。什么是world...

大数据 2024-02-27 人工智能

850阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人...

AIGC 2024-02-27 人工智能

876阅读

可控核聚变新里程碑！AI成功预测等离子体撕裂登Nature，清洁能源「圣杯」更近一步

可控核聚变，又有新突破了！长期以来，核聚变一直受着一个「幽灵」的困扰——等离子体不稳定性问题。而最近，普林斯顿团队用AI提前300毫秒预测了核聚变等离子不稳定态，这个时间，就足够约束磁场调整应对等离子体的逃逸！从此，科学家可以防止可控核聚变的中断，...

人工智能 2024-02-26 人工智能

860阅读

【EMNLP 2023】面向Stable Diffusion的自动Prompt工程算法

近日，阿里云人工智能平台PAI与华南理工大学朱金辉教授团队合作在自然语言处理顶级会议EMNLP2023上发表了BeautifulPrompt的深度生成模型，可以从简单的图片描述中生成高质量的提示词，从而使文生图模型能够生成更美观的图像。BeautifulP...

大数据 2024-02-26 人工智能

898阅读

AIGC从入门到入坑01（初学者适用版）

AIGC从入门到入坑系列文章 AIGC系列第一章--简述 AIGC从入门到入坑系列文章前言学习路径 AI时间线人工智能简史 AI绘画简史 AI名词解释小白从0-1必看5篇资料初学者进阶必读8篇资料总结前...

人工智能 2024-02-23 人工智能

1268阅读

Sora创建病毒式视频全网疯转，OpenAI密谋推出TikTok竞品？专家猜测：这是计划的一部分

OpenAI，到底想用TikTok做什么？最近，大家都被TikTok上这堆Sora的视频闪到了。 AI视频，已经天衣无缝地混入了人类世界。如果不特意说明，很难拿看出AI视频和真实视频的区别！图片才入驻TikTok几天，OpenAI的账号就已经涨粉...

大数据 2024-02-23 人工智能

814阅读

Llama 2论文详解

摘要 Llama 2是一组经过预训练和微调的大语言模型，参数规模从70亿到700亿不等，其中，Llama 2-Chat是针对对话用例进行优化的微调模型。在大多数基准测试中优于开源chat模型，在人类评估中表现出色，特别是在有用性和安全性方面。因此，Lla...

AIGC 2024-02-23 人工智能

920阅读

全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，重燃开源之战

一声炸雷深夜炸响，谷歌居然也开源LLM了？！这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。而且更令人印象深刻的是，还...

生成式AI 2024-02-22 人工智能

848阅读

爆火Sora的背后 | 聊聊什么是world models！

本文经自动驾驶之心公众号授权转载，转载请联系出处。随着媒体狂炒Sora，OpenAI的介绍材料中称Sora是 “world simulator”，世界模型这个词又进入视野，但很少有文章来介绍世界模型。这里回顾一下什么是世界模型，以及讨论Sora是不是...

AIGC 2024-02-22 人工智能

894阅读

OpenAI员工自曝996作息表，网友：真正的卷不需要强迫

OpenAI也996，实锤了（doge）。思维链作者、从谷歌跳槽OpenAI的Jason Wei刚刚分享了自己在OpenAI的一天： [9:00am] 起床[9:30am] 搭乘Waymo前往Mission SF，途中在Tartine买个牛油果吐司[9...

AIGC 2024-02-21 人工智能

807阅读

20分钟学会装配电路板！开源SERL框架精密操控成功率100%，速度三倍于人类

近年来，机器人强化学习技术领域取得显著的进展，例如四足行走，抓取，灵巧操控等，但大多数局限于实验室展示阶段。将机器人强化学习技术广泛应用到实际生产环境仍面临众多挑战，这在一定程度上限制了其在真实场景的应用范围。强化学习技术在实际应用的过程中，任需克服包括...

人工智能 2024-02-21 人工智能

827阅读

英伟达NeMo框架在AI领域的综合应用与优势总结

一、NeMo 框架介绍 NVIDIA NeMo 是基于 PyTorch 和 PyTorch Lightning 的一个开源训练框架，源代码完全公开在 GitHub 上。NeMo 的主要目标是使 AI 开发者能够快速构建对话式 AI 模型并开发相关应用。...

人工智能 2024-02-21 人工智能

1010阅读

100万token，一次能分析1小时YouTube视频，「大世界模型」火了

最近几天，我们接连被谷歌的多模态模型 Gemini 1.5 以及 OpenAI 的视频生成模型 Sora 所震撼到，前者可以处理的上下文窗口达百万级别，而后者生成的视频能够理解运动中的物理世界，被很多人称为「世界模型」。然而，这些刷屏无数的模型真的能很好...

大数据 2024-02-20 人工智能

769阅读

AI自动化标注崛起，数据标注员要失业了？

在数据标注行业流行着一句话：“有多少智能，就有多少人工”。由于需要标注的数据规模庞大且成本较高，一些互联网巨头及一些AI公司很少自己设有标注团队，大多交给第三方数据服务公司或者数据标注团队来做。这也衍生出了专为AI而生的人力密集型的数据标注产业链。...

人工智能 2024-02-19 人工智能

1086阅读

AIGC内容分享(三十四)：AIGC+信息流广告

目录 AIGC发展概览 AIGC发展的重要里程碑事件媒体平台AIGC功能媒体平台AIGC功能-广点通媒体平台AIGC功能 AIGC在广告各场景应用 AIGC在广告各场景应用—文生文 AIGC在广告各场景应用—文生图视频生成...

人工智能 2024-02-13 人工智能

1312阅读

羊驼2:开放的基础和微调聊天模型--Llama 2论文阅读

论文地址：https://arxiv.org/pdf/2307.09288.pdfd 代码地址：GitHub - facebookresearch/llama-recipes: Examples and recipes for Llama 2 model...

大数据 2024-02-10 人工智能

1714阅读

无需RLHF显著提升GPT-4/Llama2性能，北大团队提出Aligner对齐新范式

背景大语言模型（LLMs）虽展现出了强大的能力，但也可能产生不可预测和有害的输出，例如冒犯性回应、虚假信息和泄露隐私数据，给用户和社会造成伤害。确保这些模型的行为与人类意图和价值观相对齐，是一个紧迫的挑战。尽管基于人类反馈的强化学习（RLHF）提供了...

AIGC 2024-02-07 人工智能

914阅读

7B开源数学模型干翻千亿GPT-4，中国团队出品

7B开源模型，数学能力超过了千亿规模的GPT-4！它的表现可谓是突破了开源模型的极限，连阿里通义的研究员也感叹缩放定律是不是失效了。无需借助任何外部工具，它就能在竞赛水平的MATH数据集上达到51.7%的准确率。在开源模型中，它第一个在该数据集上...

人工智能 2024-02-07 人工智能

945阅读

近屿智能引领行业前沿，精心打造AIGC大模型工程师和产品经理的进阶之路（附完整版学习路径图）

近屿智能，倾力打造了一套独特的AIGC大模型工程师和产品经理学习路径图。该路径图清晰地展示了从初学者到专家水平的技能进阶过程，为工程师和产品经理提供了明确的学习目标和成长路径。这套学习路径图适用于不同背景和经验的学习者，无论您是初涉AIGC领域的新...

AIGC 2024-02-07 人工智能

1325阅读

PokéLLMon官网体验入口 AI智能代理战术游戏工具软件免费使用地址

PokéLLMon是首个在战术战斗游戏中实现人类水平性能的LLM体现代理。它融合了三种关键策略：1）基于上下文的强化学习，即时利用从战斗中提取的文本描述反馈，迭代地优化其生成策略；2）知识增强生成，利用外部知识对抗幻觉，使代理能够及时和正确地行动；3）具有...

AIGC 2024-02-07 人工智能

834阅读

MedicalGPT：基于LLaMA-13B的中英医疗问答模型（LoRA）、实现包括二次预训练、有监督微调、奖励建模、强化学习训练[LLM:含Ziya-LLaMA]。

项目设计集合（人工智能方向）：助力新人快速实战掌握技能、自主完成项目设计升级，提升自身的硬实力（不仅限NLP、知识图谱、计算机视觉等领域）：汇总有意义的项目设计集合，助力新人快速实战掌握技能，助力用户更好利用 CSDN 平台，自主完成项目设计升级，提升自身...

生成式AI 2024-02-06 人工智能

1037阅读

2023-12-12 AIGC-AI工具的基本工作原理

摘要: 2023-12-12 AIGC-AI工具的基本工作原理 AI工具的基本工作原理 AI工具的基本工作原理涉及到一系列复杂的技术和算法。这些原理可以根据不同类型的AI工具进行概括，包括机器学习、自然语言处理、图像识别等。以下是一些关键的A...

AIGC 2024-02-06 人工智能

1264阅读

CMU&ETH实现突破：机器狗点满敏捷值天赋，超高速穿越障碍，速度与安全兼备！

在高速机器人运动领域，实现同时兼顾速度和安全一直是一大挑战。但现在，卡内基梅隆大学（CMU）和苏黎世联邦理工学院（ETH）的研究团队带来了突破性进展。他们开发的新型四足机器人算法，不仅能在复杂环境中高速行进，还能巧妙避开障碍，真正做到了「敏捷而安全」。...

生成式AI 2024-02-05 人工智能

958阅读

人工智能大时代——AIGC综述

生成式AI分类模型按照输入输出的数据类型分类，目前主要包括9类。有趣的是，在这些已发布大模型的背后，只有六个组织（OpenAI, Google, DeepMind, Meta, runway, Nvidia）参与部署了这些最先进的模型。...

生成式AI 2024-02-04 人工智能

1057阅读

详解“小而优”的大语言模型Zephyr 7B

Zephyr是Hugging Face发布的一系列大语言模型，使用蒸馏监督微调(dSFT 在更庞大的模型上进行训练，显著提高了任务准确性。 2023年是属于大语言模型(LLM 和开源的一年。许多初创公司和企业开放了模型和权重的源代码，以应对ChatGPT...

人工智能 2024-02-04 人工智能

920阅读

像人类一样在批评中学习成长，1317条评语让LLaMA2胜率飙升30倍

现有的大模型对齐方法包括基于示例的监督微调（SFT）和基于分数反馈的强化学习（RLHF）。然而，分数只能反应当前回复的好坏程度，并不能明确指出模型的不足之处。相较之下，我们人类通常是从语言反馈中学习并调整自己的行为模式。就像审稿意见不仅仅是一个分数，还包...

人工智能 2024-02-04 人工智能

970阅读

【书籍】强化学习第二版（英文版电子版下载、github源码）-附copilot翻译的中英文目录...

Python代码：https://github.com/ShangtongZhang/reinforcement-learning-an-introduction 英文原版书籍下载：http://incompleteideas.net/bo...

大数据 2024-02-03 人工智能

1308阅读

张晴晴：对话数据推动AIGC——大模型底层数据探索

“Training data is technology” . 数据即科技，OpenAI的联合创始人IlyaSutskever在与知名科技媒体The Verge访谈中提到。ChatGPT自发布以来热度席卷全球，一周前惊艳亮相的GPT-4更是...

人工智能 2024-02-03 人工智能

984阅读

LLaMA、Baichuan、ChatGLM、Qwen、天工等大模型对比

12.10更新：Qwen技术报告核心解读 Baichuan Baichuan 2: Open Large-scale Language Models 数据处理：数据频率和质量，使用聚类和去重方法，基于LSH和dense embedding方...

大数据 2024-02-03 人工智能

1987阅读

学习AIGC大模型必知的强化学习RL的核心代码示例，速进！！！

Look！?我们的大模型商业化落地产品 ?更多AI资讯请??关注 Free三天集训营助教在线为您火热答疑??‍? 在人工智能的发展历程中，强化学习（RL）已成为推动技术突破的关键动力，尤其在自动化内容生成（AIGC）和大型语言模型（LLM）的领域中...

大数据 2024-02-01 人工智能

1175阅读

对比分析ChatGPT 和文心一言。

目录 ChatGPT 和文心一言哪个更好用？ ChatGPT 文心一言对人工智能的看法 ChatGPT 和文心一言哪个更好用？ ChatGPT和文心一言是目前两种比较流行的大语言模型，他们的出现迎来了人工智能时代。那么，这两种语言哪...

人工智能 2024-02-01 人工智能

987阅读

AIGC内容分享(四十)：生成式人工智能（AIGC）应用进展浅析

目录 0 引言 1 以ChatGPT为代表的AIGC发展现状 1.1 国外AIGC应用发展现状 1.2 国内AIGC应用发展现状 2 AIGC的技术架构（1）数据层（2）算力基础设施层（3）算法及大模型层（4）AI...

人工智能 2024-02-01 人工智能

1560阅读

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录 ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三） Text-to-Text 模型 ChatGPT LaMDA PEER Meta AI Speech f...

生成式AI 2024-01-31 人工智能

975阅读

多模态LLM多到看不过来？先看这26个SOTA模型吧

当前 AI 领域的关注重心正从大型语言模型（LLM）向多模态转移，于是乎，让 LLM 具备多模态能力的多模态大型语言模型（MM-LLM）就成了一个备受关注的研究主题。近日，腾讯 AI Lab、京都大学和穆罕默德・本・扎耶德人工智能大学的一个研究团队发布...

生成式AI 2024-01-31 人工智能

840阅读

【探索科技感知未来】文心一言大模型

【探索科技感知未来】文心大模型 ?本文介绍文心一言大模型是由中国科技巨头百度公司研发的一款大规模语言模型，其基于先进的深度学习技术和海量数据训练而成。这款大模型具备强大的自然语言处理能力，可以理解并生成自然语言，为用户提供自然、流畅的语言交...

大数据 2024-01-31 人工智能

1373阅读

大家都在用的AI作画Python几行代码就可实现

一、通过openai实现的作品：要想快速实现功能，咱们先了解一下OpenAI,OpenAI是一家人工智能公司，专注于开发强化学习、机器学习、自然语言处理等技术。OpenAI的主要目标是创造一套安全的人工智能系统，以帮助人们在各行各业中利用这项技术.接...

AIGC 2024-01-31 人工智能

1328阅读

百川智能发布千亿参数大模型，中文能力超越GPT-4！

“追上ChatGPT水平，我觉得今年内可能就能够实现，但对于GPT-4或者GPT-5，我认为可能需要3年左右的时间，应该不会低于两年。”去年4月，百川智能创始人王小川当初曾这样判断自己入局大模型赛道后的进度。就在昨天，千亿参数规模的百川大模型终于来了！...

AIGC 2024-01-30 人工智能

933阅读

链世界：一种简单而有效的人类行为Agent模型强化学习框架

强化学习是一种机器学习的方法，它通过让智能体（Agent）与环境交互，从而学习如何选择最优的行动来最大化累积的奖励。强化学习在许多领域都有广泛的应用，例如游戏、机器人、自动驾驶等。强化学习也可以用于干预人类的行为，帮助人类实现他们的长期目标，例如戒烟、减...

AIGC 2024-01-30 人工智能

969阅读

PAI-ChatLearn ：灵活易用、大规模 RLHF 高效训练框架（阿里云最新实践）

PAI-ChatLearn 是阿里云机器学习平台 PAI 团队自主研发的，灵活易用、大规模模型 RLHF 高效训练框架，支持大模型进行 SFT（有监督指令微调）、RM（奖励模型）、RLHF（基于人类反馈的强化学习）完整训练流程。PAI-ChatLear...

人工智能 2024-01-30 人工智能

1352阅读

2024年1月17日Arxiv最热论文推荐：清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台（saibomaliang.com）上的智能体「AI论文解读达人」提供。如需查看其他热门论文，欢迎移步 ...

AIGC 2024-01-29 人工智能

1268阅读

CMU华人18万打造高能机器人，完爆斯坦福炒虾机器人！全自主操作，1小时学会开12种门

比斯坦福炒虾机器人还厉害的机器人来了！最近，CMU的研究者只花费2.5万美元，就打造出一个在开放世界中可以自适应移动操作铰接对象的机器人。论文地址：https://arxiv.org/abs/2401.14403 厉害之处就在于，它是完全自主完成操作...

大数据 2024-01-29 人工智能

929阅读

百川智能发布大模型Baichuan3 称中文评测超越GPT-4

百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估，如CMMLU、GAOKAO和AGI-Eval等，都展示了卓越的表现，特别是在中文任务上更是超过了GPT- 4 的水平。同时，该模型在数学和...

AIGC 2024-01-29 人工智能

842阅读

大模型开山鼻祖！InstructGPT发布两周年了

今天是InstructGPT发布两周年的纪念日，它是现代大语言模型的开山鼻祖。Jim Fan介绍了InstructGPT的重要性并且说了几条关于InstructGPT非常有意思的点。还展示了InstructGPT中非常经典的三步LLM训练方法的图片，我也顺...

生成式AI 2024-01-29 人工智能

899阅读