llms 第6页 - AIGC资讯

十分钟读完「降低 LLaMA 模型微调内存占用的QLoRA」论文

QLoRA 提出内存高效的微调方法！降低 LLaMA 模型微调内存占用，仅需数小时追赶 ChatGPT 引言：大模型微调的新时代随着人工智能技术的飞速发展，大型语言模型（Large Language Models，LLMs）已成为自然语言处理领域的重...

大数据 2024-02-02 人工智能

1549阅读

GPT-4无法造出生物武器！OpenAI最新实验证明：大模型杀伤力几乎为0

GPT-4会加速生物武器的发展吗？在担心AI统治世界之前，人类是否会因为打开了潘多拉魔盒而面临新的威胁？毕竟，大模型输出各种不良信息的案例不在少数。今天，处在风口，也是浪尖的OpenAI再次负责任地刷了一波热度。图片我们正在建立一个能够协助制造生...

AIGC 2024-02-01 人工智能

956阅读

【网安AIGC专题10.19】论文6（顶会ISSTA 2023）：提出新Java漏洞自动修复数据集：数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

How Effective Are Neural Networks for Fixing Security Vulnerabilities 写在最前面摘要贡献发现介绍背景：漏洞修复需求和Java漏洞修复方向动机方法贡献...

AIGC 2024-02-01 人工智能

1274阅读

技术融合下的虚拟角色创建与实践

作者 | 崔皓审校 | 重楼摘要文章详细介绍了百川大模型在创建个性化虚拟角色方面的创新技术和应用。这项技术结合了LangChain和Qianfan微调的Llama2-Chinese大模型，提供了高度个性化的角色定制功能。作者通过实际体验和技术模...

大数据 2024-02-01 人工智能

1280阅读

准确率不足20%，GPT-4V/Gemini竟看不懂漫画！首个图像序列基准测试开源

OpenAI的GPT-4V和谷歌最新的Gemini多模态大语言模型一经推出就得到业界和学界的热切关注: 一系列工作都从多角度展示了这些多模态大语言模型对视频的理解能力。人们似乎相信我们离通用人工智能artificial general intellige...

大数据 2024-01-30 人工智能

902阅读

Semron筹集790万美元，用于移动设备的3D封装AI芯片、效率提升20倍

德国公司Semron最近成功融资了790万美元（730万欧元），旨在通过先进的3D封装技术推动移动设备上的AI芯片效率提升。总部位于德累斯顿的Semron表示，他们的目标是在移动设备上设立新的AI芯片标准，以满足行业不断发展的需求。图源备注：图片由AI...

人工智能 2024-01-30 人工智能

960阅读

2024年1月17日Arxiv最热论文推荐：清华提出多模态知识检索新框架、MIT新方法大幅提升LLMs的连贯性、浙大新模型助力视频任务新突破、Meta 革新搜索技术、Google革新AI写作

本文整理了今日发表在ArXiv上的AI论文中最热门的TOP5。论文解读、论文热度排序、论文标签、中文标题、推荐理由和论文摘要均由赛博马良平台（saibomaliang.com）上的智能体「AI论文解读达人」提供。如需查看其他热门论文，欢迎移步 ...

AIGC 2024-01-29 人工智能

1272阅读

LLM巫师，代码预训练是魔杖！UIUC华人团队揭秘代码数据三大好处

大模型时代的语言模型（LLM）不仅在尺寸上变得更大了，而且训练数据也同时包含了自然语言和形式语言（代码）。作为人类和计算机之间的媒介，代码可以将高级目标转换为可执行的中间步骤，具有语法标准、逻辑一致、抽象和模块化的特点。最近，来自伊利诺伊大学香槟分校...

大数据 2024-01-29 人工智能

965阅读

高效底座模型LLaMA

论文标题：LLaMA: Open and Efficient Foundation Language Models 论文链接：https://arxiv.org/abs/2302.13971 论文来源：Meta AI 一、概述大型语...

人工智能 2024-01-27 人工智能

889阅读

Midjourney V6更新解读与侵权风险警告；AI Agent智能体创业必读；高清图解Mixtral和MoE；2023年度AI设计实践报告 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? Midjourney V6 文生图细节爆炸，但是被扒叠图电影画面？左图提示词：a full body editorial santa ho...

人工智能 2024-01-27 人工智能

1278阅读

18LLM4SE革命性技术揭秘：大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报综述

Large Language Models for Software Engineering: A Systematic Literature Review 写在最前面论文名片课堂讨论 RQ1部分：LLMs的选择和优化 RQ2部分：LLM...

人工智能 2024-01-27 人工智能

1230阅读

人工智能AI大战：BARD、ChatGPT、Bing和文心一言谁更具有优势？

首先在开始对比之前我首先要吐槽，不管是bard还是百度的AI现在都得等待候补，也就是排队，所以目前只能无限期等待下去，但是第一批用户已经在查通过平台上遨游了好几个月了，从商业的角度来看，几个月或许不长，但是足以失去了超过80%的用户，所以chatgpt目前...

生成式AI 2024-01-27 人工智能

1044阅读

大模型×文本水印：清华、港中文、港科广、UIC、北邮联合发布首个大模型时代下的文本水印综述

论文：A Survey of Text Watermarking in the Era of Large Language Models 论文链接：https://arxiv.org/abs/2312.07913 大模型时代：文本水印新纪元文本水...

生成式AI 2024-01-26 人工智能

1044阅读

NeurIPS 2023精选回顾：大模型最火，清华ToT思维树上榜

近日，作为美国前十的科技博客，Latent Space对于刚刚过去的NeurIPS 2023大会进行了精选回顾总结。在NeurIPS会议总共接受的3586篇论文之中，除去6篇获奖论文，其他论文也同样优秀和具有潜力，甚至有可能预示着下一个AI领域的新突破...

大数据 2024-01-26 人工智能

915阅读

AIGC：大语言模型开放平台OpenLLM简介（提供简易的模型部署体验）

文章目录 @[toc] 简介一、安装二、启动LLM服务器项目链接简介该项目旨在为各种大语言模型（LLM）在生产环境中的部署和可观测性提供一个标准的解决方案，用最简单直接的方式把大语言模型（LLM）部署到云端或本...

大数据 2024-01-26 人工智能

899阅读

5.28 深圳活动｜Jina AI 生态助力云原生场景下的 AIGC 应用开发

亚马逊云科技 Community Day 将于 5 月 28 日在深圳南山区海德酒店 11 楼举办，Jina AI 软件工程师付杰将带来《Jina AI 生态助力云原生场景下的 AIGC 应用开发》的主题演讲。 Community Day 是亚马逊云...

生成式AI 2024-01-25 人工智能

941阅读

RAG实战 7 - 使用llama_index实现多模态RAG

LLM之RAG实战（七）| 使用llama_index实现多模态RAG 文章目录 LLM之RAG实战（七）| 使用llama_index实现多模态RAG 一、多模态RAG 二、多模态LLM 三、多模态嵌入四、多模态索引与检索五、多...

人工智能 2024-01-25 人工智能

1167阅读

AI4Science还是伪命题吗？两年后workshop组织者重新审视AI4Science

2021年，一群热血青年提出了要把AI4Science（AI for Science）带入机器学习顶会NeurIPS。什么？AI4Science是一门学科吗？是不是靠着AI蹭热点？各种质疑声接踵而来。这些质疑和不解也反映在了第一届AI4Science...

人工智能 2024-01-25 人工智能

952阅读

MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM

近日，MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架，旨在将大语言模型（LLMs）应用于健康预测任务，利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。可穿戴传感器技...

AIGC 2024-01-24 人工智能

966阅读

万字总结 | 2023大模型与自动驾驶论文走马观花

本文经自动驾驶之心公众号授权转载，转载请联系出处。 2023年已经匆匆过去大半，不知各位自动驾驶小伙伴今年的工作生活情况是否顺利呢？高阶ADAS方案量产了吗？新的文章和实验进展又是否顺利呢？今天给大家总结了2023年前后的一些自动驾驶结合大模型的开创性...

生成式AI 2024-01-24 人工智能

1200阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜3＞

3.4 RLHF 结果 3.4.1 基于模型的评估评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准，但可能会因各种 HCI 考虑因素而变得复杂（Clark 等人，2021；Gehrmann 等人，2023），并且并不总是可扩展的...

生成式AI 2024-01-23 人工智能

1036阅读

2024年人工智能领域十大预测

2023年人工智能领域如果只能筛选一个关键词的话，恐怕非“大模型”莫属。大模型的发展在过去一年中，让各行各业发生了天翻地覆的变化，有企业因大模型而新生，有企业因大模型而消亡。企业的变迁跟技术迭代息息相关，而大模型就是新一代人工智能技术下的产物，大模型已经...

大数据 2024-01-23 人工智能

938阅读

甲骨文的 OCI 生成式 AI 服务现已推出

Oracle 宣布了 Oracle Cloud Infrastructure（OCI）Generative AI 服务的普遍可用性，以及使企业更轻松地利用生成 AI 的最新进展的新创新。 OCI Generative AI 服务是一项完全托管的服务，无缝集...

大数据 2024-01-23 人工智能

854阅读

LLM会写代码≠推理+规划！AAAI主席揭秘：代码数据质量太高｜LeCun力赞

自从ChatGPT发布后，各种基于大模型的产品也快速融入了普通人的生活中，但即便非AI从业者在使用过几次后也可以发现，大模型经常会胡编乱造，生成错误的事实。不过对于程序员来说，把GPT-4等大模型当作「代码辅助生成工具」来用的效果明显要比「事实检索工具...

大数据 2024-01-23 人工智能

960阅读

LLaMa 原理+源码——拆解 (KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query Attention, SwiGLU)

原理 Vanilla Transformer 与 LLaMa 的区别 Embedding RMS Norm Rotary Positional Encodding SwiGLU Function KV-Cache Grouped Mult...

大数据 2024-01-22 人工智能

2212阅读

针对特定领域较小的语言模型是否与较大的模型同样有效?

经过2023年的发展，大语言模型展示出了非常大的潜力，训练越来越大的模型成为有效性评估的一个关键指标，论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...

AIGC 2024-01-22 人工智能

833阅读

“AI学会欺骗，人类完蛋了”？看完Anthropic的论文，我发现根本不是这回事啊

AGI若到来，人类是否会受到威胁，是一个大众热衷讨论同时研究者们也很关注的问题，从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文，提出关于“Sleeper Agen...

人工智能 2024-01-22 人工智能

834阅读

AI助力全球最大科技公司总市值突破10万亿美元 Nvidia超越Facebook、微软超越苹果领先

全球最大的科技巨头估值已超过1万亿美元，部分归功于生成式人工智能的投资和进步，估值总计超过10万亿美元，其中Nvidia超越Facebook成为新秀，而Microsoft则取代苹果领先。目前，包括Microsoft、Apple、Google、Amazon...

AIGC 2024-01-22 人工智能

838阅读

一文读懂Llama 2（从原理到实战）

文章目录简介实战：微调Llama 2 在线体验参考简介 Llama 2，是Meta AI正式发布的最新一代开源大模型。 Llama 2训练所用的token翻了一倍至2万亿，同时对于使用大模型最重要的上下文长度限制，Lla...

大数据 2024-01-22 人工智能

1083阅读

AIGC周报｜30秒定制一个文生图模型；60美元让AI玩转《我的世界》；手机版“文生图”模型：2秒不到出一张图

AIGC（AI Generated Content）即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生图模型，都属于 AIGC 的典型案例，它们通过借鉴现有的、人类创造的内容来...

人工智能 2024-01-20 人工智能

903阅读

AIGC 3D即将爆发，混合显示成为产业数字化的生产力平台

2023年，大语言模型与生成式AI浪潮席卷全球，以文字和2D图像生成为代表的AIGC正在全面刷新产业数字化。而容易为市场所忽略的是，3D图像生成正在成为下一个AIGC风口，AIGC 3D宇宙即将爆发。所谓AIGC 3D宇宙，即由文本生成3D图像或由2D图像...

AIGC 2024-01-20 人工智能

894阅读

AI游戏设计的半年度复盘；大模型+智能音箱再起波澜；昇思大模型技术公开课第2期；出海注册经验分享；如何使用LoRA微调Llama 2 | ShowMeAI日报

?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦！ ? 进步or毁灭：Nature 调研显示 1600+ 科学家对AI的割裂态度国际顶级期刊 Nature 最近一项调研很有意思，全球 1600 多名科...

人工智能 2024-01-20 人工智能

980阅读

AI爆款设备Rabbit R1将接收Perplexity AI的实时信息

Rabbit 在2024年 CES 展上备受瞩目，并宣布与 Perplexity 达成合作伙伴关系，将 “对话式 AI 动力回答引擎” 与 R1相连。 R1是一款售价199美元的由 Teenage Engineering 设计的 AI 设备，已经通过了5...

大数据 2024-01-19 人工智能

892阅读

新AI框架 AboutMe：用网页中自我描述来记录英语预训练数据过滤器的效果

随着自然语言处理和自然语言生成的进步，大型语言模型（LLMs）在实际应用中得到了广泛使用。由于它们能够模仿人类行为，并具有通用性，这些模型已经涉足各个领域。虽然这些模型引起了相当大的关注，但它们代表了一组受限和偏向的人类观点和知识。预训练数据的组成是造成...

AIGC 2024-01-19 人工智能

886阅读

2023-12-30 AIGC-LangChain介绍

摘要: 2023-12-30 AIGC-LangChain介绍 LangChain介绍 1. https://youtu.be/Ix9WIZpArm0?t=353 2. https://www.freecodecamp.org/news/la...

AIGC 2024-01-19 人工智能

1468阅读

Data-Copilot: 大语言模型做你最贴心省事的数据助手

Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow 无需繁琐操作,只需要输入一句话, Data-Copilot自动帮你完成查数据,分析数据,管理数据,预测趋...

大数据 2024-01-19 人工智能

976阅读

苹果AIM自回归视觉模型验证性能与模型规模有关

苹果公司的研究者通过自回归图像模型（AIM）验证了视觉模型“参数越多性能越强”的规律，进一步证明随着容量或预训练数据量的增加，模型能不断提升性能。AIM能有效利用大量未经整理的图像数据，训练方法和稳定性与最近的大型语言模型(LLM 类似。这一观察结果与之前...

人工智能 2024-01-18 人工智能

859阅读

LLaMA Pro: Progressive LLaMA with Block Expansion

Q: 这篇论文试图解决什么问题？ A: 这篇论文试图解决大型语言模型（LLMs）在特定领域（如编程、数学、生物医学或金融）能力不足的问题。尽管LLMs在多种现实世界任务中表现出色，但在某些特定领域仍然存在局限性，这阻碍了开发通用语言代理以应用于更广泛场景...

生成式AI 2024-01-18 人工智能

1087阅读

全新免费编程神器！比Copilot快两倍，准确率高20% | 非十科技发布

一款国产编程神器，秒杀了微软GitHub Copilot。有多快？比GitHub Copilot快两倍的同时，准确度还提高了约20%。不仅如此，在做到“快”、“准”的情况下，功能上也是比较全面，包括：代码自动补全、自然语言生成代码、自动添加注释、...

生成式AI 2024-01-15 人工智能

978阅读

公司如何使用GenAI来防范ChatGPT泄漏数据

根据哈佛大学最近的一项研究，公司员工的工作效率提高了40%，这要归功于基于哈佛大学的一项研究。麻省理工学院的另一项研究发现，ChatGPT减少了技能不平等，加快了文档创建时间，同时使公司员工能够更高效地利用时间。ChatGPT正在帮助公司员工在更短的时...

生成式AI 2024-01-15 人工智能

832阅读

AI战争迫近，ChatGPT解除军用禁令

上周末，人工智能领头羊企业OpenAI悄悄从ChatGPT使用政策中删除了禁止应用于军事用途的条款，这标志着人工智能武器化的潘多拉盒子已经打开。值得注意的是，在OpenAI新政策曝光前不到一个月，美国国防部副部长希克斯在访问加州期间曾宣称，美国军方与...

AIGC 2024-01-15 人工智能

950阅读

Transformer的无限之路：位置编码视角下的长度外推综述

在自然语言处理（Natural Language Processing，NLP）领域，Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而，Transformer 及在其基础之上的大语言模型（Large Language Model...

大数据 2024-01-15 人工智能

912阅读

AI视野：阿里推ReplaceAnything框架；OpenAI取消军用禁令；Pika推视频画面扩充功能；SD推图生视频插件I2V-Adapter

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/ ?‍???聚焦开发者阿里推Rep...

大数据 2024-01-15 人工智能

863阅读

LLM AutoEval:AI平台自动评估Google Colab中的LLM

在自然语言处理领域，语言模型的评估对于开发人员推动语言理解和生成的边界至关重要。LLM AutoEval是一款旨在简化和加速语言模型（LLMs）评估过程的工具，专为寻求快速高效评估LLM性能的开发者定制。 LLM AutoEval具有以下关键特点: 1....

人工智能 2024-01-15 人工智能

911阅读

【网安AIGC专题10.11】论文1：生成式模型GPT\CodeX填充式模型CodeT5\INCODER+大模型自动程序修复(生成整个修复函数、修复代码填充、单行代码生产、生成的修复代码排序和过滤)

论文1：Automated Program Repair in the Era of Large Pre-trained Language Models 写在最前面论文总结背景知识介绍语言模型双向语言模型单向语言模型自动程序修复（...

大数据 2024-01-15 人工智能

976阅读

如何高效部署大模型？CMU最新万字综述纵览LLM推理MLSys优化技术

在人工智能（AI）的快速发展背景下，大语言模型（LLMs）凭借其在语言相关任务上的杰出表现，已成为 AI 领域的重要推动力。然而，随着这些模型在各种应用中的普及，它们的复杂性和规模也为其部署和服务带来了前所未有的挑战。LLM 部署和服务面临着密集的计算强...

人工智能 2024-01-15 人工智能

1087阅读

LLMs之LLaMA-2：LLaMA-2的简介(技术细节)、安装、使用方法(开源-免费用于研究和商业用途)之详细攻略

LLMs之LLaMA-2：LLaMA-2的简介(技术细节、安装、使用方法(开源-免费用于研究和商业用途之详细攻略导读：2023年7月18日，Meta重磅发布Llama 2！这是一组预训练和微调的大型语言模型（LLM），规模从70亿到700亿个...

AIGC 2024-01-14 人工智能

1227阅读

继copilot之后，又一款免费帮你写代码的插件

继copilot之后，又一款免费帮你写代码的插件写在前面一、CodeGeex简介二、插件安装三、帮你写代码四、帮你添加注释五、帮你翻译成其他语言六小结写在前面在之前的文章中推荐过一款你写注释，它就能帮你写代码的...

AIGC 2024-01-14 人工智能

1106阅读

一文讲清大模型AI应用架构

本文转载自微信公众号「产品二姐」，作者产品二姐。转载本文请联系产品二姐公众号。如果说 2023 年是大模型大爆发的一年，这一年的机会主要给了大厂或者拿到大笔融资的创业者；那么 2024 年将是 AI 应用大爆发的一年，也意味着普通人有更多的机会加入这...

人工智能 2024-01-14 人工智能

1034阅读

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

1002阅读