arxiv - AIGC资讯

数据科学家学习资源选型指南：根据学习目标选择

在数据科学领域，学习资源如同繁星点点，既有深入浅出的在线课程，也有严谨系统的学术著作，更有实战导向的项目和社区。面对如此丰富的学习资源，如何根据自身的学习目标进行有效选型，成为了每位数据科学学习者必须面对的问题。本文旨在为不同学习目标的数据科学家提供一份学...

人工智能 2025-06-12 大数据

693阅读

AIGC生成风格统一图片的方法介绍

过去一段时间以来，AIGC图片生成技术快速发展，在电商以及内容创作领域展现出来极高的应用价值。除了基础的基于prompt的文生图能力，社区还涌现出来更多的扩展技术。比如Controlnet技术能利用线稿信...

人工智能 2024-10-13 人工智能

3383阅读

RWKV-7 预览版、大量新论文...RWKV 社区 9 月动态速览

欢迎大家收看《RWKV 社区最新动态》第五期，本期内容收录了 RWKV 社区 2024 年 9 月的最新动态。 9 月动态省流版（TL;DR） RWKV 官方新闻动态 RWKV-7 发布预览版 RWKV-7 论文撰写已面向社区开放...

生成式AI 2024-10-13 人工智能

2533阅读

Stable-Diffusion-web UI运行环境搭建和界面配置

Stable-Diffusion-web UI运行环境搭建和界面配置前言一、论文二、源码下载三、权重模型和文件下载（1）下载sd-v1-4.ckpt模型（2）下载openai/clip-vit-large-patch14模型...

大数据 2024-09-27 人工智能

3012阅读

大模型——LLaVA和LLaMA的介绍和区别

LLaVA和LLaMA是两个不同的模型架构，它们的设计目的和应用领域有所不同： LLaMA（Large Language Model Meta AI）简介：LLaMA是由Meta AI推出的一系列大规模语言模型（Large Language M...

生成式AI 2024-09-27 人工智能

2054阅读

LLaMA 数据集

LLaMA的训练数据集来源多样，涵盖了多个不同的数据集和预处理步骤。以下是详细的描述：公开数据来源和预处理 CommonCrawl [67%]：使用CCNet管道（Wenzek等人，2020年）对2017年至2020年间的五个Comm...

生成式AI 2024-09-25 人工智能

1098阅读

stable-diffusion-xl_pytorch生成高质量的图像的AIGC模型

stable-diffusion-xl_pytorch 论文 SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis https://arxiv.org/...

生成式AI 2024-09-24 人工智能

1128阅读

【前沿技术】扩散模型Stable Diffusion原理与应用

前言久章智能 Stable Diffusion是一种基于扩散模型（Diffusion Models）的生成技术，近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景，迅速在学术界和工业界引起了...

生成式AI 2024-09-23 人工智能

1490阅读

GPT-4o能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案

AI玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型VARP（视觉动作角色扮演...

AIGC 2024-09-23 人工智能

1047阅读

基于大模型生成文献综述的实现思路：兼看昨日大模型进展早报

今天是24年8月份的第一天，我们先来回顾下昨日大模型进展早报。我们来看看一个工作，基于大模型的自动综述生成，Automated Review Generation Method Based on Large Language Models：(https...

生成式AI 2024-09-21 人工智能

1528阅读

探索大模型和 Multi-Agent 在运维领域的实践

摘要：本文从智能运维面临的挑战和痛点出发，介绍企业运维领域应用 AIGC 的实践案例，基于确定性运维的实践经验，提出以 LLM 为中心，基于多 Agent 协同的运维方案，并提出在大模型时代下，对下一代智能运维的思考。本文分享自华为云社区《LLM...

生成式AI 2024-09-18 人工智能

1239阅读

【AIGC半月报】AIGC大模型启元：2024.08（下）

【AIGC半月报】AIGC大模型启元：2024.08（下）） (1 Nemotron-4-Minitron（Nvidia LLM） (2 VITA（腾讯优图多模态大模型） (3 mPLUG-Owl3（阿里巴巴多模态大模型） (4 ADA...

AIGC 2024-09-13 人工智能

1123阅读

开源项目 PaperWhisperer 指南

开源项目 PaperWhisperer 指南 paperwhispererAutomatic voice-synthetised summaries of latest research papers on arXiv项目地址:https://gitc...

人工智能 2024-09-09 人工智能

1052阅读

ACL 2024 | CoCA：自注意力的缺陷与改进

近年来，在大语言模型（LLM）的反复刷屏过程中，作为其内核的 Transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 Transformer 诞生之初，被视为天然具备的长度外推能力，...

AIGC 2024-09-09 人工智能

1236阅读

【AIGC从零开始】AIGC小白学习心得第二讲：3D生成模型

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、Stable Video 3D（sv3d）二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...

大数据 2024-09-08 人工智能

1371阅读

【英伟达玩转剪枝、蒸馏：把Llama 3.1 8B参数减半，性能同尺寸更强】

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言最近，英伟达研究表明，结构化权重剪枝与知识蒸馏相结...

大数据 2024-09-07 人工智能

898阅读

MIT新研究揭秘「AI洗脑术」！AI聊天诱导人类「编造」记忆，真假难辨

【新智元导读】MIT研究发现:在AI的操纵下，人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导，形成「现场有枪」的错误记忆。有趣的是，AI的阿谀奉承，会产生「回音室效应」，让偏见更加强化。 GenAI的影响，已经不仅仅是搜索引擎、聊天机器人这么简...

AIGC 2024-09-03 人工智能

957阅读

CVPR2024|Diffusion模型轻量化与计算效率优化

前言做算法应该都有顶会梦吧，发不了顶会只能刷一刷顶会了哈哈，向顶会大佬学习扩散模型的训练和推理都需要巨大的计算成本（显卡不足做DDPM的下游任务实在是太难受了），所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化的相关论文...

人工智能 2024-08-26 人工智能

2795阅读

大模型算法必学，万字长文Llama-1到Llama-3详细拆解

导读 Llama系列的大语言模型在多个自然语言处理任务中表现出色，包括文本分类、情感分析和生成式问答，本质是使用 Transformer 架构并结合预训练和微调技术。本文详细讲解Llama-1到Llama-3，值得读者点赞收藏！引言在AI领域...

AIGC 2024-08-25 人工智能

1492阅读

【扩散模型】DDPM论文理解

DDPM（Denoising Diffusion Probabilistic Models）更详细解读可以参考（这几个视频看完基本对DDPM的原理就能够把握了）李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...

人工智能 2024-08-24 人工智能

984阅读

Dreambooth-Stable-Diffusion 使用教程

Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...

人工智能 2024-08-24 人工智能

923阅读

在 RAGFlow 中实践 GraphRAG

RAGFlow 0.9 版本发布，正式引入了对 GraphRAG 的支持。GraphRAG 由微软近期开源【参考文献1】，被称作下一代 RAG，并且在更早时间发表了相关论文【参考文献2】。关于下一代 RAG，在 RAGFlow 体系的定义更加完整，就是如下...

人工智能 2024-08-21 人工智能

2007阅读

AI爆料人遭全网封禁！OpenAI等25个机构祭大招，一眼辨别AI机器人

【新智元导读】AI智能体遍布整个网络，未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」，可以证明自己是真人，还不用披露任何个人信息。最近半个月，全网竟被一个OpenAI的「AI爆料人」愚弄了。听到「草莓哥」@iru...

生成式AI 2024-08-19 人工智能

937阅读

超逼真AI生成电影来了！《泰坦尼克号》AI重生！浙大&阿里发布MovieDreamer，纯AI生成电影引爆热议！

视频生成领域的最新进展主要利用了短时内容的扩散模型。然而，这些方法往往无法对复杂的叙事进行建模，也无法在较长时间内保持角色的一致性，而这对于电影等长篇视频制作至关重要。对此，浙大&阿里发布了一种新颖的分层框架MovieDreamer，它将自回归...

生成式AI 2024-08-18 人工智能

1116阅读

知网状告AI搜索：搜到我家论文题目和摘要，你侵权了！

创业团队秘塔AI搜索，被知网给告了! 足足28页的侵权告知函，总结一句话就是: 这一消息，正是由秘塔刚刚发布于自家的公众号: 在秘塔收到的告知函中，还有一句非常醒目的话: 然后最后一句:“如需商务合作，请与我司联系”…… 对此，秘塔在声明中表达了自...

人工智能 2024-08-16 人工智能

1063阅读

ECCV2024｜AIGC(图像生成，视频生成，3D生成等)相关论文汇总（附论文链接/开源代码）【持续更新】

ECCV2024｜AIGC相关论文汇总（如果觉得有帮助，欢迎点赞和收藏） Awesome-ECCV2024-AIGC 1.图像生成(Image Generation/Image Synthesis Accelerating Diffusio...

人工智能 2024-08-16 人工智能

1601阅读

Nature曝惊人内幕：论文被天价卖出喂AI！出版商狂赚上亿，作者0收入

Nature的一篇文章透露:你发过的paper，很可能已经被拿去训练模型了!有的出版商靠卖数据，已经狂赚2300万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗? 全球数据告急，怎么办? 论文来凑! 最近，Nature的一篇文章向我们揭露了这样...

生成式AI 2024-08-15 人工智能

998阅读

llama_fastertransformer对话问答算法模型

LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进，并用于不同的模型，例如 PaLM。以下是与原始架构的主要区别：预归一化。为了提高...

人工智能 2024-08-08 人工智能

929阅读

Llama 3.1上线就被攻破：大骂小扎，危险配方张口就来！指令遵循能力强了更容易越狱...

梦晨发自凹非寺量子位 | 公众号 QbitAI 最强大模型Llama 3.1，上线就被攻破了。对着自己的老板扎克伯格破口大骂，甚至知道如何绕过屏蔽词。设计危险病毒、如何黑掉Wifi也是张口就来。 Llama 3.1...

AIGC 2024-08-05 人工智能

1045阅读

从炒菜到缝针！斯坦福炒虾团队打造自主「AI达芬奇」，苦练神指当外科医生

【新智元导读】斯坦福炒虾机器人作者，又出新作了!通过模仿学习，达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是，以上动作全部都是它自主完成的。斯坦福炒虾机器人作者，又出新作了。这次，机器人不是给我们炒饭了，而是给我们做外科手...

大数据 2024-07-31 人工智能

935阅读

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM「分饰三角」自评自进化

【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型，给「超级对齐」指条明路:让AI自己当裁判，自我改进对齐，效果秒杀自我奖励模型。 LLM对数据的大量消耗，不仅体现在预训练语料上，还体现在RLHF、DPO等对齐阶段。后者不仅依赖昂贵的人工标...

人工智能 2024-07-31 人工智能

1098阅读

Llama 对决 GPT：AI 开源拐点已至?｜智者访谈

Meta 发布 Llama3.1405B，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 AI 即未来」，再次将开源与封闭的争论推向舞台中央。回望过去，OpenAI 从开源到封...

AIGC 2024-07-29 人工智能

892阅读

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入当前的基于SD的方法缺乏对图片结构的保持，所以本...

生成式AI 2024-07-27 人工智能

946阅读

【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读

写在前面的话：今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界，其中 25 个角色由 GPT 和自定义代码控制，并在arxiv上提交了论文版本，引起了对AIGC+游戏的广泛讨论； 8月，该项目在GitHub上正式开源...

AIGC 2024-07-25 人工智能

1250阅读

【三维AIGC】扩散模型LDM辅助3D Gaussian重建三维场景

标题：《Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models》来源：Glasgow大学；爱丁堡大学连接：https://arxiv.org/abs/2406.13099...

人工智能 2024-07-24 人工智能

1354阅读

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还有各大厂商一直在卷的超长上下...

大数据 2024-07-23 人工智能

966阅读

百变背景：万相实验室AIGC电商图片可控生成技术

✍? 本文作者：云芑、因尘、岁星、也鹿 1. 背景随着AI生成内容（AIGC）技术如Diffusion的飞速进展，现如今，大家已能够轻易地使用Stable Diffusion（SD）[1]等文生图的模型或工具，将心中所想仅凭语言描述（...

AIGC 2024-07-18 人工智能

1305阅读

6700万参数比肩万亿巨兽GPT-4！微软MIT等联手破解Transformer推理密码

「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他...

人工智能 2024-07-15 人工智能

917阅读

论文研读｜以真实图像为参考依据的AIGC检测

前言：这篇文章介绍几篇AIGC检测的相关工作，均是以真实图像的特征作为标准进行检测。目录 Detecting Generated Images by Real Images Only (202311 arXiv Let Real...

大数据 2024-07-13 人工智能

1120阅读

RAG微调Llama 3竟超越GPT-4！英伟达GaTech华人学者提出RankRAG框架

【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架，简化了原本需要多个模型的复杂的RAG流水线，用微调的方法交给同一个LLM完成，结果同时实现了模型在RAG任务上的性能提升。在需要大量事实知识的文本生成任务中，R...

AIGC 2024-07-09 人工智能

1487阅读

stable diffusion-v2.1-pytorch以文生图推理模型

Stable Diffusion Version 2 论文 DENOISING DIFFUSION IMPLICIT MODELS https://arxiv.org/pdf/2010.02502 模型结构通过串联或更通用的交叉注意机制来调节LD...

人工智能 2024-07-08 人工智能

928阅读

[arxiv论文解读]LlamaFactory：100+语言模型统一高效微调

该文档是一篇关于LLAMAFACTORY的学术论文，这是一个用于高效微调大型语言模型（LLMs）的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（Abst...

AIGC 2024-07-08 人工智能

1800阅读

国产动漫视频AI火了！二次元老婆随意捏，哥特、梦幻、机甲一键get

【新智元导读】视频生成赛道又起新秀，而且还是二次元定制版!稳定产出电影级画面，一键文/图生成视频，即使是「手残党」也能复刻自己喜欢的动漫作品了。现在，各位二次元萌新们，不用再等「太太」出图啦! 我们不仅可以自己产粮，而且还是会动的那种。如今，AI视频生...

人工智能 2024-07-05 人工智能

1064阅读

欢迎 Stable Diffusion 3 加入 Diffusers

作为 Stability AI 的 Stable Diffusion 家族最新的模型，Stable Diffusion 3(SD3 现已登陆 Hugging Face Hub，并且可用在 ? Diffusers 中使用了。 Stable Dif...

大数据 2024-07-04 人工智能

883阅读

Mozilla 开源 llamafile:大语言模型分发与部署新范式

引言随着 ChatGPT、BERT 等大型语言模型(Large Language Model, LLM 在自然语言处理领域掀起巨大波澜,AI 技术正以前所未有的速度走近大众生活。然而,这些 LLM 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...

生成式AI 2024-07-02 人工智能

1145阅读

【AIGC】《AI-Generated Content (AIGC): A Survey》

文章目录相关概念 What is AI-generated content? Necessary conditions of AIGC How can AI make the content better? The industrial c...

大数据 2024-07-01 人工智能

1048阅读

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近，菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问...

生成式AI 2024-07-01 人工智能

1001阅读

每日一看大模型新闻（2024.1.20-1.21）英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大；Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LL

1.产品发布 1.1韩国Kakao：推出多模态大模型Honeybee 发布日期：2024.1.20 Kakao unveils multimodal large language model Honeybee - The Korea Ti...

大数据 2024-06-27 人工智能

950阅读

AI学会篡改奖励函数、欺骗研究者！Claude团队：无法根除的行为，令人不安

坏了!AI被发现偷偷篡改自己的奖励函数，并且欺骗研究人员，隐瞒这一行为。只需要给AI一个隐藏的“草稿纸”，研究人员假装不会查看，AI就会在上面自言自语着写下计划并暗中执行。参与这项试验的Claude团队表示: 具体来说，实验中让AI可以访问自己的强...

生成式AI 2024-06-24 人工智能

847阅读

何恺明新作再战AI生成：入职MIT后首次带队，奥赛双料金牌得主邓明扬参与

何恺明入职MIT副教授后，首次带队的新作来了! 让自回归模型抛弃矢量量化，使用连续值生成图像。并借鉴扩散模型的思想，提出Diffusion Loss。他加入MIT后，此前也参与过另外几篇CV方向的论文，不过都是和MIT教授Wojciech Matusi...

大数据 2024-06-24 人工智能

883阅读