-
AIGC生成风格统一图片的方法介绍
过去一段时间以来,AIGC图片生成技术快速发展,在电商以及内容创作领域展现出来极高的应用价值。 除了基础的基于prompt的文生图能力,社区还涌现出来更多的扩展技术。 比如Controlnet技术能利用线稿信...
-
RWKV-7 预览版、大量新论文...RWKV 社区 9 月动态速览
欢迎大家收看《RWKV 社区最新动态》第五期,本期内容收录了 RWKV 社区 2024 年 9 月的最新动态。 9 月动态省流版(TL;DR) RWKV 官方新闻动态 RWKV-7 发布预览版 RWKV-7 论文撰写已面向社区开放...
-
Stable-Diffusion-web UI运行环境搭建和界面配置
Stable-Diffusion-web UI运行环境搭建和界面配置 前言 一、论文 二、源码下载 三、权重模型和文件下载 (1)下载sd-v1-4.ckpt模型 (2)下载openai/clip-vit-large-patch14模型...
-
大模型——LLaVA和LLaMA的介绍和区别
LLaVA和LLaMA是两个不同的模型架构,它们的设计目的和应用领域有所不同: LLaMA(Large Language Model Meta AI) 简介:LLaMA是由Meta AI推出的一系列大规模语言模型(Large Language M...
-
LLaMA 数据集
LLaMA的训练数据集来源多样,涵盖了多个不同的数据集和预处理步骤。以下是详细的描述: 公开数据来源和预处理 CommonCrawl [67%]: 使用CCNet管道(Wenzek等人,2020年)对2017年至2020年间的五个Comm...
-
stable-diffusion-xl_pytorch生成高质量的图像的AIGC模型
stable-diffusion-xl_pytorch 论文 SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis https://arxiv.org/...
-
【前沿技术】扩散模型Stable Diffusion原理与应用
前言 久章智能 Stable Diffusion是一种基于扩散模型(Diffusion Models)的生成技术,近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景,迅速在学术界和工业界引起了...
-
GPT-4o能玩《黑神话》!精英怪胜率超人类,无强化学习纯大模型方案
AI玩黑神话,第一个精英怪牯护院轻松拿捏啊。 有方向感,视角也没有问题。 躲闪劈棍很丝滑。 甚至在打鸦香客和牯护院时,AI的胜率已经超过人类。 而且是完全使用大模型玩,没有使用强化学习。 阿里巴巴的研究人员们提出了一个新型VARP(视觉动作角色扮演...
-
基于大模型生成文献综述的实现思路:兼看昨日大模型进展早报
今天是24年8月份的第一天,我们先来回顾下昨日大模型进展早报。 我们来看看一个工作,基于大模型的自动综述生成,Automated Review Generation Method Based on Large Language Models:(https...
-
探索大模型和 Multi-Agent 在运维领域的实践
摘要:本文从智能运维面临的挑战和痛点出发,介绍企业运维领域应用 AIGC 的实践案例,基于确定性运维的实践经验,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。 本文分享自华为云社区《LLM...
-
【AIGC半月报】AIGC大模型启元:2024.08(下)
【AIGC半月报】AIGC大模型启元:2024.08(下)) (1 Nemotron-4-Minitron(Nvidia LLM) (2 VITA(腾讯优图多模态大模型) (3 mPLUG-Owl3(阿里巴巴多模态大模型) (4 ADA...
-
开源项目 PaperWhisperer 指南
开源项目 PaperWhisperer 指南 paperwhispererAutomatic voice-synthetised summaries of latest research papers on arXiv项目地址:https://gitc...
-
ACL 2024 | CoCA:自注意力的缺陷与改进
近年来,在大语言模型(LLM)的反复刷屏过程中,作为其内核的 Transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 Transformer 诞生之初,被视为天然具备的长度外推能力,...
-
【AIGC从零开始】AIGC小白学习心得第二讲:3D生成模型
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、Stable Video 3D(sv3d) 二、TripoSR 三、LRM系列 1.LRM 2.GS-LRM 3.OpenLRM 四、CRM 五...
-
【英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强】
系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 系列文章目录 前言 最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结...
-
MIT新研究揭秘「AI洗脑术」!AI聊天诱导人类「编造」记忆,真假难辨
【新智元导读】MIT研究发现:在AI的操纵下,人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导,形成「现场有枪」的错误记忆。有趣的是,AI的阿谀奉承,会产生「回音室效应」,让偏见更加强化。 GenAI的影响,已经不仅仅是搜索引擎、聊天机器人这么简...
-
CVPR2024|Diffusion模型轻量化与计算效率优化
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做DDPM的下游任务实在是太难受了),所以本文整理汇总了部分CVPR2024中关于扩散模型的轻量化与计算效率优化 的相关论文...
-
大模型算法必学,万字长文Llama-1到Llama-3详细拆解
导读 Llama系列的大语言模型在多个自然语言处理任务中表现出色,包括文本分类、情感分析和生成式问答,本质是使用 Transformer 架构并结合预训练和微调技术。本文详细讲解Llama-1到Llama-3,值得读者点赞收藏! 引言 在AI领域...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
Dreambooth-Stable-Diffusion 使用教程
Dreambooth-Stable-Diffusion 使用教程 Dreambooth-Stable-DiffusionImplementation of Dreambooth (https://arxiv.org/abs/2208.12242 by...
-
在 RAGFlow 中实践 GraphRAG
RAGFlow 0.9 版本发布,正式引入了对 GraphRAG 的支持。GraphRAG 由微软近期开源【参考文献1】,被称作下一代 RAG,并且在更早时间发表了相关论文【参考文献2】。关于下一代 RAG,在 RAGFlow 体系的定义更加完整,就是如下...
-
AI爆料人遭全网封禁!OpenAI等25个机构祭大招,一眼辨别AI机器人
【新智元导读】AI智能体遍布整个网络,未来如何防止被骗?如何保护隐私?OpenAI微软MIT等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个OpenAI的「AI爆料人」愚弄了。 听到「草莓哥」@iru...
-
超逼真AI生成电影来了!《泰坦尼克号》AI重生!浙大&阿里发布MovieDreamer,纯AI生成电影引爆热议!
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架MovieDreamer,它将自回归...
-
知网状告AI搜索:搜到我家论文题目和摘要,你侵权了!
创业团队秘塔AI搜索,被知网给告了! 足足28页的侵权告知函,总结一句话就是: 这一消息,正是由秘塔刚刚发布于自家的公众号: 在秘塔收到的告知函中,还有一句非常醒目的话: 然后最后一句:“如需商务合作,请与我司联系”…… 对此,秘塔在声明中表达了自...
-
ECCV2024|AIGC(图像生成,视频生成,3D生成等)相关论文汇总(附论文链接/开源代码)【持续更新】
ECCV2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) Awesome-ECCV2024-AIGC 1.图像生成(Image Generation/Image Synthesis Accelerating Diffusio...
-
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗? 全球数据告急,怎么办? 论文来凑! 最近,Nature的一篇文章向我们揭露了这样...
-
llama_fastertransformer对话问答算法模型
LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进,并用于不同的模型,例如 PaLM。以下是与原始架构的主要区别: 预归一化。为了提高...
-
Llama 3.1上线就被攻破:大骂小扎,危险配方张口就来!指令遵循能力强了更容易越狱...
梦晨 发自 凹非寺量子位 | 公众号 QbitAI 最强大模型Llama 3.1,上线就被攻破了。 对着自己的老板扎克伯格破口大骂,甚至知道如何绕过屏蔽词。 设计危险病毒、如何黑掉Wifi也是张口就来。 Llama 3.1...
-
从炒菜到缝针!斯坦福炒虾团队打造自主「AI达芬奇」,苦练神指当外科医生
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段。 后者不仅依赖昂贵的人工标...
-
Llama 对决 GPT:AI 开源拐点已至?|智者访谈
Meta 发布 Llama3.1405B,开放权重大模型的性能表现首次与业内顶级封闭大模型比肩,AI 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文,坚定表明「开源 AI 即未来」,再次将开源与封闭的争论推向舞台中央。 回望过去,OpenAI 从开源到封...
-
Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization
香港理工大学&bytedance&alibaba https://github.com/yangxy/PASD/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于SD的方法缺乏对图片结构的保持,所以本...
-
【AIGC】AI-Agents最新成果-斯坦福AI小镇源码解读
写在前面的话: 今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 RPG 虚拟世界,其中 25 个角色由 GPT 和自定义代码控制,并在arxiv上提交了论文版本,引起了对AIGC+游戏的广泛讨论; 8月,该项目在GitHub上正式开源...
-
【三维AIGC】扩散模型LDM辅助3D Gaussian重建三维场景
标题:《Sampling 3D Gaussian Scenes in Seconds with Latent Diffusion Models》 来源:Glasgow大学;爱丁堡大学 连接:https://arxiv.org/abs/2406.13099...
-
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。 大数字一向吸引眼球。 千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下...
-
百变背景:万相实验室AIGC电商图片可控生成技术
✍🏻 本文作者:云芑、因尘、岁星、也鹿 1. 背景 随着AI生成内容(AIGC)技术如Diffusion的飞速进展,现如今,大家已能够轻易地使用Stable Diffusion(SD)[1]等文生图的模型或工具,将心中所想仅凭语言描述(...
-
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
「因果推理」绝对是当前GenAI热潮下的小众领域,但是它有一个大佬级的坚定支持者——Yann LeCun。 他在推特上的日常操作之一,就是炮轰Sora等生成模型,并为自己坚信的因果推理领域摇旗呐喊。 甚至,早在2019年VentureBeat的采访中,他...
-
论文研读|以真实图像为参考依据的AIGC检测
前言:这篇文章介绍几篇AIGC检测的相关工作,均是以真实图像的特征作为标准进行检测。 目录 Detecting Generated Images by Real Images Only (202311 arXiv Let Real...
-
RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架
【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架,简化了原本需要多个模型的复杂的RAG流水线,用微调的方法交给同一个LLM完成,结果同时实现了模型在RAG任务上的性能提升。 在需要大量事实知识的文本生成任务中,R...
-
stable diffusion-v2.1-pytorch以文生图推理模型
Stable Diffusion Version 2 论文 DENOISING DIFFUSION IMPLICIT MODELS https://arxiv.org/pdf/2010.02502 模型结构 通过串联或更通用的交叉注意机制来调节LD...
-
[arxiv论文解读]LlamaFactory:100+语言模型统一高效微调
该文档是一篇关于LLAMAFACTORY的学术论文,这是一个用于高效微调大型语言模型(LLMs)的统一框架。这篇论文详细介绍了LLAMAFACTORY的设计、实现和评估,以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释: 摘要(Abst...
-
国产动漫视频AI火了!二次元老婆随意捏,哥特、梦幻、机甲一键get
【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。 现在,各位二次元萌新们,不用再等「太太」出图啦! 我们不仅可以自己产粮,而且还是会动的那种。 如今,AI视频生...
-
欢迎 Stable Diffusion 3 加入 Diffusers
作为 Stability AI 的 Stable Diffusion 家族最新的模型,Stable Diffusion 3(SD3 现已登陆 Hugging Face Hub,并且可用在 🧨 Diffusers 中使用了。 Stable Dif...
-
Mozilla 开源 llamafile:大语言模型分发与部署新范式
引言 随着 ChatGPT、BERT 等大型语言模型(Large Language Model, LLM 在自然语言处理领域掀起巨大波澜,AI 技术正以前所未有的速度走近大众生活。然而,这些 LLM 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...
-
【AIGC】《AI-Generated Content (AIGC): A Survey》
文章目录 相关概念 What is AI-generated content? Necessary conditions of AIGC How can AI make the content better? The industrial c...
-
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude3.5也无法幸免。 在经典的「狼-山羊-卷心菜」过河问...
-
每日一看大模型新闻(2024.1.20-1.21)英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大;Llama 2打败GPT-4!Meta让大模型自我奖励自迭代,再证合成数据是LL
1.产品发布 1.1韩国Kakao:推出多模态大模型Honeybee 发布日期:2024.1.20 Kakao unveils multimodal large language model Honeybee - The Korea Ti...
-
AI学会篡改奖励函数、欺骗研究者!Claude团队:无法根除的行为,令人不安
坏了!AI被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。 只需要给AI一个隐藏的“草稿纸”,研究人员假装不会查看,AI就会在上面自言自语着写下计划并暗中执行。 参与这项试验的Claude团队表示: 具体来说,实验中让AI可以访问自己的强...
-
何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与
何恺明入职MIT副教授后,首次带队的新作来了! 让自回归模型抛弃矢量量化,使用连续值生成图像。并借鉴扩散模型的思想,提出Diffusion Loss。 他加入MIT后,此前也参与过另外几篇CV方向的论文,不过都是和MIT教授Wojciech Matusi...
-
Diffusion Model原理及Stable Diffusion
什么是扩散(diffusion)? 扩散一词来自非平衡热力学(non-equilibrium thermodynamics),在非平衡热力学中扩散过程指的是:“在浓度梯度的驱动下,颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型(di...