数据集第40页 - AIGC资讯

DeepSeek 发布全新开源大模型，数学推理能力超越 LLaMA-2

自从 LLaMA 被提出以来，开源大型语言模型（LLM）的快速发展就引起了广泛研究关注，随后的一些研究就主要集中于训练固定大小和高质量的模型，但这往往忽略了对 LLM 缩放规律的深入探索。开源 LLM 的缩放研究可以促使 LLM 提高性能和拓展应用领域...

大数据 2024-01-24 人工智能

1644阅读

2024年1月11日最热AI论文Top5：开源界Stable Diffusion杀手、Prompt-tuning、零和游戏博弈

本文整理了今日发表在ArXiv上的AI论文中最热门的 TOP5。以下内容由赛博马良-「AI论文解读达人」智能体生成，人工整理排版。「AI论文解读达人」智能体可提供每日最热论文推荐、AI论文解读等功能。如需查看其他热门论文，欢迎移步saibo...

人工智能 2024-01-23 人工智能

970阅读

Llama 2- Open Foundation and Fine-Tuned Chat Models＜3＞

3.4 RLHF 结果 3.4.1 基于模型的评估评估LLMs是一个具有挑战性的开放研究问题。人类评估虽然是黄金标准，但可能会因各种 HCI 考虑因素而变得复杂（Clark 等人，2021；Gehrmann 等人，2023），并且并不总是可扩展的...

生成式AI 2024-01-23 人工智能

984阅读

2024 年值得关注的 6 大生成式 AI 趋势

2023年是人工智能领域长期以来最具颠覆性的一年，大量生成式人工智能产品进入主流。继续其变革之旅，生成式人工智能有望在2024年从兴奋的话题转变为现实世界的应用。随着科技公司不断开发和微调人工智能模型，生成式人工智能领域正在迅速发展，催生了一系列广泛的趋...

AIGC 2024-01-23 人工智能

1060阅读

[论文精读] 自条件图像生成 - 【恺明大神新作，AIGC 新基准】

论文导读: 论文背景: 2023年8月，AI大神何恺明在个人网站宣布，2024年将加入MIT担任教职，回归学术界。这篇论文是其官宣加盟MIT后首度与MIT师生合著的公开论文，论文一作本科毕业于清华姚班，二作为MIT电气工程与计算机科学系教授，今年的斯...

生成式AI 2024-01-23 人工智能

972阅读

认识 AIGC ，浅淡 AIGC 的那些事—— AIGC：用 AI 创造万物

文章目录 ?关于封面 ?关于活动 ?前言 ?什么是 AIGC ？ ?AIGC：用 AI 创造万物 ?AIGC 的意义与发展 ?AIGC 的发展历程 ?人工智能生成内容的发展历程与概念 ?早期萌芽阶段（1950s-990s） ?沉淀积累阶段...

生成式AI 2024-01-23 人工智能

1452阅读

stable-diffusion、stable-diffusion-webui、novelai、naifu区别介绍

文章目录 1. Stable Diffusion Reference 2. Stable Diffusion WebUI Reference 3. NovelAI Reference 4. Naifu Reference 区别简述 Refere...

大数据 2024-01-23 人工智能

1385阅读

无需训练实现价值观实时动态对齐：上交开源价值观对齐方法OPO，闭源与开源大模型均适用

随着人工智能技术的发展，以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时，大模型本身的安全性问题也变得尤为重要。如何确保大语言模型可以和人类的价值、真实的意图相一致，防止模型被滥用、输出有害的信息，这是大模型安全治理的...

AIGC 2024-01-23 人工智能

999阅读

Beatoven.ai官网体验入口 AI免费音乐背景音乐使用地址入口

Beatoven.ai是一款基于 AI 的免费音乐生成工具，能够根据不同的情绪需求为视频、播客等内容生成定制化的背景音乐。它使用了先进的 AI 音乐创作技术，可以智能地根据内容的不同部分创作出多个配乐片段。 Beatoven.ai提供了 16 种不同情感...

生成式AI 2024-01-23 人工智能

988阅读

消灭「幻觉」！谷歌全新ASPIRE方法让LLM给自己打分，效果碾压10x体量模型

大模型的「幻觉」问题马上要有解了？威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统，可以让大模型对自己的输出给出评分。如果用户看到模型的生成的结果评分不高，就能意识到这个回复可能是幻觉。如果系统可以进一步筛选评分的结果进行输...

人工智能 2024-01-23 人工智能

852阅读

纪念碑谷式错觉图像都被「看穿」，港大、TikTok的Depth Anything火了

人类有两只眼睛来估计视觉环境的深度信息，但机器人和 VR 头社等设备却往往没有这样的「配置」，往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计（MDE）。近日，一种可有效利用大规模无标注图像的新 MDE 模型 Depth Any...

人工智能 2024-01-23 人工智能

820阅读

一个开源的大型语言模型LLaMA论文简单解读，LLaMA: Open and Efficient Foundation Language Models

一个开源的大型语言模型LLaMA论文解读，LLaMA: Open and Efficient Foundation Language Models 返回论文和资料目录 1.导读 LLaMA 是 Meta AI 发布的包含 7...

生成式AI 2024-01-23 人工智能

945阅读

可令 AI 自我判断输出内容正确性，谷歌公布模型训练框架 ASPIRE

IT之家 1 月 23 日消息，谷歌日前发布新闻稿，介绍了一款专为大语言模型设计的 ASPIRE 训练框架，该框架号称可以增强 AI 模型的选择性预测能力。谷歌提到，当下大语言模型在自然语言理解和生成内容方面发展迅速，已被用于构建各种创新应用，但要...

AIGC 2024-01-23 人工智能

822阅读

AIGC神器CLIP：技术详解及应用示例

编者按：上一期，我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期，我们将共同走进另一项AI重要突破——CLIP，著名的DALLE和Stable Diffusion均采用了CLIP哦。 Nikos Kafrit...

人工智能 2024-01-23 人工智能

1106阅读

什么是diffusion model? 它为什么好用？

本文经自动驾驶之心公众号授权转载，转载请联系出处。简介 NCSN （Noise Conditional Score Networks）来自于宋飏博士发表在 NeurIPS2019 上面的文章“Generative Modeling by Estima...

人工智能 2024-01-23 人工智能

1112阅读

2024年数据中心发展趋势：更热、更密、更智能

如今的数据中心行业与十年之前颇有不同，这主要是受过去几年间诸多现实因素的影响：AI技术的大规模扩散、摩尔定律有所放缓，以及令人头痛的可持续性问题等。 Uptime Institute预计，随着运营商对于供电、冷却、管理、高密度与监管压力等问题的关注和规划...

AIGC 2024-01-23 人工智能

841阅读

【AIGC】AnimateDiff:无需定制化微调的动画化个性化的文生图模型

前言 Animatediff是一个有效的框架将文本到图像模型扩展到动画生成器中，无需针对特定模型进行调整。只要在大型视频数据集中学习到运动先验知识。AnimateDiff就可以插入到个性化的文生图模型中，与Civitai和Huggingface的文生图...

AIGC 2024-01-23 人工智能

1392阅读

纯LiDAR 3D检测路在何方？时序递归TimePillars：直接干到200m！

基于LiDAR点云点3D Object Detection一哥是一个很经典的问题，学术界和工业界都提出了各种各样的模型来提高精度、速度和鲁棒性。但因为室外的复杂环境，所以室外点云的Object Detection的性能都还不是太好。而激光雷达点云本质上比...

人工智能 2024-01-23 人工智能

889阅读

分析Stable Diffusion、AnimateDiff、animatediff-cli-prompt-travel 区别

1.animatediff-cli-prompt-travel 和animatediff区别 animatediff-cli-prompt-travel和animatediff在功能和使用方式上有一些不同。首先，ani...

生成式AI 2024-01-23 人工智能

853阅读

世界顶尖多模态大模型开源！又是零一万物，又是李开复

领跑中英文两大权威榜单，李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布，仅间隔不到三个月的时间。模型名为Yi Vision Language（Yi-VL），现已正式面向全球开源。同属Yi系列，同样具有两个版本...

生成式AI 2024-01-23 人工智能

813阅读

大模型 Dalle2 学习三部曲（一）Latent Diffusion Models学习

引言 Diffusion model大获成功，但是它的短板也很明显，需要大量的计算资源，并且推理速度比较慢。如何才能提升Diffusion model的计算效率。业界有各种各样的改进，无疑Latent Diffusion Models（潜在扩散模...

生成式AI 2024-01-23 人工智能

961阅读

扩散模型 - Stable Diffusion

4 Stable Diffusion Stable Diffusion 是由 Stability AI 开发的开源扩散模型。Stable Diffusion 可以完成多模态任务，包括：文字生成图像（text2img）、图像生成图像（img2img）...

人工智能 2024-01-23 人工智能

1004阅读

数据猿预测：2024年大模型、AIGC的十个“小趋势”

大数据产业创新服务媒体 ——聚焦数据 · 改变商业随着2024年的到来，我们站在了人工智能发展的新十字路口，大模型技术不仅突破了以往的限制，更开启了未来可能性的新篇章。在这个关键时刻，我们预见到了一系列颠覆性的发展趋势，它们不...

AIGC 2024-01-23 人工智能

935阅读

爆肝整理全网最全最新AI生成算法【Stable Diffusion｜Diffusion Model｜DallE2｜CLIP｜VAE｜VQGAN】原理解析

1、生成模型首先回顾一下生成模型要解决的问题：如上图所示，给定两组数据z和x，其中z服从已知的简单先验分布π(z （通常是高斯分布），x服从复杂的分布p(x （即训练数据代表的分布），现在我们想要找到一个变换函数f，它能建立一种z到x的映射f:z...

生成式AI 2024-01-23 人工智能

1469阅读

人工智能实战：Stable Diffusion技术分享

背景 Stable Diffusion是计算机图形学和可视化领域中的一项重要技术。在这篇分享中，我们将深入探讨稳定扩散的原理、关键要素和实施步骤，通过了解Stable Diffusion的流程化，我们可以提升自身的设计能力和创造力，为公司和个...

生成式AI 2024-01-23 人工智能

1043阅读

LLaMa 原理+源码——拆解 (KV-Cache, Rotary Positional Embedding, RMS Norm, Grouped Query Attention, SwiGLU)

原理 Vanilla Transformer 与 LLaMa 的区别 Embedding RMS Norm Rotary Positional Encodding SwiGLU Function KV-Cache Grouped Mult...

大数据 2024-01-22 人工智能

2129阅读

UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官

近日，UCLA等机构的研究人员推出了具身智能大模型MultiPLY，该模型不仅具备多模态感知能力，包括触觉、视觉、听觉等，使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。 MultiPLY在多任务实验中表...

AIGC 2024-01-22 人工智能

964阅读

逆天了！UniVision：BEV检测和Occupancy联合统一框架，双任务SOTA！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&个人理解最近这几年以视觉为中心的3D感知在自动驾驶中得到了快速发展。尽管3D感知模型在结构和概念上有许多相似之处，但在特征表示、数据格式和目标方面仍存在差距，这对统一高效的3D感知...

AIGC 2024-01-22 人工智能

859阅读

视觉Mamba模型的Swin时刻，中国科学院、华为等推出VMamba

Transformer 在大模型领域的地位可谓是难以撼动。不过，这个AI 大模型的主流架构在模型规模的扩展和需要处理的序列变长后，局限性也愈发凸显了。Mamba的出现，正在强力改变着这一切。它优秀的性能立刻引爆了AI圈。上周四， Vision Mamb...

人工智能 2024-01-22 人工智能

931阅读

ActAnywhere体验入口 AI自动视频背景生成工具在线使用地址

ActAnywhere是一个用于自动生成与前景主体运动和外观相符的视频背景的生成模型。该任务涉及合成与前景主体运动和外观相一致的背景，同时也符合艺术家的创作意图。ActAnywhere利用大规模视频扩散模型的力量，并专门定制用于此任务。ActAnywher...

人工智能 2024-01-22 人工智能

875阅读

AIGC的初识

?欢迎来到自然语言处理的世界 ?博客主页：卿云阁 ?欢迎关注?点赞?收藏⭐️留言? ?本文由卿云阁原创！ ?首发时间：?2023年12月26日? ✉️希望可以和大家一起完成进阶之路！ ?作者水平很有限，如果发现错误，请留言轰炸哦！万分...

人工智能 2024-01-22 人工智能

890阅读

网络安全人士必知的AI专业术语

随着人工智能的迅猛发展，我们正置身于第四次工业革命的浪潮中。在这个数字化的时代，网络安全成为各行业至关重要的议题。作为网络安全从业人员，不仅需要熟练掌握传统安全领域的知识，更需要深刻理解和运用人工智能，以在风云变幻的网络战场中保护信息资产。人工智能不仅为...

大数据 2024-01-22 人工智能

1257阅读

针对特定领域较小的语言模型是否与较大的模型同样有效?

经过2023年的发展，大语言模型展示出了非常大的潜力，训练越来越大的模型成为有效性评估的一个关键指标，论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...

AIGC 2024-01-22 人工智能

784阅读

AI绘画创作，训练Lora模型绘制你心中的童年爱豆漫画

从零开始，教你如何塑造完美动漫人物Lora模型 1.整合包下载首先是去秋叶大佬那里下载一键训练包，这样我们的训练就相当简单，解压包以后先更新，后启动。秋叶大神百度网盘包：百度网盘请输入提取码提取码：p8uy 秋叶...

大数据 2024-01-22 人工智能

1586阅读

谷歌 DeepMind 推出 AlphaGeometry：奥林匹克级几何AI系统

谷歌旗下的DeepMind研究团队最近推出了名为AlphaGeometry的人工智能系统，该系统在解决几何奥林匹克问题方面表现出色，几乎可与人类金牌得主相媲美。这一成就代表着在大学预科数学困难领域中复杂自动推理能力的显著进步。几何奥林匹克问题一直以来都被...

生成式AI 2024-01-22 人工智能

758阅读

Agent触摸汉堡辨冷热，首次拥有类人感官！UCLA等发布3D多模态交互具身智能大模型

具身智能，是大模型未来应用的一个重要方向。现在，大模型加持下的智能体，能够参与3D环境，不仅有了听觉视觉，还有了触觉等多种感官能力。卧室里有什么物体，一眼辨认。听到门铃响了，LLM便会告诉你家里来客人了。大模型加持的NPC，在触摸桌子的香蕉后，...

大数据 2024-01-22 人工智能

1070阅读

关于AI的风险企业需要知道的事

Thales的全球副总裁Ashvin Kamaraju深入探讨了人们对AI风险的日益担忧，随着企业拥抱AI，他解释了最大的风险，并概述了领导者保护其AI生态系统的战略方法。广泛可用的GenAI平台和工具的兴起，促使企业的决策者评估该技术在其堆栈中的哪...

人工智能 2024-01-22 人工智能

1002阅读

部署新思路 | Minuet：在 GPU 上加速 3D 稀疏卷积

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Minuet: Accelerating 3D Sparse Convolutions on GPUs 论文链接：https://arxiv.org/pdf/2401.06145.pdf 代码...

生成式AI 2024-01-22 人工智能

795阅读

AIGC内容分享(二十)：「AI视频生成」技术核心基础知识和模型应用

目录何为AI视频？一、技术发展概况二、代表模型及应用三、仍存在许多技术难点何为AI视频？「AI视频」通常指的是由人工智能（AI）技术生成或处理的视频。这可能包括使用深度学习、计算机视觉和其他相关技术来改善视频的质...

人工智能 2024-01-22 人工智能

2733阅读

Pika、Gen-2、ModelScope、SEINE……AI视频生成哪家强？这个框架一测便知

AI 视频生成，是最近最热门的领域之一。各个高校实验室、互联网巨头 AI Lab、创业公司纷纷加入了 AI 视频生成的赛道。Pika、Gen-2、Show-1、VideoCrafter、ModelScope、SEINE、LaVie、VideoLDM 等视...

人工智能 2024-01-22 人工智能

960阅读

Llama 2打败GPT-4！Meta让大模型自我奖励自迭代，再证合成数据是LLM终局

Llama 2-70B一夜之间打败GPT-4，让整个AI社区为之震惊！甚至，在AlpacaEval 2.0排行榜中，微调后的模型胜率完全碾压Claude 2、Gemini Pro等模型。 Meta和NYU研究团队究竟提出了什么秘制配方，才能让Llam...

生成式AI 2024-01-22 人工智能

842阅读

一文读懂Llama 2（从原理到实战）

文章目录简介实战：微调Llama 2 在线体验参考简介 Llama 2，是Meta AI正式发布的最新一代开源大模型。 Llama 2训练所用的token翻了一倍至2万亿，同时对于使用大模型最重要的上下文长度限制，Lla...

大数据 2024-01-22 人工智能

1030阅读

Video-LLaMA 论文精读

Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding video-LLaMA 一种用于视频理解的指令调整视听语言模型引言 ...

大数据 2024-01-22 人工智能

970阅读

英伟达新对话QA模型准确度超GPT-4，却遭吐槽：无权重代码意义不大

昨天，Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天，英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下，在 10...

人工智能 2024-01-22 人工智能

850阅读

LLaMA Board: 通过一站式网页界面快速上手 LLaMA Factory

原文：https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md ? 加入我们的微信群。 [ English | 中文 ] LLaMA Board: 通过一站式网页界面快速上手...

大数据 2024-01-21 人工智能

1065阅读

LCM-LoRA：通用stable diffusion 加速模块！2023.11.13顶会论文速递！

整理：AI算法与图像处理欢迎关注公众号 AI算法与图像处理，获取更多干货：推荐微信交流群现已有2000+从业人员交流群，欢迎进群交流学习，微信：nvshenj125 B站最新成果demo分享地址：https://s...

大数据 2024-01-21 人工智能

1055阅读

Dreambooth Stable Diffusion始化训练环境（AutoDL）

以AutoDL为例以下代码源自：赛博华佗——秋叶： Akegarasu 环境选择 Miniconda: Miniconda是一个轻量级的Conda环境管理系统。它包含了conda、Python和一些常用...

大数据 2024-01-21 人工智能

1441阅读

AIGC｜手把手教你进行ChatGLM模型部署实践

一、背景介绍模型部署基本步骤分为模型选择、模型部署、运行，如果需要在特定的场景下定制化模型，则还需要进行数据集的选择、数据集格式转换、微调。根据上述的步骤本教程选取如下的开源模型、数据集，来对医疗场景下进行定制化模型部署。当然模型部署对G...

AIGC 2024-01-21 人工智能

1054阅读

AIGC中的视觉生成文献整理

文章目录文件夹文献总览图像生成技术视频生成技术 Video Generation with Text Condition Video Generation with other Conditions Video Editing 生成模...

大数据 2024-01-21 人工智能

1174阅读

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新的震撼。在新方法中，作者...

人工智能 2024-01-21 人工智能

812阅读