数据集第44页 - AIGC资讯

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。在 AAAI 2...

人工智能 2024-01-13 人工智能

949阅读

LLMs模型速览（GPTs、LaMDA、GLM/ChatGLM、PaLM/Flan-PaLM、BLOOM、LLaMA、Alpaca）

文章目录一、 GPT系列 1.1 GPTs（OpenAI，2018——2020） 1.2 InstructGPT（2022-3） 1.2.1 算法 1.2.2 损失函数 1.3 ChatGPT（2022.11.30） 1.4 ChatG...

AIGC 2024-01-09 人工智能

1218阅读

蚂蚁营销推荐场景上的因果纠偏方法

一、因果纠偏的背景 1、偏差的产生推荐系统里根据收集的数据来训练推荐模型，给用户推荐一个合适的 item，当用户与这个 item 产生交互后，数据又会被收集用于继续训练模型，从而形成一个闭环。但是这个闭环当中可能会存在各种各样的影响因素，因此会产生误差...

生成式AI 2024-01-09 人工智能

821阅读

Textual Inversion: 一种精调Stable Diffusion模型的方法

引言最近的文本到图像Stable Diffusion （SD）模型已经证明了使用文本提示合成新颖场景的前所未有的能力。这些文本到图像的模型提供了通过自然语言指导创作的自由。然而，它们的使用受到用户描述特定或独特场景、艺术创作或新物理产品的能力的限制。...

生成式AI 2024-01-09 人工智能

1017阅读

Whisper OpenAI开源语音识别模型

介绍 Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练...

大数据 2024-01-09 人工智能

1821阅读

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍! 而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型（LargeLM）就能摇身一变，成为LongLM。近日，来自得克萨斯农...

人工智能 2024-01-08 人工智能

770阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1925阅读

AIGC之文本内容生成概述（下）——Transformer

在上一篇文章中，我们一口气介绍了LSTM、Word2Vec、GloVe、ELMo等四种模型的技术发展，以及每种模型的优缺点与应用场景，全文超过一万字，显得冗长且繁杂，在下文部分我们将分开介绍Transformer、BERT、GPT1/GPT2/GPT3/C...

生成式AI 2024-01-08 人工智能

991阅读

2024年大数据行业预测（二）

大数据数字化转型投资将成为2024年首席信息官议程上的优先事项，特别是在通货膨胀不断上升的情况下，因为这将允许更大的风险管理、降低成本和改善客户体验。此外，根据我们今年看到的趋势，在生成人工智能方面也会有持续的投资。在评估我们最初的业务需求和目标时，...

AIGC 2024-01-08 人工智能

886阅读

学习实践-Whisper语音识别模型实战（部署+运行）

1、Whisper内容简单介绍 OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）...

生成式AI 2024-01-08 人工智能

1078阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1058阅读

使用LLaMA-Factory微调ChatGLM3

1、创建虚拟环境略 2、部署LLaMA-Factory （1）下载LLaMA-Factory https://github.com/hiyouga/LLaMA-Factory （2）安装依赖 pip3 install -r requi...

人工智能 2024-01-08 人工智能

1394阅读

单帧标注视频就能学到片段特征，达到全监督性能！华科拿下时序行为检测新SOTA

如何从一段视频中找出感兴趣的片段？时序行为检测（Temporal Action Localization，TAL）是一种常用方法。利用视频内容进行建模之后，就可以在整段视频当中自由搜索了。而华中科技大学与密歇根大学的联合团队最近又为这项技术带来了新的...

人工智能 2024-01-08 人工智能

785阅读

Stable Diffusion 超详细讲解

Stable Diffusion 超详细讲解这篇文章是《Stable Diffusion原理详解》的后续，在《Stable Diffusion原理详解》中我更多的是以全局视角讲解了 Stable Diffusion 的原理和工作流程，并未深入步骤细...

人工智能 2024-01-08 人工智能

1063阅读

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将一幅图像转换为3D的方法通常采用Score Distillation Sampling（SDS）的方法，尽管结果令人印象深刻，但仍然存在多个不足之处，包括多视角不一致、过度饱和、过度平滑的纹理，以及生成速度缓慢等问题。为了解决这些问题，北京大学、新加坡...

AIGC 2024-01-08 人工智能

825阅读

微软祭出代码大模型WaveCoder！四项代码任务两万个实例数据集，让LLM泛化能力飙升

用高质量数据集进行指令调优，能让大模型性能快速提升。对此，微软研究团队训练了一个CodeOcean数据集，包含了2万个指令实例的数据集，以及4个通用代码相关任务。与此同时，研究人员微调了一个代码大模型WaveCoder。论文地址：https://...

大数据 2024-01-08 人工智能

869阅读

一文速览扩散模型优化过程：从DDPM到条件生成模型Stable Diffusion

文章目录 1、扩散模型简介 - Diffusion Model 2、最简单的扩散模型 - DDPM 前向加噪过程逆向去噪过程训练与推理流程模型优缺点 3、减少扩散模型的采样步骤 - DiffusionGAN 分析高斯分布、采样步长...

人工智能 2024-01-08 人工智能

2442阅读

文心一言没有体验上，看看讯飞星火认知大模型

目录前言正文 1.简单对话环节 1.1什么是讯飞星火认知大模型 1.2你都可以干一些什么 1.3你的训练数据库还在持续更新么 1.4今天是哪一天 1.5宇宙中有哪些目前认为可能存在生命的星球 2.辅助学习对话 2.1我想完成一篇...

大数据 2024-01-08 人工智能

1138阅读

AI解读视频张口就来？这种「幻觉」难题Vista-LLaMA给解决了

近年来，大型语言模型如 GPT、GLM 和 LLaMA 等在自然语言处理领域取得了显著进展，基于深度学习技术能够理解和生成复杂的文本内容。然而，将这些能力扩展到视频内容理解领域则是一个全新的挑战 —— 视频不仅包含丰富多变的视觉信息，还涉及时间序列的动态...

AIGC 2024-01-08 人工智能

931阅读

吃了几个原作者才能生成这么逼真的效果？文生图涉嫌视觉「抄袭」

不久之前，《纽约时报》指控 OpenAI 涉嫌违规使用其内容用于人工智能开发的事件引起了社区极大的关注与讨论。 GPT-4 输出的许多回答中，几乎逐字逐句地抄袭了《纽约时报》的报道：图中红字是 GPT-4 与《纽约时报》报道重复的部分。对此，各个专...

人工智能 2024-01-08 人工智能

870阅读

Neuroid官网体验入口 AI动画生成及3D建模工具软件app免费下载地址

Neuroid是一个基于人工智能的3D建模和动画生成工具，它允许用户通过简单快捷的操作将创意转化为复杂的3D模型和动画，从而提高创作效率。利用生成对抗网络的强大能力，Neuroid在3D运动设计领域实现了革新。它可以分析大量的数据集，学习各种运动模式，为设...

生成式AI 2024-01-08 人工智能

927阅读

告别逐一标注，一个提示实现批量图片分割，高效又准确

Segment Anything Model (SAM 的提出在图像分割领域引起了巨大的关注，其卓越的泛化性能引发了广泛的兴趣。然而，尽管如此，SAM 仍然面临一个无法回避的问题：为了使 SAM 能够准确地分割出目标物体的位置，每张图片都需要手动提供一...

生成式AI 2024-01-08 人工智能

835阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

828阅读

使用PyTorch实现去噪扩散模型

在深入研究去噪扩散概率模型(DDPM 如何工作的细节之前，让我们先看看生成式人工智能的一些发展，也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中，编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进...

人工智能 2024-01-08 人工智能

820阅读

文心一言正式对标GPT-4，是青铜还是王者？

昨天，OpenAI正式发布GPT-4模型号称史上最先进的AI系统今天，百度文心一言在万众瞩目中闪亮登场这款产品被视为中国版ChatGPT 在这一个多月内备受关注文心一言某种程度上具有了对人类意图的理解能力回答的准确性、逻辑性、流畅性都...

生成式AI 2024-01-08 人工智能

782阅读

专为数据库打造：DB-GPT用私有化LLM技术定义数据库下一代交互方式

2023 年 6 月，蚂蚁集团发起了数据库领域的大模型框架 DB-GPT。DB-GPT 通过融合先进的大模型和数据库技术，能够系统化打造企业级智能知识库、自动生成商业智能（BI）报告分析系统（GBI），以及处理日常数据和报表生成等多元化应用场景。DB-G...

大数据 2024-01-08 人工智能

878阅读

2024年大数据行业预测（一）

分析随着全渠道商务的发展，广告分析领域将发生翻天覆地的变化。线上和线下消费者互动之间的传统孤岛正在瓦解，为真正的全渠道消费者铺平了道路。虽然实体/数字围墙在消费者的旅程中逐渐倒塌，但围墙花园和消费者隐私问题仍将凸显，使分析变得复杂。全渠道消费者的增长...

AIGC 2024-01-08 人工智能

815阅读

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发，是语音识别领域的一大...

人工智能 2024-01-08 人工智能

969阅读

MongoDB携手亚马逊云科技优化Amazon CodeWhisperer建议，助力开发者在MongoDB上构建应用程序

MongoDB (NASDAQ: MDB 和亚马逊 (NASDAQ: AMZN 旗下的亚马逊云科技（AWS）今日宣布，双方正在协作优化Amazon CodeWhisperer，为在MongoDB上的应用程序开发和改进工作提供更好的建议和支持。Mongo...

人工智能 2024-01-08 人工智能

823阅读

Neuroid：输入文本提示就能快速创建复杂的AI 3D动画

近日，一家名为Nation A的初创公司以其创新性的生成式人工智能技术Neuroid。动画制作一直是一个繁琐、复杂且昂贵的过程，而现在，Nation A的人工智能技术有望彻底改变这一局面。该公司的人工智能可以根据类似GPT的文本提示生成人形角色和四条腿的动...

人工智能 2024-01-08 人工智能

913阅读

SparseOcc：全稀疏3D全景占用预测（语义+实例双任务）

本文经自动驾驶之心公众号授权转载，转载请联系出处。论文：Fully Sparse 3D Panoptic Occupancy Prediction 链接：https://arxiv.org/pdf/2312.17118.pdf 这篇论文的出发点是什么...

AIGC 2024-01-08 人工智能

919阅读

何为交互感知？全面回顾自动驾驶中的社会交互动态模型与决策前沿！

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解交互感知自动驾驶（IAAD）是一个迅速发展的研究领域，专注于开发能够与人类道路使用者安全、高效交互的自动驾驶车辆。这是一项具有挑战性的任务，因为它要求自动驾驶车辆能够理...

AIGC 2024-01-08 人工智能

1052阅读

AIGC 综述 2023：A History of Generative AI from GAN to ChatGPT

GAI：发展历史，核心技术，应用领域以及未来发展摘要 1、引言 1.1、主要贡献 1.2、组织结构 2、生成式AI的发展历史 2.1、NLP领域的发展 2.2、CV领域的发展 2.3、CV与NLP的融合 3、AIGC的核心技术基础...

人工智能 2024-01-08 人工智能

1421阅读

AI人工智能大模型讲师叶梓《基于人工智能的内容生成（AIGC）理论与实践》培训提纲

【课程简介】本课程介绍了chatGPT相关模型的具体案例实践，通过实操更好的掌握chatGPT的概念与应用场景，可以作为chatGPT领域学习者的入门到进阶级课程。【课程时长】 1天（6小时/天）【课程对象】理工科本...

生成式AI 2024-01-08 人工智能

811阅读

深入浅出讲解Stable Diffusion原理，新手也能看明白

说明最近一段时间对多模态很感兴趣，尤其是Stable Diffusion，安装了环境，圆了自己艺术家的梦想。看了这方面的一些论文，也给人讲过一些这方面的原理，写了一些文章，具体可以参考我的文章：北方的郎：图文匹配：Clip模型介绍北方的郎：VQ...

人工智能 2024-01-08 人工智能

815阅读

Meta最新模型LLaMA详解（含部署+论文）

来源：投稿作者：毛华庆编辑：学姐前言本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。文章标题：LLaMA: Open and Efficient Foundation Language Mode...

大数据 2024-01-08 人工智能

964阅读

【stable diffusion LORA训练】改进lora-scripts，命令行方式训练LORA，支持SDXL训练

分享下自己改进的一个lora训练脚本，在ubuntu下如果SD-WEBUI的环境已经搭好的话，只需要下载lora-script就可以支持训练了，直接命令行方式训练。首先，我们需要克隆下项目： git clone https://github.com/...

生成式AI 2024-01-08 人工智能

2332阅读

浅谈文心一言与ChatGPT

最近，随着谷歌研发的ai聊天机器人bard的测试，关于这方面的讨论也是愈演愈烈虽然与GPT与newbing相同，bard也有一些小小的门槛才能访问，而根据外媒的报道，bard在体验上似乎还略逊一筹而让我们把目光转回来，再来看看...

人工智能 2024-01-08 人工智能

986阅读

1张图2分钟转3D！纹理质量、多视角一致性新SOTA｜北大出品

只需两分钟，玩转图片转3D！还是高纹理质量、多视角高一致性的那种。不管是什么物种，输入时的单视图图像还是这样婶儿的：两分钟后，3D版大功告成： △上，Repaint123（NeRF）；下，Repaint123（GS）新方法名为Repaint...

AIGC 2024-01-08 人工智能

798阅读

Make-A-Video（造啊视频）——无需文字-视频数据的文字转视频（文生视频）生成方法

AIGC 2024-01-07 人工智能

1591阅读

少年侠客【InsCode Stable Diffusion美图活动一期】

少年侠客【InsCode Stable Diffusion美图活动一期】文章目录 Stable Diffusion 模型在线使用地址第一张图第二张图第三张图第四张图第五张图第六章图一、InsCode Stable Di...

生成式AI 2024-01-07 人工智能

860阅读

检测脸部情绪有多难？10行代码就可以搞定！

面部表情展示人类内心的情感。它们帮助我们识别一个人是愤怒、悲伤、快乐还是正常。医学研究人员也使用面部情绪来检测和了解一个人的心理健康。人工智能在识别一个人的情绪方面可以发挥很大的作用。在卷积神经网络的帮助下，我们可以根据一个人的图像或实时视频来识别他...

大数据 2024-01-07 人工智能

833阅读

Stable Diffusion这样的文本-图像生成模型有记忆吗？

Stable Diffusion扩散模型作为生成高质量图像的先进模型，却伴随着对训练数据的记忆化倾向，引发了隐私和安全性的担忧。AIGCer分享一篇分析该现象的文章，通过两个案例研究深入挖掘了文本复制现象，旨在为未来生成模型的改进提供重要的指导。基于扩...

AIGC 2024-01-07 人工智能

861阅读

AI测出你几岁死亡？Transformer「算命」登Nature子刊，成功预测意外死亡

【新智元导读】AI算命将可以预测人类的意外死亡?丹麦科学家用全国600万人的公开数据训练了一个基于Transformer的模型，成功预测了意外死亡和性格特点。 AI真的可以用来科学地算命了!? 丹麦技术大学（DTU）的研究人员声称他们已经设计出一种人工...

大数据 2024-01-07 人工智能

769阅读

2023年AIGC发展回顾与展望

2023年是人工智能内容生成（AIGC）技术飞速发展的一年。从年初ChatGPT一炮打响，大家纷纷加入到大模型研究之中。期间Midjourney和Stable Diffusion AI绘画技术持续火热，基于AIGC类的应用也如雨后春笋般遍地...

AIGC 2024-01-07 人工智能

1154阅读

【AI】Stable-Diffusion-WebUI使用指南

注：csdn对图片有审核，审核还很奇葩，线稿都能违规，为保证完整的阅读体验建议移步至个人博客阅读最近AI绘画实现了真人照片级绘画水准，导致AI绘画大火，公司也让我研究研究，借此机会正好了解一下深度学习在AIGC(AI Generated Content...

人工智能 2024-01-07 人工智能

1038阅读

基于Stable Diffusion的AIGC服饰穿搭实践

本文主要介绍了基于Stable Diffusion技术的虚拟穿搭试衣的研究探索工作。文章展示了使用LoRA、ControlNet、Inpainting、SAM等工具的方法和处理流程，并陈述了部分目前的实践结果。通过阅读这篇文章，读者可以了...

人工智能 2024-01-07 人工智能

1443阅读

AI绘画：Lora模型训练完整流程！

关于AI绘画(基于Stable Diffusion Webui ，我之前已经写过三篇文章，分别是软件安装，基本的使用方法，微调模型LoRA的使用。整体来说还是比简单的，搞个别人的模型，搞个提示词就出图了。今天来一个有些难度的，自己训练一个LoRA微...

AIGC 2024-01-07 人工智能

1969阅读

[玩转AIGC]如何训练LLaMA2（模型训练、推理、代码讲解，并附可直接运行的kaggle连接）

目录一、clone仓库二、数据集下载与处理 1、数据集下载 2、数据集标记化（耗时较长）三、修改配置四、开始训练五、模型推理六、train.py训练代码讲解 1、导包 2、定义模型训练参数与相关设置 3、加载模型配置 4、迭代...

AIGC 2024-01-07 人工智能

1106阅读

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完。

一杯奶茶，成为 AIGC+CV 视觉前沿弄潮儿！ 25个方向！CVPR 2022 GAN论文汇总 35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2020...

人工智能 2024-01-07 人工智能

1280阅读