多样性第20页 - AIGC资讯

微软提出变色龙框架，让模型自带工具箱开挂，数学推理任务准确率98%

教大模型调用工具，已经是AI圈关注度最高的话题之一了。这不，又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon（变色龙）的框架，号称能将大语言模型直接变成魔法师的工具箱，来自微软与加州大学洛杉矶分校（UCLA）。相比其它...

大数据 2023-12-13 人工智能

868阅读

首次超过70% mAP！GeMap：局部高精地图SOTA再次刷新

本文经自动驾驶之心公众号授权转载，转载请联系出处。写在前面&笔者的个人理解实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要，可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展，在线向量化高精地图构建逐渐兴起，代表性...

人工智能 2023-12-13 人工智能

872阅读

什么是AIGC（AI Generated Content, 人工智能生成内容）？

AI生成内容（AIGC，人工智能生成内容）是一种新型的内容创作方式，它继承了专业生产内容（PGC，Professional-generated Content）和用户生成内容（UGC，User-generated Content）的优点，并充分发挥技术优势...

人工智能 2023-12-12 人工智能

988阅读

Bard AI：训练过程中使用了多少数据？

近年来，人工智能取得了长足的进步，并在科技界掀起了波澜。随着谷歌最近推出新的人工智能聊天机器人 Bard，人们对这项技术的工作原理以及训练它的内容感到好奇。人工智能技术的关键组成部分之一是训练过程中使用的数据量，这有助于它更好地理解语言、...

人工智能 2023-12-12 人工智能

910阅读

ChatGPT的训练数据可以通过“偏离攻击”进行泄露

ChatGPT等大语言模型（LLM）使用来自图书、网站及其他来源的海量文本数据进行训练，通常情况下，训练它们所用的数据是一个秘密。然而，最近的一项研究揭示：它们有时可以记住并反刍训练它们所用的特定数据片段。这个现象名为“记忆”。随后，来自谷歌Deep...

生成式AI 2023-12-12 人工智能

809阅读

UCLA推出Chameleon框架大模型表格数学推理准确率达98.78%

在NeurIPS2023上，UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具，包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块，解决了大型语言模型在实时信息获取和数学推理方面的不足。 Chameleon的核...

人工智能 2023-12-12 人工智能

841阅读

表格数学推理准确率达98.78%！UCLA推出全新「变色龙推理框架」

在自然语言处理任务中取得显著成就的大型语言模型（LLMs）尽管表现出色，但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。为了应对这些挑战，来自UCLA等机构的研究人员打造了全新的Chameleon框架，其独特的即插即用模型融合了多种工具，包括...

大数据 2023-12-12 人工智能

847阅读

阿里又整活儿：一张人脸一句话就能跳《擦玻璃》，服装背景随意换！

继AnimateAnyone之后，阿里又一项“舞蹈整活儿”论文火了—— 这一次，只需一张脸部照片、一句话描述，就能让你在任何地方跳舞！例如下面这段《擦玻璃》的舞蹈视频：图片你所需要做的就是“投喂”一张人像，以及一段prompt：一个女孩，微笑着，...

大数据 2023-12-12 人工智能

823阅读

当GPT-4V充当机器人大脑，可能你都没AI会规划

GPT-4V 已经能帮我们设计网站代码，控制浏览器，这些应用集中在虚拟数字世界中。假如我们把 GPT-4V 带入现实世界，让它作为控制机器人的大脑，会有什么有趣的结果呢？最近，来自清华大学交叉信息研究院的研究者提出「ViLa」算法，实现了让 GPT-4...

大数据 2023-12-12 人工智能

811阅读

胜率达94.08%！李开复Yi-34B最新成绩超过LLaMA2等主流大模型

近期，李开复的Yi-34B-Chat模型在多个评测中大放异彩。其94.08%的胜率超越了LLaMA2和ChatGPT等主流大模型，尤其在加州大学伯克利分校主导的LMSYS ORG排行榜中，以1102的Elo评分追平了GPT-3.5。此外，在中文SuperC...

AIGC 2023-12-11 人工智能

832阅读

直追GPT-4！李开复Yi-34B新成绩公布：94.08%的胜率超越LLaMA2等主流大模型

仅次于GPT-4，李开复零一万物Yi-34B-Chat最新成绩公布—— 在Alpaca经认证的模型类别中，以94.08%的胜率，超越LLaMA2 Chat 70B、Claude 2、ChatGPT！图片不仅如此，在加州大学伯克利分校主导的LMSYS...

人工智能 2023-12-11 人工智能

896阅读

你真的看懂扩散模型(diffusion model)了吗？(从DALL·E 2讲起，GAN、VAE、MAE都有)

本文全网原创于CSDN：落难Coder ，未经允许，不得转载！扩散模型简单介绍我们来讲一下什么是扩散模型，如果你不了解一些工作，你可能不清楚它究竟是什么。那么我举两个例子说一下：AI作画（输入一些文字就可以得到与你描述相符的图像）和抖音大火的...

大数据 2023-12-10 人工智能

1071阅读

Learn Prompt-Midjourney 图片生成

简介随着 ChatGPT 的爆火，越来越多的人开始关注并尝试 AI 相关的应用。而图片生成就是其中一个备受瞩目的领域。目前已经有许多图像生成工具，如 Midjourney，Stable Diffusion，DALL-E，Firefly等。本课程主要是以...

大数据 2023-12-10 人工智能

1078阅读

【多模态】5、BLIP | 统一理解与生成任务为图像生成更高质量的文本描述

文章目录一、背景二、方法 2.1 模型结构 2.2 Pre-training Objectives 2.3 CapFilt 三、效果 3.1 训练细节 3.2 CapFilt 的效果 3.3 样本多样性是文本合成器的关键 3.4 参数...

AIGC 2023-12-09 人工智能

2037阅读

更强的Llama 2开源，可直接商用：一夜之间，大模型格局变了

已上微软 Azure，即将要上 AWS、Hugging Face。一夜之间，大模型格局再次发生巨变。一直以来 Llama 可以说是 AI 社区内最强大的开源大模型。但因为开源协议问题，一直不可免费商用。今日，Meta 终于发布了大家期待...

生成式AI 2023-12-09 人工智能

858阅读

【AI绘画】Stable Diffusion的介绍及程序示例

Stable Diffusion 1.背景 2.StableD 的原理 3.StableD 的应用 3.1.如何使用 StableD 进行图像生成 3.2 图像生成与编辑 3.2.1 生成新图像 3.2.2 图像编辑 1.背...

AIGC 2023-12-08 人工智能

838阅读

视觉CV-AIGC一周最新技术精选(2023-11)

PG-Video-LLaVA: Pixel Grounding Large Video-Language Models https://github.com/mbzuai-oryx/Video-LLaVA 将基于图像的大型多模态模型（LMM）扩...

生成式AI 2023-12-08 人工智能

833阅读

Imagine with Meta AI官网体验入口 AI文生图工具软件app免费下载地址

《Imagine with Meta AI》是一款利用AI技术的图片生成工具。用户只需通过语音描述所想要的画面，该工具就能自动生成相应的图片。这一创新功能为用户提供了丰富多样的创作可能性。目前，该产品仍处于内测阶段，用户需要登录后才能使用生成功能。那么，想...

AIGC 2023-12-07 人工智能

1167阅读

2023年度AI领域的六大顶级投资者

在当前的创业环境中，利用人工智能（AI）的公司数量显着增加。在今年出现的十家独角兽公司中，有六家是基于人工智能的初创公司。这一趋势在业界引起了巨大的轰动，现有的人工智能初创公司的估值也出现了显着的飙升。这些发展凸显了人工智能在当前商业环境中的重要性...

人工智能 2023-12-07 人工智能

815阅读

谷歌CEO皮查伊深度解析谷歌史上最强大模型Gemini及即将到来的人工智能时代

12月7日消息，美国当地时间周三，谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊（Sundar Pichai）的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2...

AIGC 2023-12-07 人工智能

951阅读

Stable Diffusion：开启AI魔法绘画的无限可能

? 个人网站:【海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴，请点击【全栈技术交流群】随着人工智能技术的蓬勃发展，图像生成和艺术创作领域掀起了一股新的浪潮。在这股浪潮中，St...

生成式AI 2023-12-07 人工智能

881阅读

Meta语音达LLaMA级里程碑！开源MMS模型可识别1100+语言

【新智元导读】Meta的大规模多语言语音（MMS）项目将彻底改变语音技术，使用wav2vec 2.0的自监督学习，MMS将语音技术扩展到1100到4000种语言。在语音方面，Meta又达到了另一个LLaMA级的里程碑。今天，Me...

生成式AI 2023-12-07 人工智能

871阅读

AIGC产业研究报告 2023——图像生成篇

易观：今年以来，随着人工智能技术不断实现突破迭代，生成式AI的话题多次成为热门，而人工智能内容生成（AIGC）的产业发展、市场反应与相应监管要求也受到了广泛关注。为了更好地探寻其在各行业落地应用的可行性和发展趋势，易观对AIGC产业进行了探索并将发布AIG...

AIGC 2023-12-06 人工智能

797阅读

AI文生视频，会在明年迎来“GPT时刻”

在当下的AI赛道上，AI生文、生图的应用，早已层出不穷，相关的技术，也在不断日新月异。而与之相比，AI文生视频，却是一个迟迟未被“攻下”的阵地。抖动、闪现、时长太短，这一系列缺陷，让AI生成的视频只能停留在“图一乐”的层面，很难拿来使用，更不要说提供商...

AIGC 2023-12-06 人工智能

799阅读

【stable diffusion 小白最全详细使用教程+大模型资源】

文章目录一、前言二、安装 1.解压后点击启动器运行依赖，然后点击A启动器 2.更新本体和扩展 3.把controlnet1.1放入stable diffusion 中三、使用界面参数 1.提示词 2.采样和迭代步数 3.修...

大数据 2023-12-06 人工智能

1971阅读

Meta 、IBM等联合50多家公司结构成立 AI 联盟

标题:Meta 和 IBM 推出 AI 联盟 Meta Platforms 和 IBM 最近联合推出了一个名为 AI 联盟的合作项目，该联盟由50多家人工智能公司和研究机构组成。这个联盟旨在推动一种被称为 “开放模型” 的人工智能发展方式，并希望在快速增...

AIGC 2023-12-05 人工智能

827阅读

大模型版“5年高考3年模拟”来了！6141道数学题，还是多模态的那种

大模型的“5年高考3年模拟”数学题来了，还是加强强强版！微软、加州大学洛杉矶分校（UCLA）、华盛顿大学（UW）联合打造全新多模态数学推理基准数据集。名为“MathVista”。涵盖各种题型共6141个问题，来源于28个现有的多模态数据集和3个新标...

生成式AI 2023-12-05 人工智能

888阅读

如何在企业中采用生成式人工智能

在企业中嵌入生成式人工智能的用例是什么?它如何帮助减轻重复性管理的负担?它的局限性是什么? 研究机构Gartner公司报告称，在过去三年，全球的风险投资公司在生成人工智能解决方案上投资了逾17亿美元。随着人工智能增强的聊天机器人风靡全球，这种情况只会急...

生成式AI 2023-12-05 人工智能

834阅读

成功实施人工智能的八个步骤

实施人工智能从来不是一件一劳永逸的事情，它需要广泛的战略，以及不断调整的过程。以下了解企业成功实施人工智能的一些关键的实施步骤，以帮助人工智能和机器学习充分发挥其潜力。人工智能和机器学习正从商业流行术语转向更广泛的企业应用。围绕战略和采用的努力让...

大数据 2023-12-05 人工智能

793阅读

开源语言大模型演进史：向LLaMA 2看齐

本文是开源 LLM 发展史系列文章的第三部分。此前，第一部分《开源语言大模型演进史：早期革新》回顾了创建开源 LLM 的最初尝试。第二部分《开源语言大模型演进史：高质量基础模型竞赛》研究了目前可用的最受欢迎的开源基础模型（即已进行预训练但尚未微...

大数据 2023-12-05 人工智能

865阅读

LLaMA模型微调版本：斯坦福 Alpaca 详解

项目代码：https://github.com/tatsu-lab/stanford_alpaca 博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html Alpaca 总览 Alpaca 是 L...

AIGC 2023-12-03 人工智能

797阅读

Pika1.0内测官网体验入口 AI视频制作软件app免费下载地址

《Pika》是一个视频制作平台，用户可以上传自己的创意想法，Pika会自动生成相关的视频。这个平台主要功能包括支持多种创意想法转视频、提供专业视频效果，同时操作简单易用。《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载...

人工智能 2023-12-03 人工智能

991阅读

专注图表理解，腾讯、南洋理工等开源图表羊驼大模型ChartLlama

在图像理解领域，多模态大模型已经充分展示了其卓越的性能。然而，对于工作中经常需要处理的图表理解与生成任务，现有的多模态模型仍有进步的空间。尽管当前图表理解领域中的最先进模型在简单测试集上表现出色，但由于缺乏语言理解和输出能力，它们无法胜任更为复杂的问答...

大数据 2023-12-03 人工智能

890阅读

SAM&Stable-Diffusion集成进化！分割、生成一切！AI绘画新玩法

自SAM「分割一切」模型推出之后，二创潮就开始了，有想法有行动！飞桨AI Studio开发者会唱歌的炼丹师就创作出SAM进化版，将SAM、Stable Diffusion集成，实现「分割」、「生成」能力二合一，并部署为应用，支持在线使用！在线免费...

人工智能 2023-12-03 人工智能

1059阅读

Pika1.0官网体验入口视频制作AI软件免费app下载地址

《Pika》是一个视频制作平台，用户可以上传自己的创意想法，Pika会自动生成相关的视频。它支持多种创意想法转化为视频，提供专业的视频效果，同时操作简单易用。该平台采用免费试用模式，主要面向创意者和视频爱好者。《Pika》在哪里可以体验呢?下面就给大家带来...

AIGC 2023-12-02 人工智能

788阅读

文本生成图像工作简述4--扩散模型、自回归模型、生成对抗网络的对比调研

基于近年来图像处理和语言理解方面的技术突破，融合图像和文本处理的多模态任务获得了广泛的关注并取得了显著成功。文本生成图像（text-to-image）是图像和文本处理的多模态任务的一项子任务，其根据给定文本生成符合描述的真实图像，具有巨大的应用潜力，如...

大数据 2023-12-02 人工智能

1274阅读

解锁机器学习-梯度下降：从技术到实战的全面指南

本文全面深入地探讨了梯度下降及其变体——批量梯度下降、随机梯度下降和小批量梯度下降的原理和应用。通过数学表达式和基于PyTorch的代码示例，本文旨在为读者提供一种直观且实用的视角，以理解这些优化算法的工作原理和应用场景。关注TechLead...

大数据 2023-12-01 人工智能

812阅读

美国作家协会发起生成式AI调查:保护作家权益与文学多样性

近日，为了解决人工智能生成图书和使用作家素材培训AI的日益关切，作家协会启动了一项公共调查。调查中提出的8个问题，涉及到是否需要作家同意将其作品用于构建和发展AI系统，以及是否应该给予相应的经济补偿。在一份声明中，作家协会指出:“一些公司擅自抓取数百万本...

大数据 2023-12-01 人工智能

803阅读

Smart Copilot：大模型在技术服务和智能客服领域提效的最佳实践

欢迎来到魔法宝库，传递AIGC的前沿知识，做有格调的分享❗ 喜欢的话记得点个关注吧！随着云计算技术的快速发展，越来越多的企业和个人选择将业务迁移到云端。有很多云厂商为客户提供了灵活、可扩展的计算资源和服务，使得客户能够更加专注于核心业务。然而，...

生成式AI 2023-12-01 人工智能

1021阅读

AI颠覆材料学！DeepMind重磅研究登Nature，预测220万晶体结构赢人类800年

陶哲轩一直看好，ChatGPT将颠覆数学证明，而如今，AI在化学领域的潜力同样深不可测。今天，220万种晶体结构完全被AI预测出来了。这是什么概念？相当于近800年的知识价值。谷歌DeepMind开发全新AI工具GNoME，能够预测新材料的稳定性，...

大数据 2023-12-01 人工智能

928阅读

百度视频推荐跨域多目标预估与融合的实践和思考

一、百度视频背景介绍 1、统一产品形态一方面，百度 APP 的所有视频场景已经升级成统一的沉浸式（上下滑）交互形态；另一方面，基于百度统一的大模型，我们打通了所有场景的数据和推荐体验。交互和数据的统一可以更好地实现生态共赢，促进百度视频的长远发展。...

人工智能 2023-12-01 人工智能

916阅读

AI制作视频——mov2mov以及inpaint

背景 AI制作视频的几种思路 1.从零开始生成：清华的cogview，runway gen-1、gen-2，微软的女娲这个思路，就是认为可以通过文字描述的方式把视频画面描述出来，通过对文本-视频帧内容-视频内容的数据对的平行语料的学习。学习到文本故...

AIGC 2023-12-01 人工智能

955阅读

生成式AI游戏开发平台Bitmagic公测，通过文本提示创建游戏

Bitmagic宣布其基于生成式AI的游戏开发平台已进入公测阶段，通过文本提示让玩家轻松创作3D游戏。这一平台是全球首个允许用户通过单一提示创建完全可玩游戏的系统。通过在文本提示中输入描述，玩家可以将创意交给Bitmagic，后者将根据文字内容生成完整可玩...

生成式AI 2023-11-30 人工智能

954阅读

人人都能用好大模型-结构化的Prompt让你轻松上手

Prompt，中文可以翻译为提示词，是一种用于引导大模型生成特定内容的文本输入。Prompt的作用是告诉大模型你想要它做什么，以及给它一些必要的信息和约束条件。Prompt的好坏直接影响了大模型的输出质量和效率。 Prompt的写作是一门艺术，也是一门科...

生成式AI 2023-11-30 人工智能

1039阅读

Midjourney 参数合集

探索Midjourney之旅，学习绘画与AI，一同成长。加入「阿杰与AI」公众号，参与内容社群建设。 1.Midjourney 新手快速起步指南 2.Prompts-提示指令 3.Explore Prompting-提示指令的探索 4.Blend-叠加...

生成式AI 2023-11-30 人工智能

1363阅读

AI测试｜史上最全，细数AIGC在测试领域落地的困难点

一、引言&背景自2022年由横空出世的ChatGPT引发的各类AIGC（Generative AI）爆发以来，人们对其在各个领域的应用潜力产生了极大的兴趣。在研发领域，各种研究已经证明了Github Copilot在研发效能提高上的积极作用。...

AIGC 2023-11-29 人工智能

1365阅读

【解锁未来】让微软Copilot介绍自己，再由ChatGPT润色文章，到底能成什么样？

文章目录前言 Copilot的介绍 ChatGPT 4.0 的润色总结前言今天突发奇想，如果让微软Copilot介绍自己，再由ChatGPT润色文章，到底能成什么样？ Copilot的介绍问：撰写关...

生成式AI 2023-11-29 人工智能

956阅读

调教文心一言生成 AI绘画提示词（Midjourney）

文章目录第一步第二步第三步第四步第五步第六步第七步第八步文心一言支持连续对话我瞎玩的非专业哈哈第一步你好，今天我们要用扩散模型创建图像。我会给你提供一些信息。行吗? 第二步...

生成式AI 2023-11-29 人工智能

1236阅读

中国团队开源大规模高质量图文数据集ShareGPT4V

中国团队最近开源了一个引人瞩目的图文数据集，命名为ShareGPT4V，它基于GPT4-Vision构建，训练了一个7B模型。这一举措在多模态领域取得了显著的进展，超越了同级别的模型。该数据集包含了120万条图像-文本描述数据，涵盖了世界知识、对象属性、...

大数据 2023-11-29 人工智能

906阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1452阅读