多样性第19页 - AIGC资讯

AI换脸视频怎么制作？Faceswapper.ai一键就能换脸

Faceswapper.ai 是一款专为追求快速面部交换的用户设计的高效工具。通过添加精致的动画层，该工具能够赋予普通图像诱人的魅力，而其主要优势在于其出色的简单性。使用Faceswapper.ai，用户只需轻松上传照片，接下来的转换过程完全由界面负责协...

AIGC 2023-12-27 人工智能

1242阅读

大模型+机器人，详尽的综述报告来了，多位华人学者参与

大模型的出色能力有目共睹，而如果将它们整合进机器人，则有望让机器人拥有一个更加智能的大脑，为机器人领域带来新的可能性，比如自动驾驶、家用机器人、工业机器人、辅助机器人、医疗机器人、现场机器人和多机器人系统。预训练的大型语言模型（LLM）、大型视觉 -...

AIGC 2023-12-27 人工智能

858阅读

秒懂AI-深度学习四种常用激活函数：Sigmoid、Tanh、ReLU和Softmax

深度学习中的激活函数是神经网络中至关重要的组成部分，它们为神经网络引入非线性特性，使其能够更好地学习和模拟复杂的输入输出关系。激活函数的选择和使用对于神经网络的性能和训练效果具有重要影响。本文将介绍四种常用的激活函数：Sigmoid、Tanh、ReLU...

大数据 2023-12-27 人工智能

839阅读

人脸识别技术演进：从几何算法到深度学习的深度剖析

本文全面探讨了人脸识别技术的发展历程、关键方法及其应用任务目标，深入分析了从几何特征到深度学习的技术演进。关注TechLead，分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实...

生成式AI 2023-12-27 人工智能

1011阅读

Python+AI实现AI绘画

? 运行环境：Python ? 撰写作者：左手の明天 ? 精选专栏：《python》 ? 推荐专栏：《算法研究》 ?#### 防伪水印——左手の明天 ####? ? 大家好???，我是左手の明天！好久不见? ?今天分享py...

人工智能 2023-12-25 人工智能

893阅读

AI视野：必应推出GPT-4Turbo模型；抖音测试“AI搜”功能；小红书内测AI聊天机器人；OpenAI计划新一轮融资

????大模型动态必应推出GPT-4Turbo模型微软推出Bing Chat的最新模型，GPT-4Turbo，为用户提供更准确和最新的信息。目前仅限部分用户试用，使用方法需通过检查资格确认。阿里团队推新AI模型I2VGen-XL 视频合成领域迎来...

人工智能 2023-12-25 人工智能

805阅读

一篇综述，看穿基础模型+机器人的发展路径

机器人是一种拥有无尽可能性的技术，尤其是当搭配了智能技术时。近段时间创造了许多变革性应用的大模型有望成为机器人的智慧大脑，帮助机器人感知和理解这个世界并制定决策和进行规划。近日，CMU 的 Yonatan Bisk 和 Google DeepMind...

大数据 2023-12-25 人工智能

859阅读

Stable Diffusion - Easy Diffusion 图像生成工具的环境配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131524075 版本v2.5.41 Stab...

大数据 2023-12-25 人工智能

1263阅读

阿里团队推新AI模型I2VGen-XL：单张静止图像就能生成高质量视频

视频合成最近取得了显著的进步，这得益于扩散模型的快速发展。然而，它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构，使得模型难以同时确保语义和定性的卓越性。阿里巴巴、浙江大学和华中科技大学的研究人员...

AIGC 2023-12-25 人工智能

786阅读

从新手到高手：AI绘画实战中的Midjourney

? 个人网站:【海拥】【神级代码资源网站】【办公神器】 ? 基于Web端打造的：?轻量化工具创作平台 ? 想寻找共同学习交流的小伙伴，请点击【全栈技术交流群】随着人工智能（AI）技术的飞速发展，AI绘画逐渐成为艺术领域的一项令人瞩目的技术。本文将...

AIGC 2023-12-23 人工智能

979阅读

LLaMA系列模型

1.LLama 1.1 简介 Open and Efficient Foundation Language Models (Open但没完全Open的LLaMA 2023年2月，Meta（原Facebook）推出了LLaMA大模型，使用了1.4...

生成式AI 2023-12-22 人工智能

916阅读

Stable diffusion的一些参数意义及常规设置

在线stabel Diffusion模型 https://huggingface.co/spaces/stabilityai/stable-diffusion随机种子 seed 如果想要同一个文本提示，生成多次都是同一图像，可以设置一个随机种子，类似于...

人工智能 2023-12-22 人工智能

1680阅读

实力强的大模型都有哪些超能力？

前几日，人工智能研究公司OpenAI CEO山姆·奥特曼（Sam Altman）在谈及人工智能这项技术的潜力以及人们对它的担忧时，曾表示“AI发展速度快得吓人，就像停不下来的龙卷风。”可见，人工智能正在以它超前的速度改变世界。在经历了年初人工智能之大...

人工智能 2023-12-22 人工智能

840阅读

【达摩院OpenVI】AIGC技术在图像超分上的创新应用

团队模型、论文、博文、直播合集，点击此处浏览一、背景近10年来，深度学习技术得到了长足进步，在图像增强领域取得了显著的成果，尤其是以GAN为代表的生成式模型在图像复原、老片修复，图像超分辨率等方面大放异彩。图像超分辨率是视频增强方面，用...

人工智能 2023-12-22 人工智能

1016阅读

开创全新通用3D大模型，VAST将3D生成带入「秒级」时代

生成式 AI 在3D 领域在很长一段时间内都在等待自己的「ChatGPT」时刻。传统3D 建模涉及游戏、影视、建筑等多个行业，普遍依赖专业人员手动操作，生产周期短则几天，多则以月为单位，单个3D 模型的创建成本至少需要几千元。生成式 AI 技术在2D 图...

生成式AI 2023-12-21 人工智能

962阅读

【分享】AI绘画提示词生成器工具

哈喽，大家好，我是木易巷~ 今天，木易巷给大家带来AI绘画提示词生成器工具---PromptoMANIA。 PromptoMANIA【AI绘画提示词生成器工具】介绍 PromptoMANIA PromptoMANIA是一个聚焦于人工...

大数据 2023-12-21 人工智能

5274阅读

全面合作：传媒业巨头与OpenAI寻求共赢

12月13日，OpenAI与欧洲最大的数字出版公司施普林格Axel Springer宣布战略合作。这是继媒体联盟一再发起抵制AI厂商的抗议以来，首例传媒巨头与AI厂商从版权、技术及商业模式上的全方位战略合作。本文梳理了此次合作带给新闻业的重要意义，与合作...

生成式AI 2023-12-21 人工智能

862阅读

文心一言AI大模型，前端接入

文心一言AI大模型，前端接入一、参考接口资料模型广场：https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list 我的应用：https://console.bce.bai...

人工智能 2023-12-21 人工智能

926阅读

大语言模型训练数据常见的4种处理方法

本文分享自华为云社区《浅谈如何处理大语言模型训练数据之一常见的数据处理方法》，作者：码上开花_Lancer。大语言模型训练需要数万亿的各类型数据。如何构造海量“高质量”数据对于大语言模型的训练具有至关重要的作用。虽然，截止到2023 年9 月为止，还...

人工智能 2023-12-20 人工智能

1297阅读

逆天！真实可控、可拓展，自动驾驶仿真平台LightSim上新

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

大数据 2023-12-20 人工智能

837阅读

Stable Diffusion - Stable Diffusion WebUI 支持 SDXL 1.0 模型的环境配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132056980 SDXL 1.0 版本是 Stable Dif...

生成式AI 2023-12-20 人工智能

1024阅读

数据治理与大模型一体化实践

降本增效方面，以机器学习团队的构成为例，滴普科技Deepexi产品线总裁柏海峰介绍道：“传统机器学习或者说小模型的技术落地，对人才的要求很高，但企业往往没有意识到这个问题。具体来说，一般需要构建一个综合性的团队即数据科学团队，团队中需要数据开发工程师、...

AIGC 2023-12-20 人工智能

797阅读

DALL·E2(unCLIP)、Stable Diffusion、IS、FID要点总结

DALL·E 1 DALL·E 1可以看成是VQ-VAE和文本经过BPE编码得到的embedding AE（Auto Encoder） encoder decoder结构，AE在生成任务时只会模仿不会创造，所有有了后面的VAE VAE(Var...

AIGC 2023-12-19 人工智能

1061阅读

编码碾压ChatGPT！UIUC清华联手发布7B参数Magicoder，代码数据权重全开源

开源「代码大模型」来了！ UIUC清华团队的研究人员发布了Magicoder，不到7B参数，就能在代码生成领域与顶级代码模型不相上下。值得一提的是，Magicoder的代码、权重和数据，毫无保留完全开源。论文地址：https://arxiv.org...

人工智能 2023-12-19 人工智能

755阅读

UIUC清华联手发布全新代码大模型Magicoder 不到7B参数

在代码生成领域，UIUC和清华合作发布了Magicoder，这一全新的大型语言模型仅使用了7B参数，却能与顶级模型媲美，并以全面开源的方式分享了其代码、权重和数据。Magicoder的关键在于采用了OSS-INSTRUCT方法，该方法通过从开源代码中获取灵...

大数据 2023-12-19 人工智能

816阅读

谷歌AI提出视觉语言模型PixelLLM:能够进行细粒度定位和视觉语言对齐

谷歌AI研究团队与加州大学圣迭戈分校的研究人员合作，提出了一种名为PixelLLM的智能模型，旨在解决大型语言模型在细粒度定位和视觉-语言对齐方面的挑战。这一模型的提出受到了人类自然行为的启发，尤其是婴儿描述其视觉环境的方式，包括手势、指向和命名。 Pix...

生成式AI 2023-12-19 人工智能

853阅读

Midjourney指令操作、promt框架、参数设置教程

引言：基于Chatgpt的应用如雨后春笋，这波浪潮正当时。最近在摸索图片生成有价值的应用场景，使用过程中整理了一些指令秘籍，一同分享出来。 1、原理 Midjourney的人工智能绘画技术基于GPT-3.5模型，使用了先进的神经网络算法，通过输入简单...

AIGC 2023-12-18 人工智能

1458阅读

重塑未来数字格局的五大技术趋势

科技改变了世界，这是一个毫无争议的说法。从古人犁地到今天的印刷机再到个人电脑，先进的技术有能力从根本上重塑世界和我们的生活方式。过去几十年的许多变化使我们认识到，我们社会中一些最具变革性的变化是由软件实现的。数字化转型不仅仅是一个流行语，而是一个现实。...

人工智能 2023-12-18 人工智能

774阅读

【Midjourney入门教程3】写好prompt常用的参数

文章目录 1、图片描述词（图片链接）+文字描述词+后缀参数 2、权重划分 3、后缀参数版本选择：--v 版本风格：--style 长宽比：--ar 多样性: --c 二次元化：--niji 排除内容：--no --stylize --see...

AIGC 2023-12-18 人工智能

1319阅读

快手 Dragonfly 策略引擎的设计与应用

一、问题与挑战 1、问题背景从 2018 年开始，快手的整个业务呈现快速发展的状态，团队也在快速扩张中。在过去的五年中，DAU 从 1 亿增长至 3.76 亿。在 2021 年，快手的 DAU 已经超过了 3 亿。主要推荐场景也从早期的发现页、关注...

AIGC 2023-12-18 人工智能

973阅读

文心一言的优缺点分析及改进思路

随着人工智能技术的不断发展，越来越多的人们开始关注如何利用人工智能技术提高写作效率和质量。而文心一言作为一款基于深度学习算法的智能写作工具，已经成为日常写作中广泛使用的一种工具。但是，任何一种工具都有其优点和缺点，在使用文心一言时也需要认真考虑它的优缺点，...

AIGC 2023-12-17 人工智能

3931阅读

【文生图】Stable Diffusion XL 1.0模型Full Fine-tuning指南（U-Net全参微调）

文章目录前言重要教程链接以海报生成微调为例总体流程数据获取 POSTER-TEXT AutoPoster CGL-Dataset PKU PosterLayout PosterT80K Movie & TV Series...

大数据 2023-12-17 人工智能

957阅读

AIGC产业研究报告2023——三维生成篇

定义人工智能三维生成是指利用深度神经网络学习并生成物体或场景的三维模型，并在三维模型的基础上将色彩与光影赋予物体或场景使生成结果更加逼真。在应用中，生成物体或场景的三维模型称为三维建模，生成三维模型的色彩与光影称为三维渲染。主要类型三维生成...

人工智能 2023-12-17 人工智能

858阅读

AI首次攻克难倒陶哲轩数学难题，DeepMind里程碑算法登Nature！LLM搜代码自我进化

上限集问题，是困扰数学家们多年的开放性问题。著名数学家陶哲轩，就曾将上限集问题描述为自己最喜欢的开放性问题。陶哲轩博客而大语言模型，竟然在这个问题上做出了新发现。今天，Google DeepMind、威斯康星大学麦迪逊分校和里昂大学的研究人员联...

人工智能 2023-12-16 人工智能

794阅读

UC伯克利DeepMind等联合发布真实世界模拟器，打破虚实边界

真实世界模拟器来啦！还在发愁训练出的大模型无法适应真实的物理世界吗？ AI Agent想要进入我们的生活还有多远的距离？ ——UC伯克利、谷歌DeepMind、MIT和阿尔伯塔大学的研究人员告诉你答案。在NeurlPS 2023上，研究人员将展示他们...

AIGC 2023-12-16 人工智能

1069阅读

ChatGPT研究(三)——AIGC多模态交互功能，奠定多场景商用基础

✏️写作：个人博客，InfoQ，掘金，知乎，CSDN ?公众号：进击的Matrix ?特别声明：创作不易，未经授权不得转载或抄袭，如需转载可联系小编授权。前言最近ChatGPT，想必大家已经是耳熟能详了，一度认为ChatGPT的到来是...

人工智能 2023-12-16 人工智能

963阅读

突发！GPT-4.5泄露传闻：是圣诞的礼物，还是传言的迷雾？

刚刚，一颗潜在的AI圈震撼弹——OpenAI 的 GPT-4.5版本——似乎无声地滑入公众的视线。这份所谓的“泄露”信息，以及它预示的技术突破究竟意味着什么，目前仍是一个谜。背景信息:GPT的演变在深入泄露的细节之前，让我们简要回顾一下 GPT 模型...

AIGC 2023-12-15 人工智能

776阅读

【文心一言】使用飞桨 AI Studio 快速搭建，看图识猜成语应用

目录一、背景二、实践三、创建应用 3.1、零代码开发 3.2、应用名称 3.2、模型训练 3.3、开始训练四、应用部署 4.1、发布项目 4.2、搜索应用 4.3、应用部署 4.4、获取令牌 4.4、导入依赖 4.5、配置CO...

大数据 2023-12-15 人工智能

1201阅读

DeepMind论文登上Nature：困扰数学家几十年的难题，大模型发现全新解

作为今年 AI 圈的顶流，大型语言模型（LLM）擅长的是组合概念，并且可以通过阅读、理解、写作和编码来帮助人们解决问题。但它们能发现全新的知识吗？由于 LLM 已被证明存在「幻觉」问题，即生成与事实不符的信息，因此利用 LLM 来做可验证的正确发现是一...

生成式AI 2023-12-15 人工智能

775阅读

真实、可控、可拓展，自动驾驶光照仿真平台LightSim上新了

最近，来自 Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在 NeurIPS 2023 上提出了一种全新的自动驾驶光照仿真平台 LightSim。研究者们提出了从真实数据中生成配对的光照训练数据的方法，解决了数据缺失和模型迁移损失的问题。L...

AIGC 2023-12-15 人工智能

1015阅读

人工智能中的文本分类：技术突破与实战指导

在本文中，我们全面探讨了文本分类技术的发展历程、基本原理、关键技术、深度学习的应用，以及从RNN到Transformer的技术演进。文章详细介绍了各种模型的原理和实战应用，旨在提供对文本分类技术深入理解的全面视角。关注TechLead，分享A...

生成式AI 2023-12-15 人工智能

953阅读

2023.12.12最新源码及资源：使用Python构建与百度大模型(包括文心一言在内的18个语言模型)的交互式界面！！

#ps:12.12修复bug，部分模型不能回应的问题，资源已更新！在当前人工智能领域，通过与机器进行智能对话的能力变得越来越重要。本文将介绍如何使用Python编程语言和Tkinter库构建一个交互式界面，使用户能够与百度大模型进行智能对话，展...

生成式AI 2023-12-15 人工智能

836阅读

ChatGPT和文心一言的优缺点比较

ChatGPT和文心一言都是自然语言生成技术的代表，下面是它们的优缺点比较： ChatGPT的优点：自由度高：ChatGPT生成的文本与给定的话题没有紧密的关联，可以灵活地生成多种不同的文本。多样性高：ChatGPT可以生成多样性高的文本，因为其...

AIGC 2023-12-15 人工智能

933阅读

AI绘画-Midjourney基础1-突破想象的界限：掌握文本引导的图像生成技巧

Midjourney是一款 AI 绘画工具，可以根据你的提示（本文中称为 prompt）创作出各种图像。你只需要在Discord上和一个机器人聊天，就可以用简单的命令来控制它。目前已不支持免费试用，可以选择付费计划来获得更多功能和优势。目前 Midjo...

生成式AI 2023-12-14 人工智能

1276阅读

AI视野：谷歌Gemini Pro开放；文心一言插件商城上线；谷歌图像生成模型Imagen2发布；阿里推虚拟试穿技术Outfit Anyone

???AI新鲜事谷歌Gemini Pro开放谷歌Gemini Pro大模型在研究基准测试中表现优异，支持32K上下文窗口的文本输入和生成功能，向Vertex AI云计算客户和AI Studio开发人员开放，提供多种功能和SDK，为构建AI应用程序提供更...

大数据 2023-12-14 人工智能

831阅读

LLM生成3D场景，无限延伸！斯坦福华人提出3D动画生成框架，一句话一幅图创造无限3D世界

斯坦福华人退学博士开发的Pika，让AI技术和艺术迸发出了绚丽的火花。最近，又有斯坦福的华人研究人员提出的新的框架——WonderJourney，可以用一句话或者一张图，自动生成一系列3D场景的连续画面，效果炫酷！图片用一张爱丽丝奇境漫游的图片，...

AIGC 2023-12-14 人工智能

895阅读

谷歌AI联合佛罗里达高校发布开源虚拟人物库“VALID” 含210个全套虚拟人物

谷歌AR&VR与佛罗里达中央大学的研究团队合作，发布了一项名为“VALID”的虚拟人物库，旨在促进多样性和包容。该库包含210个经过验证的、完全配备的虚拟人物，代表七个不同的种族，其中包括亚洲、黑人和白人等。研究采用了全球参与者，并通过数据驱动的面...

AIGC 2023-12-14 人工智能

906阅读

一张图or文字生成无限3D世界！斯坦福吴佳俊团队新作，让网友直呼“难以置信”

斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作！仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景：只需输入一段古诗词，诗中场景立刻映入眼帘：而且还是来回式的，可以再倒回去的那种：同一起点可以进入不同场景：真实场景也可以，其中的...

大数据 2023-12-14 人工智能

813阅读

AIGC: 关于ChatGPT中对输出文本进行审核

违禁词与 logit_bias 参数前文，通过GPT的API实现了一个简单的聊天机器人, 当然也可以做一些内容审核相关的应用这里有一个非常核心，需要重点关注的一个方向，就是对于文本的审核对于一些违禁词，我们需要准确的识别出来，避免出现...

生成式AI 2023-12-14 人工智能

1272阅读

Pika官网体验入口 AI视频编辑软件app免费下载地址

《Pika》是一个革命性的AI视频编辑平台，它使得将创意想法转化为视频变得简单有趣。这个平台正在改变AI视频生成的游戏规则。那么，《Pika》在哪里可以体验呢?下面就给大家带来《Pika》官网体验入口和免费app下载地址。点击前往《Pika》官网体验入...

人工智能 2023-12-13 人工智能

1042阅读