-
计算机视觉中目标检测的数据预处理
本文涵盖了在解决计算机视觉中的目标检测问题时,对图像数据执行的预处理步骤。 首先,让我们从计算机视觉中为目标检测选择正确的数据开始。在选择计算机视觉中的目标检测最佳图像时,您需要选择那些在训练强大且准确的模型方面提供最大价值的图像。在选择最佳图像时,考...
-
【文心一言 vs. 通义千文】一言对千问:自百度之后,阿里终于还是出手了——通义千问
通义千问 : https://tongyi.aliyun.com/通义千问https://tongyi.aliyun.com/ 目录 通义千问 : 达摩院 GPT-30B 模型复现 GPT-3 模型介绍 GPT3中文30B参数量文本生...
-
【AI绘图】一、stable diffusion的发展史
一、stable diffusion的发展史 本文目标:学习交流 对于熟悉SD的同学,一起学习和交流使用过程中的技巧和心得。 帮助新手 帮助没有尝试过SD但又对它感兴趣的同学快速入门,并且能够独立生成以上效果图。 1.发展史介绍: 2...
-
程序员眼中的 ChatGPT
作者 | Bright Liao 作为一个一直对AI 技术很感兴趣的软件开发工程师,早在深度学习开始火起来的2015、2016年,我就开始了相关技术的学习。当时还组织了公司内部同样有兴趣的同学一起研究,最终的成果汇集成几次社区中的分享以及几篇学习文章(见...
-
算法面试-深度学习基础面试题整理-AIGC相关(2023.9.01)
1、stable diffusion和GAN哪个好?为什么 ? Stable diffusion是一种基于随机微分方程的生成方法,它通过逐步增加噪声来扰动原始图像,直到完全随机化。然后,它通过逐步减少噪声来恢复图像,同时使用一个神经网络来预测下一步的噪...
-
【腾讯云 HAI域探秘】探索AI绘画之路:利用腾讯云HAI服务打造智能画家
目录 前言 1 使用HAI服务作画的步骤 1.1 注册腾讯云账户 1.2 创建算力服务器 1.3 进入模型管理界面 1.4 汉化界面 1.5 探索AI绘画 2 模型参数的含义和调整建议 2.1 模型参数的含义和示例 2.2 模型参数的调整...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
Stable Diffusion XL训练LoRA
主要包括SDXL模型结构,从0到1训练SDXL以及LoRA教程,从0到1搭建SDXL推理流程。 【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤,Stable Diffusion XL也不例外: 训练集...
-
AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC
想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...
-
CSDN AI写作助手:提升创作力,引领未来
目录 一、你平时会使用这类AI工具吗?你对这类型的工具有什么看法? 二、你可以花几分钟体验一下InsCode AI 创作助手,并说说你的使用体验以及优化建议。 三、你认为在使用此类AI工具时,应该注意哪些细节和技巧才能有效提高生产力? 四、未来 A...
-
【AI绘画发展史】AI绘画从历史到技术突破,何以突飞猛进?
文章目录 AI绘画的进展 开源贡献 一、CLIP+VQGAN 二、CLIP 三、LAION-5B和LAION-Aesthetics AI绘画模型/产品 一、Disco Diffusion 二、MidJourney 三、Stable Dif...
-
Meta 介绍 AI 图像编辑工具 Emu Edit / Video:使用 1000 万个数据集训练,号称远超竞品
IT之家 11 月 20 日消息,Meta 昨日宣布为 Facebook 和 Instagram 推出两款基于 AI 的图像编辑工具,分别是“Emu Edit”和“Emu Video”,适用领域包括照片和视频,目前 Meta 公布了这两项 AI 工具的更...
-
如何使用AI绘画,AI绘画关键词怎么写
AI 绘画为什么被抵制?最重要的是版权不清晰,从工具角度来看是好事,前提是做好知识版权对应的利益划分,相信未来肯定会有相关政策,但是,现在我们就得先去接受和学习AI绘画,未来迎接政策的落地! 一、AI绘画推荐 首先我们推荐3个排名前三的...
-
【朱颜不曾改,芳菲万户香。AIGC人物图片创作---InsCode Stable Diffusion 美图活动一期】
【朱颜不曾改,芳菲万户香。AIGC人物图片创作 ---InsCode Stable Diffusion 美图活动一期】 本文目录: 一、 Stable Diffusion 模型在线使用 1.1、模板运行环境配置 1.2、运行InsCo...
-
Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制
提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果超过了这两家,而且编辑起来还更加灵活。 这个「吹小号、跳舞的兔子」是 Meta 发布的最新 demo。从中可以看出,Meta 的技术既支...
-
谷歌研究:通过对抗性数据生成和多元评估应对GenAI的道德和安全风险
谷歌研究团队在人工智能领域持续推动着对生成式AI(GenAI)安全的研究,以应对其在虚假信息、偏见和安全性方面带来的挑战。作为谷歌研究的一部分,负责构建负责任的AI和数据系统的Responsible AI and Human-Centered Techno...
-
gpts怎么用?1分钟教你如何创建属于自己的GPTs
近期,大多数人获得了 ChatGPT 的访问权限,而GPTs的受欢迎程度令人惊讶。openAI 的 Sam Alman 表示,自 Dev Day 后的使用激增已经超过了他们的承受范围。这项 GPT 功能似乎是一个巨大的成功,以至于暂停了新的 Chat GP...
-
Stable diffusion相比于latent diffusion有哪些改进?
Stable Diffusion是对Latent Diffusion模型的改进,主要在以下方面进行了优化: 稳定性:Stable Diffusion模型引入了稳定性措施,通过限制每一步噪声向量的大小来防止梯度爆炸或消失问题的出现。这一改进使得模型在训练过...
-
GPTs商店目前有多少软件 GPTs应用商店官网如何进入
OpenAI正在推出ChatGPT的定制版本,您可以为特定目的创建自己的ChatGPT版本,称为GPTs。 GPTs是任何人可以创建的一种新方法,可让ChatGPT在日常生活中变得更有帮助,在特定任务、工作或家庭中使用,然后与他人分享。例如,GPTs可以帮...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
Runway Gen2:AI视频制作的顶尖模型
介绍Runway Gen2 Runway的Gen2模型被认为是AI视频制作的顶尖模型。它制作出来的视频效果逼真、流畅、高清。虽然是付费服务,但相比那些闪烁的AI视频,付费是有道理的。 访问Runway Gen2 要访问Runway Gen2,有两种方法...
-
百度文心一言4.0抢先体验教程!
? 展望:关注我, AI学习之旅上,我与您一同成长! 一、 引言 想快速体验文心一言4.0,但又觉得技术难度太高?别担心,我来手把手教你! ? 10月17日,文心一言4.0震撼亮相,带着一系列闪亮的AI原生应用与服务。这包括了 百度新搜索、百度...
-
新技术有效加速大规模人工智能模型的处理性能
麻省理工学院和英伟达的研究人员开发了两种技术来加速稀疏张量的处理,稀疏张量是一种用于高性能计算任务的数据结构。这些技术可以显著提高系统的性能和能效,例如驱动生成式人工智能的大规模机器学习模型。 张量(Tensors)是机器学习模型使用的数据结构。这两种...
-
Agent4Rec来了!大模型智能体构成推荐系统模拟器,模拟真实用户交互行为
一直以来,推荐系统领域面临模型线上线下效果差距大的痛点问题,昂贵的线上 A/B 测试成本使得广大研究人员望而却步,也造成学术界的推荐系统研究与工业界的实际应用间的巨大割裂。随着大语言模型展现出类人的逻辑推理和理解能力,基于大语言模型的智能体(Agent)...
-
新加坡推Agent4Rec 大模型智能体构成推荐系统模拟器
推荐系统领域长期存在线上线下效果差距大的问题,Agent4Rec通过构建大语言模型智能体,模拟真实用户行为,为解决这一问题提供了新的思路。在Agent4Rec中,每个用户智能体由个性化模块构成,根据用户历史交互生成电影偏好,模拟用户在推荐系统中的行为。通过...
-
北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。 北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS 2023接...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
如何测试生成式人工智能(AIGC)
简介:在人工智能日趋普及的今天,生成式人工智能(AIGC)已经成为不可忽视的一个分支。从自动化生成新闻、编写代码到图像和音频生成,AIGC几乎无处不在。但如何确保这些生成的内容达到预期标准、安全可靠,同时又具有高度的可用性呢?这是一个值得细细思考的问题。...
-
中国AIGC数据标注全景报告:百亿市场规模,百万就业缺口
数据标注,正迎来关键洗牌时刻。 大模型时代到来,以数据为中心的AI开发模式加速走向台前,数据的价值从未向今天这样被充分挖掘—— 大模型从训练到部署应用迭代,AIGC众多垂直场景落地,通用智能、具身智能等前沿领域探索,都与高质量、专业化的场景数据密不可分。...
-
深入AIGC:工具、技术和编程语言
深入AIGC:工具、技术和编程语言 深入AIGC:工具、技术和编程语言 摘要 引言 词汇解释 详细介绍:深入AIGC的工具、技术和编程语言 AIGC的关键技术和工具 AIGC的编程语言 实际应用和未来趋势 结论 博...
-
Midjourney推出5.2版本,更新zoom out功能
Midjourney是一款专业的图像处理软件,它可以让用户轻松地创造出高质量的图像。它最近宣布推出了5.2版本,这是一个重大的更新,其中最亮眼的功能就是zoom out功能。 zoom out功能可以让用户无限地缩小原始图像,同时保持图像的清晰度和细节不...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
无监督学习的集成方法:相似性矩阵的聚类
在机器学习中,术语Ensemble指的是并行组合多个模型,这个想法是利用群体的智慧,在给出的最终答案上形成更好的共识。 这种类型的方法已经在监督学习领域得到了广泛的研究和应用,特别是在分类问题上,像RandomForest这样非常成功的算法。通常应用一...
-
语言作“纽带”,拳打脚踢各模态,超越Imagebind
北大联合腾讯打造了一个多模态15边形战士! 以语言为中心,“拳打脚踢”视频、音频、深度、红外理解等各模态。 具体来说,研究人员提出了一个叫做LanguageBind的多模态预训练框架。 用语言作为与其它模态之间的纽带,冻结语言编码器,然后用对比学习方法...
-
通用异常检测新曙光:华科大等揭秘GPT-4V的全方位异常检测表现
异常检测任务旨在识别明显偏离正常数据分布的异常值,在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传统的异常检测方法主要依赖于描述正常数据分布以进行正异常样本的区分。然而,对于实际的应用而言,异常检测也需要理解数据的高层语义,从而深入...
-
Stable Diffusion云端部署流程与注意点
前言 在今天的大数据时代,AI绘图是企业必备的重要工具之一。而Stable Diffusion作为一款部署的AI绘图,得到了很多企业和团队的认可。在使用Stable Diffusion的过程中,云部署是一个非常重要的话题,本文将详细介绍Stable Di...
-
Stable Diffusion超详细教程!从0-1入门到进阶
一、本地部署 Stable Diffusion 前言 目前市面上比较权威,并能用于工作中的AI绘画软件其实就两款。一个叫Midjourney(简称MJ),另一个叫Stable-Diffusion(简称SD)。MJ需要付费使用,而SD开源免费,但是上...
-
[大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora(部分)
文章目录 LLaMA大模型及其衍生模型 1. LLaMA 2. stanford_alpaca 3. ChatDoctor 4. alpaca-lora 5. Chinese-LLaMA-Alpaca 6. BELLE 大模型综述 A Su...
-
AIGC 爆火,浪潮信息要做大模型的数据存储大底座
AIGC 在 2023 年爆火,各类大模型层出不穷,参数动辄达到千亿数量级。这些背后,数据的类型和形式也走向复杂多样。例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据,数据则又存在结构化、半结构化、非结...
-
【人工智能】ChatGTP从入门到精通
当谈论自然语言处理和文本生成技术时,Chat GPT 是一个备受瞩目的话题。作为一种基于深度学习的语言模型,Chat GPT 在近几年里已经展现出了惊人的能力,可以生成几乎无法区分与人类写作的文本,并在自然语言处理领域的各种任务中都表现出色。Chat GP...
-
【Midjourney入门教程2】Midjourney的基础操作和设置
文章目录 Midjourney的常用命令和基础设置 1、 /imagine 2、 /blend 3、 /info 4、 /subscribe 5、 /settings(Midjourney的基础设置) 6、 /shorten 有...
-
Stable Diffusion+ControlNet+Lora 指导AI+艺术设计的WebUI全流程使用教程
目录 一. 背景知识 1.1 Stable Diffusion背景知识 1.1.1 安装stable-diffusion-webui 1.2 ControlNet 背景知识 二. 使用方法 2.1 环境配置 2.2 运行WebUI 三....
-
LoRa模型训练教程(炼丹,Stable Diffusion)
1. lora介绍(Low Rank Adaption) 何为LoRA?LoRA并不是扩散模型专有的技术,而是从隔壁语言模型(LLM)迁移过来的,旨在解决避免将整个模型参数拷贝下来才能对模型进行调校的问题。因为大型语言模型的参数量过于恐怖,比如最近新出...
-
百度智能云:千帆大模型平台接入Llama 2等33个大模型,上线103个Prompt模板
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机...
-
李飞飞发新书《我看到的世界》 自称不是AI毁灭派
李飞飞的新书《我看到的世界》正式发售,她不是开源派,也不是毁灭派,而是中间派,希望人类能与人工智能和平共处。她对 AI 的潜力和危害有清晰的认识,认为 AI 在科学发现、提高生产率、增强学习和教学能力等方面有巨大潜力,但同时也带来很多危害。李飞飞主张以人本...
-
ai图片合成要如何操作?看完这篇就知道ai绘画怎么弄了
看看这些图片,是不是很想拿去当头像啊!你们知道这些照片是怎么做的吗?想自己创作出这么好看的头像吗?你听说过ai绘画技术吗?今天我就为大家介绍ai绘画技术是什么,ai图片合成怎么做。话不多说,直接进入正题吧! 合成方法一:利用starryai合...
-
用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单
在现代社会,信息传递和交流不再局限于单一模态。我们生活在一个多模态的世界里,声音、视频、文字和深度图等模态信息相互交织,共同构成了我们丰富的感知体验。这种多模态的信息交互不仅存在于人类社会的沟通中,同样也是机器理解世界所必须面对的挑战。 如何让机器像人类...
-
谨防大模型基准评估陷阱!测试集乱入预训练,模型变傻
最新研究警告,大型模型在基准评估中可能面临潜在危害,原因是测试集中的数据可能意外进入预训练过程。这项研究由中国人民大学信息学院、高瓴人工智能学院和伊利诺伊大学厄巴纳-香槟分校的学者联合进行。 研究发现,由于预训练语料包含大量公开文本,而评估基准建立在这些信...
-
前端调用 Stable diffusion 秋叶启动器 Web-Ui API
环境启动 在启动器启动前,开启启用 API 就可以调用 通过访问 API DOCS 查看完整的接口地址。 请求方式 POST 请求体以 JSON 形式发送。 以 axios 为例: const axios = axios.create({......
-
LLM - LLaMA-2 获取文本向量并计算 Cos 相似度
目录 一.引言 二.获取文本向量 1.hidden_states 与 last_hidden_states ◆ hidden_states ◆ last_hidden_states 2.LLaMA-2 获取 hidden_states ◆...