-
stable diffusion实践操作-常见lora模型介绍
系列文章目录 本文专门开一节写Lora相关的内容,在看之前,可以同步关注:stable diffusion实践操作 文章目录 系列文章目录 前言 一、什么是lora? 1.1 lora 定义 1.2 lora的基本原理 1.2 通...
-
LLaMA-7B微调记录
Alpaca(https://github.com/tatsu-lab/stanford_alpaca)在70亿参数的LLaMA-7B上进行微调,通过52k指令数据(https://github.com/tatsu-lab/stanford_alpaca/...
-
AI绘画中的“提示工程”价值
对于一些有想法但不会画画的人来说,AI的出现无疑是个好消息。现在AI绘画蓬勃发展,用户只要将脑海中的画面描述给AI,就可以得到相应的作品。而对于“提示工程”这一领域,AI绘画大有助益。 什么是AI绘画 AI绘画是指使用人工智能技术生成艺术作品的过程。...
-
AIGC:使用bert_vits2实现栩栩如生的个性化语音克隆
1 VITS2模型 1.1 摘要 单阶段文本到语音模型最近被积极研究,其结果优于两阶段管道系统。以往的单阶段模型虽然取得了较大的进展,但在间歇性非自然性、计算效率、对音素转换依赖性强等方面仍有改进的空间。本文提出VITS2,一种单阶段的文本到语音模型,...
-
Windows安装Stable Diffusion WebUI及问题解决记录
本文将详细介绍stable diffusion webui的下载、安装及问题解决。 StableDiffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提...
-
【深度学习 AIGC】stable diffusion webUI 使用过程,参数设置,教程,使用方法
文章目录 docker快速启动 vae .ckpt或者.safetensors CFG指数/CFG Scale 面部修复/Restore faces Refiner Tiled VAE Clip Skip prompt提示词怎么写 roop U...
-
【AIGC】深入理解 LORA模型
深入理解 LORA模型 LORA模型是一种神经网络模型,它通过学习可以自动调整神经网络中各层之间的权重,以提高模型的性能。本文将深入探讨LORA模型的原理、应用场景、优缺点等方面。 1. LORA模型的原理 LORA模型的全称为Learnable...
-
stable-diffusion-webui 环境搭建(台式机GTX1060环境)
1、安装git用于克隆stable-diffusion-webui仓库 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 2、安装python 3.10.7 CN...
-
一文盘点2023人工智能进展,不止大模型而已
2023年大模型千帆竞发,除此外AI领域还有哪些新突破? 来来来,畅销书《Python机器学习》作者Sebastian Raschka的年末总结已经准备好了。 看完才知道: RLHF今年虽然爆火,但实打实用到的模型并不多,现在还出现了替代方案,有望从开...
-
CVPR 2023 | 去雨去噪去模糊,图像low-level任务,视觉AIGC系列
Learning A Sparse Transformer Network for Effective Image Deraining 基于Transformer的方法在图像去雨任务中取得了显著的性能,因为它们可以对重要的非局部信息进行建模,这对...
-
全球首个!电视拥抱AI大模型 颠覆式革新
快科技11月15日消息,长虹电视官方宣布,将于11月20日发布全球首个基于大模型的智慧家电AI平台。 早在2016年,长虹就发布了全球首台人工智能电视,第一家将”人工智能深度学习神经网络算法”应用于电视,让家电行业正式迈入人工智能新时代。 如今,长虹再一次...
-
stable-diffusion-webui手动安装详细步骤(以及报错解决、踩坑)
文章目录 大话stable-diffusion-webui系列 AMD显卡请看这篇文章 前提 问题 环境 安装过程 升级CUDA驱动 安装CUDAToolKit 安装cuDNN 克隆项目地址 安装Pytorch 启动项目 题外话...
-
ChatGPT应用在AIGC内容生产【赠书活动|第一期《硅基物语》】
文章目录 爆火的AI工具ChatGPT 走入大众视野的AIGC AIGC领域的发展 AIGC价值引领 『赠书活动 | 第一期』 本期中奖者 爆火的AI工具ChatGPT 2023年伊始,ChatGPT就火遍全网,成为了全球最快拥有...
-
Google Cloud 推出 Vertex AI 新的数据存储位置功能
Google 云服务部今日宣布,为其全套管理型人工智能开发服务 Vertex AI 引入了新的数据存储位置功能。 在诸如金融、医疗等受严格监管的行业中,企业通常需要将数据存储在产生数据的国家或地区。Google Cloud 推出的这一新功能正是为了满足这...
-
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万
文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。 但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。 图源:https://twitter.com/...
-
Yolo V8:深入探讨其高级功能和新特性
Yolo是一种计算机视觉模型,被广泛认为是目前最强大和最知名的模型之一。这一突破性技术被称为Yolo,它是“You Only Look Once”的缩写,是一种以几乎瞬间处理速度检测物体的方法。Yolo V8技术是这一技术的最新版本,也是对之前版本的一种...
-
关于【Stable-Diffusion WEBUI】生成全身图:插件解决面部崩坏问题
文章目录 (零)前言 (一)脸难看的问题 (1.1)面部修复 (1.2)远景脸部问题 (二)面部修复插件(Face Editor) (2.1)模型文件下载 (2.2)例图参数 (零)前言 本篇主要介绍WEBUI的插件...
-
IBM 启动5亿美元企业人工智能风险基金,以支持初创公司
IBM近日推出新的企业投资工具,即企业人工智能风险基金,计划通过该基金支持那些开发以企业为重点的人工智能产品的初创公司。 其他科技巨头在IBM此举之前也加大了对人工智能创业生态系统的投资。几周前,大型语言模型开发商Anthropic PBC从亚马逊公司和...
-
微软推出 XOT 方法,提升语言模型推理能力
11 月 15 日消息,微软近日推出了名为“Everything of Thought”(XOT)的方法,灵感来自谷歌 DeepMind 的 AlphaZero,利用紧凑的神经网络,来增强 AI 模型推理能力。 微软和佐治亚理工学院、华东师范大学...
-
谷歌DeepMind发布全新AI天气预报模型GraphCast 1分钟预测10天全球天气
谷歌DeepMind最新推出的全球天气预报AI模型GraphCast引起科学界瞩目。这一模型不仅能在短短1分钟内预测未来10天的全球天气,甚至还能准确预测极端天气事件。通过在欧洲中期天气预报中心(ECMWF)近40年的数据上进行训练,GraphCast表现...
-
LLM幻觉问题全梳理!哈工大团队50页综述重磅发布
幻觉,老朋友了。 自打LLM进入我们的视野,幻觉问题就一直是一道坎,困扰着无数开发人员。 当然,有关大语言模型幻觉的问题已经有了无数研究。 最近,来自哈工大和华为的团队发表了一篇50页的大综述,对有关LLM幻觉问题的最新进展来了一个全面而深入的概述。 这...
-
使用Python从图像中提取表格
大约一年前,我被分配任务从文件中提取和结构化数据,主要是包含在表格中的数据。我之前对计算机视觉没有了解,并且很难找到一个合适的“即插即用”的解决方案。当时可选的方案要么是基于最新神经网络(NN)的解决方案,这些解决方案庞大而繁琐,要么是基于OpenCV的...
-
.Net 使用OpenAI开源语音识别模型Whisper
.Net 使用OpenAI开源语音识别模型 Whisper 前言 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的 Whisper 神经网络,且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音...
-
〔003〕Stable Diffusion 之 界面参数和基础使用 篇
✨ 目录 ▷ 界面参数 ▷ 采样器 ▷ 文生图(txt2img) ▷ 图生图(img2img) ▷ 标签权重 ▷ 模型下载 ▷ 界面参数 在使用 Stable Diffusion 开源 AI 绘画之前,需要了解一下绘画...
-
AIGC书籍推荐:《生成式深度学习的数学原理》
生成式 AI 使用各种机器学习算法,从数据中学习要素,使机器能够创建全新的数字视频、图像、文本、音频或代码等内容。生成式 AI 技术在近两年取得了重大突破,产生了全球性的影响。它的发展离不开近年来生成式深度学习大模型的突破。与一般意义上可视为“黑盒”的深度...
-
神经网络中的量化与蒸馏
本文将深入研究深度学习中精简模型的技术:量化和蒸馏 深度学习模型,特别是那些具有大量参数的模型,在资源受限环境中的部署几乎是不可能的。所以就出现了两种流行的技术,量化和蒸馏,它们都是可以使模型更加轻量级,而不会对性能造成太大影响。但是它们需要什么,它们又...
-
微软AI研究提出AI模型HMD-NeMo:可基于部分手部动作准确生成全身动作
在混合现实场景中,生成准确和真实的全身虚拟角色动作一直是一个持久性的挑战。传统解决方案通常使用头戴式设备(HMDs),依赖有限的输入信号,如头部和手部的6自由度(DoF 。然而,最近的进展在从头部和手部信号生成全身动作方面取得了令人印象深刻的表现。然而,它...
-
深入AIGC:工具、技术和编程语言
深入AIGC:工具、技术和编程语言 深入AIGC:工具、技术和编程语言 摘要 引言 词汇解释 详细介绍:深入AIGC的工具、技术和编程语言 AIGC的关键技术和工具 AIGC的编程语言 实际应用和未来趋势 结论 博...
-
研究:AI无法模拟人脑对动态面部表情的处理
人工智能在面部识别技术方面的发展表现出色,甚至有时超越了人类的表现。然而,一项最新研究发现,尽管AI在静态图像上的识别能力强大,但在处理动态面部表情时,其表现与人脑存在显著差异。 图源备注:图片由AI生成,图片授权服务商Midjourney 研究团队来自...
-
【AIGC】浅谈人工智能对各行业的影响及未来展望
前言 本文将探讨人工智能对各个行业的影响,以及如何更好地利用人工智能技术。同时,我们还将介绍在使用人工智能技术时需要注意的问题,并展望未来人工智能的发展前景。 随着科技的不断发展,人工智能已经成为了当今世界上最受关注和研究的领域之一。在过去几年中,人...
-
创作没灵感?可视化图谱+搜索引擎助你无障碍生成内容 #ATLAS + Stable Diffusion
AIGC 的发展带动了内容创作产品生态的变革。从纯粹的设计生产工具,扩展到数据集、内容社区、搜索引擎等功能形式多样的产品。对于设计师而言,生成式设计工具与传统设计工具的区别,主要体现在工作流。 Mixlab 小杜 传统设计工具...
-
ai写作生成器有哪些?试试这几款工具吧
近年来,随着ai技术的飞速发展,越来越多的人开始意识到ai文本生成器的重要性和实用性。这种文本生成器可以帮助我们快速生成各种类型的文章,如报告、评论、新闻、邮件等,它的应用范围已经非常广泛了。不仅如此,随着机器学习和深度神经网络技术的不断进步,ai...
-
关于AI 绘画,我给你总结了一份详细的关键词(Prompt 知识)
写在前面 随着人工智能技术的不断发展,越来越多的应用场景被发掘。其中,AI绘画是一种新兴的领域,其应用范围涵盖了数字媒体、游戏设计、动画制作、艺术创作等多个领域。在本文中,我们将介绍AI绘画的基本概念、发展历程、技术原理以及应用前景。 基本概念...
-
[深度学习]stable diffusion的提示词总结
1、提升画面质量的提示词: HDR, HD,UHD, 64K (HDR、UHD、4K、8K和64K 表示图片效果,带来的改变可以试试,不过也会影响渲染出图的时间,会根据你要求的画面质量延长时间。 Highly detailed 增加很多的细节,有时候描述...
-
谷歌DeepMind爆火动画18秒解释LLM原理,网友蒙圈!组团求GPT-4下场分析
Google DeepMind最近在自己的视频博客上上传了一段视频,「简单明了地」演示了大语言模型的工作原理,引发了网友的激烈讨论。 网友看了之后纷纷表示: 「终于,他们发了点普通人能看懂的东西了」。 「哦豁,这下懂了」 「对,就是这么简单!」 「太...
-
ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高
ICLR 2024审稿结果公布了! ICLR是机器学习领域重要的学术会议之一,每年举办一次。2024年是第十二届,将在奥地利维也纳5月7日-11日召开。 根据OpenReview官方放出的结果显示,今年共有7135篇投稿论文。 此外,另有国内开发者魏国...
-
LoRAShear:微软在LLM修剪和知识恢复方面的最新研究
LoRAShear是微软为优化语言模型模型(llm 和保存知识而开发的一种新方法。它可以进行结构性修剪,减少计算需求并提高效率。 LHSPG技术( Lora Half-Space Projected Gradient)支持渐进式结构化剪枝和动态知识恢复...
-
详解超强ResNet变体NFNet:抛弃归一化后,性能却达到了最强!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 从上古时期一直到今天,Batch Norm (BN 一直都是视觉骨干架构里面很重要的一个环节。BN 使得研究人员可以训练更深的网络,并在训练集和测试集上实现更高的精度。Batch Norm 还可以平...
-
AI图像生成模型LCMs: 四个步骤就能快速生成高质量图像的新方法
在最新的AI模型和研究领域,一种名为Latent Consistency Models(LCMs)的新技术正迅速推动文本到图像人工智能的发展。与传统的Latent Diffusion Models(LDMs 相比,LCMs在生成详细且富有创意的图像方面同样...
-
斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习
在模型与人类意图对齐方面,根据人类反馈的强化学习(RLHF)已经成为一大流行范式。通常来说,RLHF 算法的工作过程分为两个阶段:一、使用人类偏好学习一个奖励函数;二、通过使用强化学习优化所学习的奖励来对齐模型。 RLHF 范式假定人类偏好的分布遵照奖励...
-
能跟「猫主子」聊天了!生成式AI带来的全面革命:最快五年内破译第一种动物语言
所罗门能够与动物交流并不是因为他拥有魔法物品,而是因为他有观察的天赋。 ——康拉德・劳伦兹《所罗门王的指环》 在《狮子王》、《疯狂动物城》等以动物为中心的作品中,作者...
-
AIGC:自动化内容生成,AI 的下一个引爆点?
来源|晨山资本 作者|吴文超 晨山资本副总裁,主要关注底层技术创新、人工智能和信息安全等领域。曾主导并参与了优锘科技、达观数据、雪浪数制、摩尔元数、LinkedMe、富数科技等多个企业的投资。在加入晨山资本之前,吴文超曾就职于明略科技集团,从事大数据研发...
-
【送书福利-第八期】《硅基物语.AI大爆炸: ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来》
大家好,我是洲洲,欢迎关注,一个爱听周杰伦的程序员。关注公众号【程序员洲洲】即可获得10G学习资料、面试笔记、大厂独家学习体系路线等…还可以加入技术交流群欢迎大家在CSDN后台私信我! 本文目录 一、前言 二、内容介绍 三、作者介绍 四、...
-
AIGC和ChatGPT的区别
AIGC和ChatGPT的区别主要在于: - AIGC是一个广泛的概念,包括多种类型的内容生成;ChatGPT是一个具体的产品,只涉及文本生成。 - AIGC可以应用在多个领域和场景;ChatGPT主要应用在语言相关的领域和场景。 - AIGC可能需...
-
NLP-分词器:SentencePiece【参考Chinese-LLaMA-Alpaca在通用中文语料上训练的20K中文词表并与原版LLaMA模型的32K词表进行合并的代码】
背景 随着ChatGPT迅速出圈,最近几个月开源的大模型也是遍地开花。目前,开源的大语言模型主要有三大类:ChatGLM衍生的大模型(wenda、ChatSQL等)、LLaMA衍生的大模型(Alpaca、Vicuna、BELLE、Phoenix、Chim...
-
AIGC实战——卷积神经网络(Convolutional Neural Network, CNN)
AIGC实战——卷积神经网络 0. 前言 1. 卷积神经网络 1.1 卷积层 1.2 叠加卷积层 1.3 检查模型 2. 批归一化 2.1 协变量漂移 2.2 使用批归一化进行训练 2.3 使用批归一化进行预测 3. Dropout 4...
-
测试离线音频转文本模型Whisper.net的基本用法
微信公众号“dotNET跨平台”中的文章《OpenAI的离线音频转文本模型Whisper的.NET封装项目》介绍了基于.net封装的开源语音辨识Whisper神经网络项目Whisper.net,其GitHub地址见参考文献2。本文基于Whisper.n...
-
人工智能推动“电脑嗅觉”用于昆虫控制
机器嗅觉初创公司Osmo于2023年1月成立,获得由Lux Capital和Google Ventures领投的 6000万美元A轮资金。Osmo将机器学习、数据科学、心理物理学、嗅觉神经科学、电气工程和化学融合在一种多学科的气味数字化方法中。 Osm...
-
AI系统能够比人类快1万倍地从卫星图像中绘制巨大冰山地图
科学家们在一项最新研究中成功地训练了一种人工智能(AI)系统,可以在卫星图像上准确地绘制巨大冰山的表面积和轮廓,速度比人类快10,000倍。这项名为《利用深度学习绘制南极巨大冰山的范围》的研究成果发表在《 The Cryosphere》杂志上。 传统的自动...
-
AI专业教您保姆级在暗影精灵8Windows11上本地部署实现AI绘画:Stable Diffusion(万字教程,多图预警)
目录 一、Stable Diffusion介绍 二、Stable Diffusion环境搭建 1.Anaconda下载与安装 2.Pycharm(IDE)下载与安装 3.CUDA、CuDNN下载与安装 三、Stable Diffusion...