-
【AI画图】stable-diffusion-webui学习之一《安装部署》
简介 Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它是一种潜在扩散模型,它由创业公司Stability AI与多个学术研究者和非营利组织合作开发。目前的SD的源代码和模型都已经开源,在Github上由AUTOMATIC...
-
猴王归来:AIGC让《黑神话:悟空》生动跃然屏幕
《黑神话:悟空》横空问世 2018年立项,经历6年半的“磨难”,被誉为中国第一款3A大作游戏——《黑神话:悟空》终于面世。 目前,该游戏预售就已经破4亿元,IGN中国甚至给这款游戏打出了10分的满分评价。 无论是悟空褶皱清晰的服装,花纹精美的金箍...
-
【AIGC数字人】EchoMimic:基于可编辑关键点条件的类人音频驱动肖像动画
GitHub:https://github.com/BadToBest/EchoMimic 论文: https://arxiv.org/pdf/2407.08136 comfyui: https://github.com/smthemex/ComfyU...
-
Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task3笔记
在task2中,已经借助AI工具对AIGC生图的代码进行精读。在本章中则更加关注于了解Lora微调的基本原理以及文生图的工作流平台工具ComfyUI的使用。 task2链接:Datawhale X 魔搭 AI夏令营 第四期魔搭-AIGC文生图方向Task...
-
推荐文章:深度探索图像生成新境界 - TensorRT Extension for Stable Diffusion
推荐文章:深度探索图像生成新境界 - TensorRT Extension for Stable Diffusion Stable-Diffusion-WebUI-TensorRTTensorRT Extension for Stable Diffus...
-
用 LoRA 微调 Stable Diffusion:拆开炼丹炉,动手实现你的第一次 AI 绘画
总得拆开炼丹炉看看是什么样的。这篇文章将带你从代码层面一步步实现 AI 文本生成图像(Text-to-Image)中的 LoRA 微调过程,你将: 了解 Trigger Words(触发词)到底是什么,以及它们如何影响生成结果。 掌握 LoRA 微调...
-
llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程
llama3.cuda: 纯C/CUDA实现的Llama 3模型使用教程 llama3.cudallama3.cuda is a pure C/CUDA implementation for Llama 3 model.项目地址:https://git...
-
AI PC(智能电脑)技术分析
一文看懂AI PC(智能电脑) 2024年,英特尔、英伟达等芯片巨头革新CPU技术,融入AI算力,为传统PC带来质的飞跃,引领智能计算新时代。 2024年,因此被叫作人工智能电脑(AI PC)的“元...
-
【AI学习】AI绘画发展简史
无意中读了一篇发表自2022年的文章,《AI绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的AI绘画发展史》,写的比较有意思,科普了好多我原来不知道的历史。 简单提炼一下,做个笔记。 AI绘画重要事件 2012年 Google两位大名鼎鼎的...
-
【人工智能时代】-分享15个全球顶尖的AIGC图片生成平台
人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。 发展至今已经有很多AI图像生成平台,他们的共同特点就是使用人工智能将文本转换为图像,这是一次革命性的突破,也就是说通过这些AI工具可以在几秒钟内将文字转换成更具可视...
-
[AIGC] DAG任务调度的概述与实践
DAG(Directed Acyclic Graph,有向无环图 作为任务调度的基础模型,在大规模数据处理和计算过程中有着广泛的应用。本文将对DAG模型的原理进行解释并列出一些常用的任务调度工具。 文章目录 一、什么是DAG? 二、...
-
`llama-journey` 开源项目安装与使用指南
llama-journey 开源项目安装与使用指南 llama-journey Experimental adventure game with AI-generated content 项目地址: https://gitcode.com/g...
-
【AI绘画】玩了100小时SD后,我整理了一份SD插件大全...
大家好,我是写编程的木木。 最近AI视频到了空前的热度,在镜头语言上太秀了,毕竟AI只是一个效率工具,我觉得对于职业设计师来说,跟C4D、Blender之类工具我觉得没有本质区别。 在跟小伙伴聊AI视频时,发现很多人都还不知道怎么做的。 我说这就应该...
-
在矩池云使用 Llama-3.2-11B-Vision 详细指南
Llama 3.2-Vision是Meta开发的一系列多模态大型语言模型(LLMs),包含11B和90B两种规模的预训练和指令调整模型。 这些模型专门优化用于视觉识别、图像推理、字幕生成和回答有关图像的一般问题。Llama 3.2-Vision模型在常见...
-
什么是AIGC?什么是大模型?具体有什么应用?
什么是AIGC? AIGC,英文全称是Artificial Intelligence Generated Content,翻译成中文的大白话意思就是“人工智能生成的内容”。比如AI(Artificial Intelligence,人工智能)生成文本、图...
-
Stable Diffusion AI算法,实现一键式后期处理与图像修复魔法
在当今数字影像时代,后期处理技术已成为将原始图像转化为视觉上令人惊叹艺术作品的点睛之笔。随着人工智能技术的飞速发展,尤其是Stable Diffusion技术在图像处理领域的应用,图片后期处理已达到前所未有的高度,为摄影师、设计师及视觉艺术爱好者提供了一...
-
如何使用微软的Copilot AI工具将Word文档转换为PowerPoint
Copilot 让你可以将 Word 文档转换为 PowerPoint 演示文稿,使你能够以最小的努力制作出有针对性的演示文稿。这个功能是微软AI工具包的一部分,对于那些曾经盯着空白幻灯片不知道从何开始的人来说,这是一个颠覆性的改变。要充分利用这个工具,你...
-
中文法律LLaMA (Lawyer LLaMA) 使用教程
中文法律LLaMA (Lawyer LLaMA 使用教程 lawyer-llama中文法律LLaMA (LLaMA for Chinese legel domain 项目地址:https://gitcode.com/gh_mirrors/la/law...
-
推荐:Whisper Auto Captions - 创新的Final Cut Pro自动字幕工具
推荐:Whisper Auto Captions - 创新的Final Cut Pro自动字幕工具 项目介绍 Whisper Auto Captions 是一款基于OpenAI的Whisper模型打造的智能字幕插件,专为Final Cut Pro用...
-
OpenAI发布实时API公测版 3家语音API合作者揭晓
10月2日消息,今天,OpenAI发布了实时 API 公开测试版,用于构建基于GPT-4o语音到语音的AI应用和智能体,所有付费的开发者都能在应用程序中构建低延迟、多模态的实时互动体验。 同时,OpenAI 还公布了3家语音API合作者:LiveKit、A...
-
谷歌 Chromebook 推出专属 Google AI 的新按钮
Google 宣布推出两款新的 Chromebook——三星的 Galaxy Chromebook Plus 和联想的 Chromebook Duet 11,并引入了一个全新的按钮。这个按钮被称为「Quick Insert(快速插入)」,旨在为用户提供快速...
-
探索无限创意:基于C++的Stable Diffusion图像生成库
探索无限创意:基于C++的Stable Diffusion图像生成库 axodox-machinelearning This repository contains a C++ ONNX implementation of StableDiffus...
-
AI智能体到底该怎么搞,腾讯元器先打了个样
如果说2023年科技圈的关键词是“大模型”,那么到了2024年,大家更关心的就已经不再是大模型本身,而是能用大模型来干什么。在此前经历了喧嚣的“百模大战”之后,大模型的商业化成为了摆在国内AI厂商面前最重要的一个挑战,在目前的一众AI产品里,AI智能体(A...
-
乏善可陈的第二届OpenAI开发者大会,果然没有掀起太大波澜
OpenAI 的宫斗大戏刚落下帷幕,今日凌晨就在旧金山召开了第二届 DevDay 开发者大会。 不过,与去年盛大的活动相比,今年略显低调,他们没有推出重大产品,而是选择对其现有的 AI 工具和 API 进行增量改进。 在这次活动中,OpenAI 发布了四大...
-
LLaMA-Factory 让大模型微调变得更简单!!
背景 如果只需要构建一份任务相关的数据,就可以轻松通过网页界面的形式进行 Fine-tuning 微调操作, 那么必将大大减轻微调工作量。 今年的 ACL 2024见证了北航和北大合作的突破—论文《LLAMAFACTORY: 统一高效微调超百种语言...
-
OpenAI 宣布 66 亿美元新融资 公司估值达到 1570 亿美元
根据 OpenAI 公司发布的博客文章,OpenAI 刚刚完成了一轮历史性融资,筹集了 66 亿美元,估值达到 1570 亿美元,将继续追求其构建通用人工智能的使命。 据《金融时报》报道,本轮融资由 Thrive Capital 领投,承诺投资 10 亿...
-
奥特曼:自认比o1聪明请举手🤚到o2还这么想么🤨?|OpenAI开发者日
这一幕,刚刚在OpenAI开发者日最后一个环节——奥特曼炉边谈话中上演。 对话由奥特曼和OpenAI首席产品官Kevin Weil进行,奥特曼还对未来作出如下判断: 无限上下文长度将在十年内发生 o1正在推动智能体应用,人们将要求AI在一小时内完成以前人...
-
OpenAI官宣464亿新融资,成为万亿独角兽!还针对马斯克xAI搞二选一
464亿元资金,11051亿元投后估值! OpenAI新一轮融资,现已尘埃落定——刷新硅谷历史最高融资纪录。 尽管刚经历高管动荡,苹果也未按早期传闻参与其中,OpenAI官方公告仍显示: 本轮融资由OpenAI老股东Thrive Captial领投,微...
-
Stable Diffusion最强功能—— 图片背景完美替换
今天分享 Stable Diffusion 图片背景完美替换 功能,通过 Stable Diffusion 图生图重绘蒙版进行背景图的二次重绘。 在广告产品图、头像背景替换、图片后期处理等场景下用到的都很频繁。 整体步骤: 通过 removebg...
-
llama-factory实战: 基于qwen2.5-7b 手把手实战 自定义数据集清洗 微调
基于qwen2.5 手把手实战 自定义数据集 微调(llama-factory) 准备工作 1.数据集准备(例:民法典.txt) 2.服务器准备(阿里云 DSW 白嫖) 3.环境配置 pip 升级 模型下载 微调助手 4.数据集处理 脚...
-
微软推送Windows 11 2024更新:新增多项AI体验 NPU终于有了用武之地
快科技10月3日消息,近日,微软开始向广大用户全面推送Windows 11 2024更新。 其实按照惯例应被成为Windows 11 24H2更新,但由于微软放弃了以往1年2次重大版本更新周期,整个2024年只更新了这一个大版本,因此被设定为Windows...
-
Midjourney保姆级安装教程
01---打开网站 http://discord.com/ (需要科学上网 02---下载对应的版本(mac需点击首页上方下载并下滑找到对应版本) 03---打开文件夹直接安装 04---安装好后进入登陆页面 05...
-
Whisper JAX:闪电般快速的语音识别框架
Whisper JAX:闪电般快速的语音识别框架 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gi...
-
Flux.1:AI绘画的新标杆,文生图效果秒杀MJ、SD
大家好,我是爱绘画的彤姐。 AI绘画技术正以前所未有的速度发展,其中Flux.1的出现标志着这一领域的新高度。 由Black Forest Labs推出的Flux.1,不仅在图像细节和风格多样性上树立了新的标杆,还在开源社区中迅速形成了一个活跃的生态系...
-
如何在AI绘画SD中调节光照?这2个超好用的方法别错过!轻松生成AI人像光感大片!
大家好,我是程序员晓晓 在AI绘画Stable Diffusion 摄影艺术中,灯光的运用对于照片的质量和情感表达至关重要。它不仅能够彰显主题,还能为画面增添深度与立体感,帮助传递感情,以及凸显细节之美。 下面,我将向大家展示二种灯光运用的技巧:...
-
AI绘画Stable diffusion小白入门:文生图精讲,超全干货一定要看!
大家好,我是设计师阿威 今天,我们将深入了解Stable diffusion的文生图功能,让你也能生成满意的图片! 如上图,这是Stable diffusion的文生图界面,这个界面总体可以分为五个区域: 模型区:调整/更换模型的地方 提...
-
从零预训练一个tiny-llama#Datawhale组队学习Task2
完整的教程请参考:datawhalechina/tiny-universe: 《大模型白盒子构建指南》:一个全手搓的Tiny-Universe (github.com 这是Task2的学习任务 目录 Qwen-blog Tokenizer(分词器...
-
#midjourney精选咒语分享#0924
#鱼辞AIGC | 咒语自由# AI绘画咒语,midjourney关键词 ,midjourney提示词 ,sref风格种子,鱼辞,鱼辞aigc, AI绘画社区 ,AIGC社区。 ❀更多咒语,sref种子请访问:鱼辞AIGC网站❀ https://ww...
-
Rusty Llama Webapp:用Rust打造的高效聊天机器人
Rusty Llama Webapp:用Rust打造的高效聊天机器人 rusty_llamaA simple ChatGPT clone in Rust on both the frontend and backend. Uses open sourc...
-
【AIGC】ComfyUI安装及常见问题cuda及pytorch安装教程
说明:ComfyUI安装方式有很两种,第一种是下载独立包。独立包下载到本地后,即可使用。不需要搭建(安装)python、cuda、cudnn、pytorch环境. 第二种是,手动安装。手动安装要复杂很多,需要搭建开发环境,即安装python、cuda、c...
-
TaskbarDock:个性化定制你的Windows 10任务栏
TaskbarDock:个性化定制你的Windows 10任务栏 TaskbarDockCustomize Windows 10 Taskbar with few extra features项目地址:https://gitcode.com/gh_mi...
-
Llama 3.1 技术研究报告-3
四、后训练 我们通过对预训练检查点进⾏多轮后训练,或在预训练检查点的基础上与⼈类反馈(Ouyang等⼈,2022年;Rafailov等⼈,2024年)对⻬模型,以产⽣对⻬的Llama 3模型。每⼀轮后训练包括监督式微调(SFT)和直接偏好优化(DPO;...
-
国内外大模型汇总:Open AI大模型、Google大模型、Microsoft大模型、文心一言大模型、通义千问大模型、字节豆包大模型、智普清言大模型
Open AI大模型 特点: 多模态能力:如GPT-4o,能接受文本、音频、图像作为组合输入,并生成任意形式的输出。 情感识别与回应:具备情感识别能力,能根据对话者的情绪做出有感情的回应。 几乎无延迟:对音频输入的响应时间极短,与人类对话相似。...
-
Linly-Talker容器构建
一、模型介绍 Linly-Talker 是一款集成了多种人工智能技术的数字人对话系统,它通过多模型集成、多轮对话能力、语音克隆技术、实时互动和视觉增强,为用户提供了一种全新的交互体验。 二、特点 智能和个性化 :系统不仅能够理解并生成自然语言,还...
-
13 Midjourney从零到商用·进阶篇:灯光、角度与风格等精细控制方法
在前面我们了解了提示词的书写,那么如何利用提示词来精确控制生成画面的灯光、角度与风格 呢?在本篇文章中我么一起来探讨一下。 一、灯光 在摄影中,对灯光的要求都是非常高的。灯光能对人物、动物、物体、场景等进行修饰。每一...
-
Chinese-Vicuna: 一个基于LLaMA的中文指令跟随模型
Chinese-Vicuna简介 Chinese-Vicuna是一个基于LLaMA的中文指令跟随模型,由研究者开发,旨在以低资源的方式实现高效的中文语言模型训练。该项目的主要目标是构建和分享可以在单个Nvidia RTX-2080TI上训练的中文指令跟随...
-
效率暴涨!5 款设计师必备的 Stable Diffusion WebUI 模型,三分钟十张图,再也不用熬夜加班了!
大家好,我是画画的小强 今天继续为大家推荐 5 款优质的设计类 Stable Diffusion WebUI 风格模型,包含电商设计、产品摄影、矢量扁平插画、古风工笔等多种风格。 一、设计 | 电商展台 这是一款非常优秀的电商展台设计模型,包含极简...
-
Stable Diffusion 必备插件推荐,菜鸟轻松成高手!
一个刚学AI绘画的小菜鸟如何快速成为Stable Diffusion高手?答案就是SD插件。 只要学会使用SD的各种插件,帮你写正向和负向提示词,修复人脸/身体/手指,高清放大图片,指定人物pose,图片微调等等都可以轻松搞定,善用插件是成为高手必经之路...
-
【AIGC】Kolors:快手开源的文生图大模型
GitHub:GitHub - Kwai-Kolors/Kolors: Kolors Team 论文:Kolors/imgs/Kolors_paper.pdf at master · Kwai-Kolors/Kolors · GitHub comfyu...
-
深度技术分析:Meta Llama 3模型训练故障剖析
## 摘要 Meta公司在一项涉及16,384个Nvidia H100 80GB GPU的Llama 3 405B模型训练中,遭遇了频繁的硬件故障。在54天的训练期间,平均每三小时就发生一次组件故障,其中半数故障与GPU或其HBM3内存有关。尽管面临如此挑...