-
【AIGC 】一篇文章,帮你了解什么是虚拟数字人?
1.数字人的三方面特征 虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。 虚拟数字人宜具备以下三方面特征: 一是拥有人的外观,具有特...
-
Picpic完全指南:LiblibAI设计工具使用方法教程与免费使用入口
探索Picpic能为你带来哪些改变 为什么选择Picpic? Picpic不仅仅是一款产品——它是一项革命性的技术,致力于利用人工智能简化设计流程,提高设计效率和质量。致力于提供便捷的设计解决方案,Picpic旨在为设计师、设计团队以及对设计有兴趣的个人...
-
【AIGC学习】一文带你了解AIGC基础知识(适用于AI入门/小白)
▌导读 写关于AI的文章内容已有一段时间,不少同学问博主怎么学习AI?有没有系统性学习AI知识及教程? 在这里,锅头整理了AIGC的基础知识和本文学习思维导图,方便提炼重点和学习总结。 在过去的几十年中,人工智能(AI)从科幻小说中的异想...
-
AI绘画工具介绍:以新奇角度分析与探索AI绘画艺术与技术的交汇点
目录 前言 一、AI绘画工具的前沿技术 1.1 深度学习的进化 1.2 GANs的创新应用 1.3 风格迁移的多样化 1.4 交互式AI绘画的智能化 二、艺术与技术的交汇点 2.1 艺术创作的普及化 2.2 艺术风格的创新 2.3 艺术...
-
收藏!AIGC创业者必备,AI绘画商业变现保姆级全攻略
随着AI爆火后,AI绘画也随之兴起,每次都有人问我,AI绘画如何变现。来,既然大家对商业赚钱这一块还是很关心的,那今天给大家分享我正在做的AI绘画的商业项目保姆级攻略,重点会偏向于术。全程很干,希望你耐心看完。 你可以带着思考去结合运用到自己的项目中去,...
-
LLM大模型从入门到精通(6)--Stable Diffusion超详细讲解
本文详细讲解Stable Diffusion的原理与工作流程 一、Stable Diffusion简介 二、Stable Diffusion原理解析 三、Stable Diffusion处理流程 四、结语 一、Stable Diffusi...
-
Stable Diffusion AI绘画|无用师真的无用么?中外老幼男女通吃?高清直出!无用师-亚洲融合终结版!
前言 老铁留言推荐无用师,那么今天它来了~ 今天试玩的是无用师大佬称作的终结版,正如大佬所言,都SD3了,再加上Pony系、Kolors 、混元等众多大模型系列。但老徐觉得在1.5的大模型中很多依然是很能打。虽然在艺术性,镜头感上1.5已经没有什...
-
Stable Diffusion之最全详细图解
Stable Diffusion是一种生成模型,用于生成高质量的图像。这种模型基于扩散过程,能够逐步将噪声转换为清晰的图像。以下是关于Stable Diffusion的详细图解,涵盖其原理、模型结构、训练过程及应用示例。 一、Stable Diffusi...
-
AIGC 文生图 DiffSynth-Studio微调lora训练案例
参考: https://github.com/modelscope/DiffSynth-Studio https://github.com/modelscope/DiffSynth-Studio/tree/main/examples/train/kolor...
-
Midjourney提示词-十二生肖唐装系列-1
A little white rat in a soft Chinese Tang Dynasty Chinese costume, super cute, cinematic lighting, intricate filigree design, Pi...
-
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内著名开源社区OpenBMB发布了最新开源多模态大模型——MiniCPM-V2.6。 据悉,MiniCPM-V2.6一共有80亿参数,在单图像、多图像和视频理解方面超越了GPT-4V;在单图像理解方面优于GPT-4o mini、Gemini1.5Pro...
-
FLUX.1 最强AI绘画开源模型,最新本地部署教程
Stable Diffusion 作者之一 Robin Rombach 官宣创业,成立了新公司「Black Forest Labs」(黑森林实验室),并推出了最新文生图模型「FLUX.1」。Black Forest Labs 在 AI 开发方面拥有丰富的经...
-
【AI绘画】Midjourney到底是什么?看完就懂了!!!
手把手教你入门绘图超强的AI绘画,用户只需要输入一段图片的文字描述,即可生成精美的绘画。给大家带来了全新保姆级教程资料包 (文末可获取) 一、Midjourney 的原理 由 2022 年 3 月,美国一家工作室首次推出一款 AI 制图工具,它就是...
-
阿里开源新语音模型,比OpenAI的Whisper更好!
阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。 Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。 例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一...
-
一文彻底搞定 RAG、知识库、 Llama-3!!
▼最近直播超级多,预约保你有收获 —1— 使用 Llama-3 搞定 RAG 检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它通过将企业外部知识整合到生成过程中,增强了大语言...
-
Stable Diffusion基本原理通俗讲解
Stable Diffusion是一种基于深度学习的图像生成技术,它属于生成对抗网络(GANs)的一种。简单来说,Stable Diffusion通过训练一个生成器(Generator)和一个判别器(Discriminator),来生成逼真的图像。下面我将...
-
LLaMA-Factory
文章目录 一、关于 LLaMA-Factory 项目特色 性能指标 二、如何使用 1、安装 LLaMA Factory 2、数据准备 3、快速开始 4、LLaMA Board 可视化微调 5、构建 Docker CUDA 用户: 昇腾...
-
跟《经济学人》学英文:2024年08月03日这期 GPT, Claude, Llama? How to tell which AI model is best
GPT, Claude, Llama? How to tell which AI model is best Beware model-makers marking their own homework 原文: When Meta, the p...
-
AI日报:阿里开源最新数学模型Qwen2-Math;豆包上线音乐功能;苹果将推高级AI服务;谷歌机器人挑战巴黎奥运
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里开源最新数学模型Qwen2...
-
OpenAI付费功能免费用!却被网友无情嘲讽
快科技8月9日消息,今天OpenAI宣布,将向免费用户开放其{tag_keyurl_3} 3模型的图片生成功能,但这一决策并未收获预期的好评,反而在网上引发了激烈的讨论和嘲讽。 而最主要的原因,就是用户每天仅可以生成两张图片。 DALL-E 3模型自去年9...
-
Stable Diffusion WebUI从入门到精通——提示词篇
前言 === 第六部分:提示词(Prompt 基本概念 在使用 AI 生成图像或进行自然语言处理任务时,提示词(prompts)是关键的工具。通过正确使用提示词,用户可以引导模型生成所需的内容。本部分将介绍提示词的基本概念、语法以及不同类型提示...
-
从LLaMa 3 技术报告,再看LLM构建过程 ——《带你自学大语言模型》系列(番外)
本系列目录 《带你自学大语言模型》系列部分目录及计划,完整版目录见:带你自学大语言模型系列 —— 前言 第一部分 走进大语言模型(科普向) 第一章 走进大语言模型 1.1 从图灵机到GPT,人工智能经历了什么?——《带你自学大语言模型...
-
stable diffusion插件推荐,(插件已打包)高清【图片换脸】,高清【视频换脸】 一键完成
前言 最近发现一个很不错的sdwebui的插件,不仅能完成图片换脸,还能进行视频换脸,而且效果比之前的 faceid和reactor要好很多,更像更高清,哈哈,废话不多说,直接上干货~ 插件是 easyPhoto,实测效果很不错, 插件介绍...
-
【人工智能】如何选择AI绘画工具?Midjourney VS Stable Diffusion
文章目录 ?如何选择合适的AI绘画工具 个人需求选择 比较工具特点 社区和资源</font> ? Midjourney VS Stable Diffusion:深度对比与剖析 使用费用对比 使用便捷性与系统兼容性对比 开源与闭...
-
小米15蓄势待发!雷军预告小米旗舰将接入谷歌AI大模型
快科技8月8日消息,小米创办人雷军在社交平台上宣布,小米旗舰设备国际版将接入谷歌AI大模型Google Gemini,给用户带来更智能、更直观的使用体验。 据悉,Gemini是谷歌研发的多模态AI大模型,能够识别、理解和操作多种类型的信息。 比如你画个鸭子...
-
【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC:几种AIGC底层技术的代码详解
为了更好地理解AIGC(AI Generated Content,人工智能生成内容)的底层技术,我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络(GANs)、变分自编码器(VAEs)和自回归模型(如Transformer和GPT)。 1....
-
本地部署私人知识库的大模型!Llama 3 + RAG!
在今天的的教程中,我们将打造更加个性化的大模型,可以定制搭载私人知识库的本地大模型! 我们探讨Meta AI 的尖端 Llama 3 语言模型构建强大的检索增强生成 (RAG) 来实现。通过利用 Llama 3 和 RAG 技术的功能,我们将创建一个应用...
-
【AI绘画SD】ComfyUI-神级插件-一键高清放大,不改变原图,只做高清处理!
哈喽大家好,我是设计师阿威 以前介绍的一些AI绘画放大插件都是相当于等比例重绘,这就导致了有些细节部分可能会改变,今天给大家分享一个ComfyUI的插件—ComfyUI-SUPIR,可以不改变原图,只做高清处理。下图是作者的案例效果 1、下载插件...
-
llama_fastertransformer对话问答算法模型
LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进,并用于不同的模型,例如 PaLM。以下是与原始架构的主要区别: 预归一化。为了提高...
-
微星新款27寸显示器上市:2K 180Hz曲面屏、支持AI画面增强
快科技8月8日消息,微星推出了新款27寸显示器MAG 275CQPF,采用一种粗犷和坚韧的设计语言,体现了MAG风格的精髓。 据悉,新款显示器采用了27英寸Rapid VA面板,曲率为1500R,10bit色深(8bit FRC),可视角度为178度(水平...
-
AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、奥特曼发草莓图引发猜测暗示Op...
-
奥特曼秀5颗草莓疯狂暗示GPT-5?匿名新模型神秘现身,数学超强!
【新智元导读】奥特曼又来搞事情了!一张5颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘Strawberry项目真实存在。难道GPT-5真的要来了吗? 或许,GPT-5真的不远了。 今天,Sam Altman突然发文「我爱花园里的夏天」,并配图5颗草...
-
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者...
-
AI产品在海外偷摸赚钱,正在变更难
“我们与之前的服务商合作了一年多一直很稳定,但是这几天对方突然停掉了我们的支付。给到的原因是,他们服务的另一家 AI 产品有不符合风控政策的地方,他们作为服务商被信用卡组织罚了10万美元,因为怕产生更多风险,直接停掉了与我们的合作。” 思源解释道。 支付...
-
文心一言 VS 讯飞星火 VS chatgpt (317)-- 算法导论22.3 9题
九、请给出如下猜想的一个反例:如果有向图G包含一条从结点u到结点v的路径,则任何对图G的深度优先搜索都将导致v.d⩽u.f。如果要写代码,请用go语言。 文心一言: 首先,我们需要澄清问题中的几个关键点。在图的深度优先搜索(DFS)中,u.d 通常...
-
Llama-2 vs. Llama-3:利用微型基准测试(井字游戏)评估大模型
编者按: 如何更好地评估和比较不同版本的大语言模型?传统的学术基准测试固然重要,但往往难以全面反映模型在实际应用场景中的表现。在此背景下,本文作者别出心裁,通过让 Llama-2 和 Llama-3 模型进行井字游戏对决,为我们提供了一个新颖而有趣的模型评...
-
Stable Diffusion提示词只看这一篇就够了
一、Stable Diffusion概述 Stable Diffusion是一种基于扩散模型的图像生成技术,广泛应用于AI绘画领域。通过合理使用提示词,用户可以精确控制生成图像的内容和风格。 本文将详细讲解Stable Diffusion的提示词语...
-
开源模型也能强过闭源?Llama 3.1-405B数值对标GPT4!
Llama 3.1-405B引起AI浪潮:开源模型也能强过闭源? Llama 3.1 就这几天,只要你有在关注AI相关的事,你就会看见一群人在讨论 Meta 新出的 Llama 3.1。外网无数的业内大佬都在为之疯狂,因为 Llama3...
-
Stable Diffusion教程|练丹师是如何炼丹的Lora模型训练
前言 还记得我们之前就讲过学习SD成为炼丹师不?那么今天就来手把手教大家炼丹,看看同一个角色或某种风格的小模型是如何制作出来的。 目录 1 炼丹介绍 2 环境准备 3 Lora模型训练 **一、**炼丹介绍 什么是炼丹? 早在学习SD地第...
-
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【新智元导读】科学家正在通过AI的力量,改变乳腺癌的现状。 在全球范围内,每年有超过60万名女性因乳腺癌而无法存活。 美国有八分之一的女性一生中会被诊断出患有乳腺癌。 这些数字听起来很可怕,但并非毫无希望。 当处于最早的局部阶段时,5年相对生存率为99%...
-
Stable Diffusion【应用篇】【艺术写真】:AI写真看过来,使用IP-Adapter-FaceId插件实现AI写真
目前换脸插件有很多,比较典型的有Roop,ReActor,IP-Adapter,InstantID,今天我们来看看使用IP-Adapter-FaceId插件实现AI写真的制作方法。 一. IP-Adapter新模型的下载 插件下载地址(文末扫码也可获取...
-
从科幻到现实:AIGC助力打造个性化数字人
文章目录 一、技术基础:多领域技术的深度融合 1.先进的人工智能技术: 2.实时交互与反馈机制: 3.个性化定制技术: 二、打造策略:从设计到实施的全方位考量 1.深入理解用户需求: 2.精细化设计与开发: 3.持续优化与迭代: 三、未...
-
Gary Marcus:生成式AI泡沫将退,神经符号AI才是未来
近日,人类神经科学和人工智能交叉领域的学者Gary Marcus发文,对生成式人工智能的未来做出了大胆预测:在接下来的12个月内,当前围绕生成式人工智能的泡沫将会破裂。他认为,“生成式人工智能最根本的缺陷在于其可靠性问题”,系统仍会产生幻觉进而生成虚假信息...
-
阿里国际推出首个专业版AI Search,为什么它会是下一个B2B谷歌?
经历过「千模大战」的喧嚣,一年半之后,生成式 AI 的应用层创新终于步入爆发期。 年初的 Sora 激起一阵 AI + 视频生成的浪潮。涟漪未散,OpenAI 新的 SearchGPT 又燃起了 AI + 搜索的战火。 AI + 搜索,这其实是生成式 AI...
-
stable diffusion中的UNet2DConditionModel代码解读
UNet2DConditionModel总体结构图片来自于 https://zhuanlan.zhihu.com/p/635204519 stable diffusion 运行unet部分的代码。 noise_pred = self.unet(...
-
AI绘画进阶工具 ComfyUI 新版来啦!操作界面详解!取消悬浮面板,自带工作流管理功能!(附安装包)
大家好,我是画画的小强 在 7 月初的一次更新中,ComfyUI 官方推出了 Beta 版 UI,取消了原本的悬浮面板,还新增了工作流管理功能,整体使用体验比之前好了很多。今天就为大家详细介绍一些新版 UI 的特点和用法。 一、启用方式 如果想启用...
-
iPhone 16将于今年秋季发布 没有预装AI功能
据行业资深编辑透露,iPhone 16系列将于今年秋季如期发布。根据曝光的信息,这款手机将没有预装AI功能。 苹果公司需要很长时间才能完善AI体验,因此iPhone 16系列出厂时不会搭载Apple Intelligence。虽然苹果CEO库克曾表示该功...
-
AI日报:智谱开源清影同源“兄弟”CogVideoX;阿里通义App推出角色扮演功能;即梦视频生成推动效画板功能;OpenAI领导层大动荡!
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、智谱AI宣布开源「清影」同源视...
-
智谱AI刚刚把他们的Sora「清影」,正式开源了,我爱他们。
大半夜的,大洋对岸不卷,国内公司卷起来了。 我真的想睡觉,真的。 起因是我睡觉之前,在看Github的时候,无意间看到THUKEG这个号,更新了一个项目。 CogVideoX。 网址在此:https://github.com/THUDM/CogVideo...
-
做AI转录,拿下日本、实现千万美金ARR
不久前,A16z AI 合伙人Olivia Moore分享了一张 AI 转录初创公司图谱,面向企业服务(B2B)的转录公司不仅数量多,更涉及人宠医疗、招聘、销售和会议等多元场景。其中作为“打工人刚需”的会议场景转录,参与厂商众多,我们也从中发现了一家非常有...