-
VAE(Variational auto-encoder)
1.VAE(Variational auto-encoder) 笔记来源及推荐文章: 1.变分自编码器(一):原来是这么一回事 2.变分自编码器(二):从贝叶斯观点出发 3.变分自编码器(三):这样做为什么能成? 4.变分自编码器(四):一步到位的聚类...
-
秘密 llama:全栈式私有LLM聊天机器人指南
秘密 llama:全栈式私有LLM聊天机器人指南 secret-llamaFully private LLM chatbot that runs entirely with a browser with no server needed. Suppor...
-
Flux【基础篇】:Flux&Midjourney&SDXL模型出图对比:人体结构&动作姿势
大家好我是安琪!!! 前面和大家分享了Flux在手部和脚,以及细节质量生成图片的效果对比。 今天我们看一下Flux在人体结构上面的表现。主要是以下3个模型的对比。 Flux.1 Dev Midjourney V6.1 SD大模型:万享XL...
-
SwiftWhisper 开源项目教程
SwiftWhisper 开源项目教程 SwiftWhisper? The easiest way to transcribe audio in Swift项目地址:https://gitcode.com/gh_mirrors/sw/SwiftWhis...
-
AI绘画【ComfyUI】爽玩必备!6大插件汇总推荐
工欲善其事必先利其器,今天来给大家介绍6款ComfyUI中必备的插件,有了它们,你才能真正的享受到连连看的快乐!排名分先后,越往后越重要! 插件安装管理器 SDXL风格样式 ComfyUI界面汉化 中文提示词输入 蟒蛇八卦工具箱...
-
[Sigcomm论文解析] Llama 3训练RoCE网络
最近正在开的Sigcomm上, Meta有一篇论文《RDMA over Ethernet for Distributed AI Training at Meta Scale》[1]详细介绍了它的物理网络部署和相关的拥塞控制机制. 本文来对它进行一些详细的解...
-
AI日报:更稳更高清!可灵AI发布1.5版本;字节推音乐生成神器;阿里通义万相视频生成模型正式上线
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、可灵AI发布1.5版本 视频更...
-
【AIGC】MimicMotion:姿态引导的高质量人体运动视频生成技术
资源 论文:https://arxiv.org/pdf/2406.19680 github:https://github.com/Tencent/MimicMotion comfyui:https://github.com/kijai/ComfyUI...
-
告别熬夜苦战,拥抱AI写作:5款智能工具助你飞跃写作效率与品质
写作是一座需要跨越的“独木桥”,无论要进行科研、准备课程汇报,还是参与学生时代的各类竞赛,都需要我们付诸足够的耐心。简单想想,从资料搜集到结构搭建,再到文案撰写和语言润色,写作的每个环节都可能让人感到无从下手。 好在,如今AI领域的蓬勃发展,使得我们不再...
-
【万字干货】掌握 Midjourney 提示词技巧成为 25 个流派的摄影大师
Midjourney以其惊世骇俗的图像生成能力彻底变革了摄影艺术。从此每个人都是一个艺术家,在 Midjourney 的数字画布上的每一笔都不是一抹颜料,而是一个变革性的想法。 它之所以能够生成如此逼真的图像,就是因为它用成千上万的摄影图片训练而成。因此...
-
AIGC时代,仅用合成数据训练模型到底行不行?来一探究竟 | CVPR 2024
首个针对使用合成数据训练的模型在不同稳健性指标上进行详细分析的研究,展示了如SynCLIP和SynCLR等合成克隆模型,其性能在可接受的范围内接近于在真实图像上训练的对应模型。这一结论适用于所有稳健性指标,除了常见的图像损坏和OOD(域外分布)检测。另一方...
-
手把手带你了解和实践扩充 LLaMA 大语言模型的 tokenizer 模型(实现中文token过程)
目前,大语言模型呈爆发式的增长,其中,基于llama家族的模型占据了半壁江山。而原始的llama模型对中文的支持不太友好,接下来本文将讲解如何去扩充vocab里面的词以对中文进行token化。 一般的,目前比较主流的是使用sentencepiece训练中...
-
AIGC AI生成内容产业展望报告:开启内容创作新时代
AIGC AI生成内容产业展望报告:开启内容创作新时代 AIGCAI生成内容产业展望报告-34页.zip项目地址:https://gitcode.com/open-source-toolkit/89d4b 项目介绍 在数字化浪潮的推动下,人工智能...
-
阿里史上最大规模开源发布,超GPT-4o 、Llama-3.1!
今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。 这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企...
-
DataWhaleX魔搭AI夏令营第四期AIGC方向task03笔记
目录 ComfyUI 简介 ComfyUI核心模块 ComfyUI图片生成流程 优势 速通安装ComfyUI 使用ComfyUI Lora微调 简介 原理 参数详情 高质量的数据集的准备 明确需求和目标 数据集来源 ta...
-
AI时代,服务器厂商能否打破薄利的命运?
AI大模型正在引发新一轮的“算力焦渴”。 近日,OpenAI刚发布的o1大模型再次刷新了大模型能力的上限。对比上一次迭代的版本,o1的推理能力全方位“吊打”了GPT-4o。更优秀的能力,来自与o1将思维链引入进了推理过程。在o1对问题“一边拆解一边回答”的...
-
使用微调神器LLaMA-Factory轻松改变大语言模型的自我认知
一、引言 在本地化部署大语言模型时,为了能够改变大语言模型的自我认知,最简单的方式,就是使用系统提示词(system_prompt)的方式,譬如在与大模型进行对话时,首先将这段话作为message发送给大模型——{"role":"system","con...
-
互联网已经被 AI 污染的差不多了
最近一张用AI批量做号的微信截图流传在各个群里,有人自爆用AI在小红书做了一个庞大的虚假账号矩阵,通过售卖账号进行变现。 这并非个例,你有没有一种感觉,现在刷手机的时候越来越分不清真实和虚拟了?当你浏览社交媒体、搜索信息或阅读文章和观看视频时,你真的能分...
-
【AI绘画】颠覆性工作流!ComfyUI如何将图片变为个性化3D盲盒
大家好,我是爱绘画的彤姐。 探秘ComfyUI的创新工作流:从图片到3D盲盒的奇妙转变 你是否曾想过,只需要一张普通的图片,就能瞬间生成一个独一无二的3D盲盒? 这听起来像是在讲一个天方夜谭的故事,但如今,ComfyUI团队的最新创意工作流让这一...
-
人均融资1亿美元,一个有故事可讲的AI赛道
在《从46款 AI 教育产品,看全球八大市场用户学习偏好》一文中,我们讨论了目前 AI 在语言学习、数学和综合学习方向的应用,不同市场的用户偏好以及 AI 语言学习产品的产品设计和商业模式,获得了大家的关注、好评和转发,这一期将作为“AI+教育”系列的中篇...
-
AI绘画基础教学:我用AI做建筑设计,10分钟完成100个方案
人工智能进入大众视野,就是ChatGPT给所有人打开了一扇通往人工智能世界的大门,面对这样一个强大又不太好驾驭的工具,很多人都经历了从惊讶、到惊喜,再到不知道能干啥用的茫然。 AI能帮人们做什么?建筑行业有哪些专门针对不同场景的AI应用?哪些方向值得大...
-
智能体时代,AI正从“神坛”走向“人间”
从通用大模型到行业大模型,人工智能的新风口开始吹到了AI智能体(AI Agent),AI开始从“神坛”走向“人间”。 近日,多个科技巨头都带来了以“智能体”为代表的AI应用,蚂蚁集团发布了三款AI新品并推出独立AI原生App“支小宝”,同时启动支付宝智能体...
-
大规模语言模型从理论到实践 LLaMA分布式训练实践
大规模语言模型从理论到实践 LLaMA分布式训练实践 作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来 随着深度学习的快速发展,大规模语言模型(La...
-
AI绘画 | 一文看懂 ControlNet基本操作详解
大家好,我是爱绘画的彤姐。 无论使用 Stable Diffusion 生成图片还是视频,基本都离不开 ControlNet 的辅助。 ControlNet 作为 Stable Diffusion 最强,也是必须要掌握的插件。 ControlNet...
-
如何注册rfid卡 ai写作
标题:RFID卡注册全攻略:便捷高效,重塑生活新体验 内容 在科技日新月异的今天,RFID(无线射频识别)技术凭借其独特的非接触式自动识别能力,正逐步渗透到我们生活的方方面面,成为推动社会进步的重要力量。RFID卡作为这一技...
-
超详细的Stable Diffusion(SD)本地部署教程,小白一看就会。
前言 一、Stable Diffusion 是什么? 简单来讲,Stable Diffusion(简称 SD)是一款 AI 自动生成图片的软件。 我们输入文字,SD 就能生成相应的图片,不再像过去那样需要把图片“画”出来或者“拍”出来。 有人说,...
-
Stable Diffusion绘画 | ControlNet应用-Inpaint(局部重绘):更完美的重绘
Inpaint(局部重绘 相当于小号的AI版PS,不但可以进行局部画面的修改,还可以去除背景中多余的内容,或者是四周画面内容的扩充。 预处理器说明 Inpaint_Global_Harmonious:重绘-全局融合算法,会对整个图片的画面和色调均有...
-
用这个AI工具,1分钟制作爆火的姓氏头像,多篇10w+(附详细教程)
大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年+,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 前段时间,X小鹿写了一篇靠「姓氏头像」爆火的玩法,没想到有 100 多人加小鹿问什么工具,怎么...
-
【AI绘画】零基础入门ComfyUI(二)快手可图Kolors大模型
大家好,我是写编程的木木。 7月6日,快手在世界人工智能大会(WAIC)上宣布,快手旗下的文生图大模型可图(Kolors)将全面开源。可图(Kolors)支持中英文双语,生成效果比肩 Midjourney-v6水平,支持长达256字符的文本输入,具备英文...
-
探索未来艺术创作的助手:Midjourney 自动化机器人
探索未来艺术创作的助手:Midjourney 自动化机器人 midjourney-automation-botThis repository hosts the Midjourney Automation Bot, a free script leve...
-
【AI绘画】Stable Diffusion 插件 Controlnet 安装使用教程(图像精准控制),附安装包+学习资料
大家好,我是木木。 Stable Diffusion WebUI 的绘画插件 Controlnet 最近更新了 V1.1 版本,发布了 14 个优化模型,并新增了多个预处理器,让它的功能比之前更加好用了,最近几天又连续更新了 3 个新 Reference...
-
用Transformers库运行Llama-3.1-Minitron-4B
我的笔记本来自8年前的旧时代,勉强能运行8B模型,于是打算试试看更小的…… Llama-3.1-Minitron 4B 简介 Llama-3.1-Minitron 4B 是基于Llama-3.1 8B模型,通过结构化权重剪枝和知识提炼技术优化而成的...
-
AI绘画神器 Fooocus 2.0 来啦!出图质量升级+新增4大实用功能!低配电脑必用的AI绘画工具教程
大家好,我是画画的小强 之前为大家推荐过一款融合了 midjourney 和 stable diffusion 优点的 AI 绘画工具 Fooocus,它用的是开源的 SDXL 1.0 模型,可以免费生成高质量的图像,同时操作界面又如 Midjourne...
-
探索未来工作通讯的智能伙伴:Mattermost Copilot 插件
探索未来工作通讯的智能伙伴:Mattermost Copilot 插件 mattermost-plugin-aiMattermost plugin for LLMs项目地址:https://gitcode.com/gh_mirrors/ma/matte...
-
目前AI领域的自媒体是怎么赚钱的呢?
现在年轻一代的家长越来越重视孩子的教育,很多都在给孩子进行早教,最常见的形式就是给孩子读绘本,绘本从哪来?有需求就有赚钱的机会,今天和大家分享的就是——AI儿童绘本项目,之前做绘本副业挣了1800+,方法简单好上手,适合宝妈。 一、变现方式 绘本故...
-
【AI绘画】零基础入门ComfyUI(一)初识ComfyUI
大家好,我是写编程的木木。 AIGC 中文本生成图片的两大阵营,Stable Diffusion 和 Midjourney 。 Midjourney 于 22 年3 月面世,22 年 7 月份的公测 v3 版本火出圈,迅速成为讨论焦点。同年7月Stabl...
-
AIGC行业的发展前景与市场需求
简介:探讨当前时机是否适合进入AIGC行业,考虑行业发展阶段和市场需求。 方向一:行业前景 AIGC(人工智能生成内容)行业是近年来随着人工智能技术的快速发展而兴起的一个新兴领域,它涉及到使用人工智能技术来自动生成文本、图像、音频和视频等内容。...
-
深度解析丨AI绘画StableDiffusion如何实现模特精准换装,以及如何将假人模特替换成真人模特!
大家好,我是灵魂画师向阳 今天给大家分享一下用AI绘画Stable Diffusion 进行模特换装!本篇教程主要运用StableDiffusion这个工具来进行操作,下面会通过几个小案例,给大家展示不同需求下,我们该如何使用StableDiffusio...
-
金山WPS AI会员、大会员已超100万!鸿蒙版全端流畅
快科技9月18日消息,金山办公披露,目前AI会员、大会员累计年度付费用户数合计已经超过100万,WPS AI也已接入全线产品。 金山办公还确认,与华为共同合作推出了WPS鸿蒙版,在全端流畅运行,并支持多平台账号统一、跨端调用、跨屏协同等功能。 今年4月,金...
-
AIGC实战——多模态模型Flamingo
AIGC实战——多模态模型Flamingo 0. 前言 1. Flamingo 架构 2. 视觉编码器 3. Perceiver 重采样器 4. 语言模型 5. FIamingo 应用 小结 系列链接 0. 前言 我们已经学习了文...
-
“跨时空拥抱”风靡TikTok,这款AI视频工具借势变现20万美金
用AI生成跨时空拥抱最近悄悄在海外翻红,还带火了一款AI视频产品。 8月28日,TikTok博主“iammskira”发布了一条配文为“用AI实现了拥抱我的妈妈,因为她已经不在人世了”的短视频教程,在TikTok上走红。 视频中,AI不仅将两张不同时空中拍...
-
ai绘画文生图怎么制作?2024教你快速进行ai绘画
ai绘画文生图怎么制作?2024教你快速进行ai绘画 AI绘画技术的迅速发展,使得用户只需输入文本描述,就能生成符合要求的图像,这种“文生图”(Text-to-Image)功能使得绘画和创作变得简单、高效。以下是5款帮助你快速进行AI绘画的工具,这些软件...
-
探索大模型和 Multi-Agent 在运维领域的实践
摘要:本文从智能运维面临的挑战和痛点出发,介绍企业运维领域应用 AIGC 的实践案例,基于确定性运维的实践经验,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。 本文分享自华为云社区《LLM...
-
字节AI,“软硬”兼施
属于AI的投资热潮仍在继续,只不过资本的注意力开始由“软”变“硬”。 无数海外初创公司前仆后继下,今年8月中旬,国内掀起了一阵围绕AI智能眼镜的投资热潮 。大模型为可穿戴硬件“注入灵魂”的想象力,快速在全球范围内形成共识。 直至9月,AI眼镜概念股退潮回落...
-
真人图像生成决胜赛:Flux 对阵 Midjourney,谁更强?
作者:老余捞鱼 原创不易,转载请标明出处及原作者。 写在前面的话: 本文将 “文生图” 领域的新贵 Flux 与传统王者 Midjourney 进行了三轮关于真实人物图像生成的比较。历经三次同一标准的测试后,对二者的性能...
-
Copilot for Microsoft 365 Plugins 示例项目教程
Copilot for Microsoft 365 Plugins 示例项目教程 Copilot-for-M365-Plugins-Samples Microsoft Copilot for Microsoft 365 Plugins sample...
-
13个好用的AI工具,AI办公、AI写作、AI视频全都有!
都2024年了,还有谁不会用AI工具啊!今天,偷偷给大家分享我平时都在用的AI导航网站以及一些好用的AI工具,这些工具涵盖了各个领域,都是我亲测好用的神器!有了这些工具你的工作效率绝对能够翻倍! 首先就是我常用的AI导航站——AIGC工具导航 AIGC工...
-
火山引擎数智平台:高性能ChatBI的技术解读和落地实践
客观而言,从 2018 年开始开发的抖音集团内部 BI 平台起步较晚。 因此其直接跳过了 BI 平台早期发展阶段,从立项之初,它的目标便是成为能够满足公司内部几乎所有数据分析需求的数据分析平台。 在抖音集团内部,BI 平台建设分为以下几个阶段...
-
开源项目教程:llama-utils
开源项目教程:llama-utils llama-utilsThe easiest & fastest way to run customized and fine-tuned LLMs locally or on the edge项目地址:h...
-
AI日报:ChatGPT竟主动“勾引”用户;iOS 18正式推送;Mistral AI推出免费套餐
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、ChatGPT突然给用户发消息...