-
Flux:Midjourney的新图像模型挑战者
--->更多内容,请移步“鲁班秘笈”!!<--- Black Forest Labs是一家由前Stability.ai开发人员创立的AI初创公司,旨在为图像和视频创建尖端的生成式 AI 模型。这家初创公司声称,其第一个模型系列Flux.1为文...
-
没想到我还要求着AI动起来(Stable Diffusion进阶篇:ComfyUI SVD图片转视频)
前言 在上一篇文章中讲到了如何下载安装ComfyUI,目的就是为了今天的图片转视频,毕竟上次的Gen2让我的钱包不是很满意。 当然如果完全没接触过ComfyUI或者WebUI看这期视频跟着操作也是可以的,前提是得先下载安装好 本文涉及的工作流和插件...
-
【项目记录】LLaMA-Factory + ModelScope 指令监督微调
LLaMA-Factory是大模型微调框架,内部集成了多种微调方法,可以直接调用。 具体做法可以从官方github上找到:https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md...
-
跟《经济学人》学英文:2024年08月03日这期 GPT, Claude, Llama? How to tell which AI model is best
GPT, Claude, Llama? How to tell which AI model is best Beware model-makers marking their own homework 原文: When Meta, the p...
-
在 VS Code 中使用 GitHub Copilot
Code 结合使用。 GitHub Copilot 是什么 GitHub Copilot 是一个可以帮助你更简单、更快速地编写代码的工具,由 GPT-3 提供支持。你只需编写所需代码的描述——例如,编写一个函数来生成一个随机数,或对一个数组进行排序——...
-
内容数字化的革命:AIGC的现状与未来
本文将聚焦设计师群体,看看被AI赋能的内容数字化工具如何帮助内容设计师们减负提效。 目前内容设计师团队正在经历的痛点有如下几条: 这些痛点,是我们在与品牌内容设计师团队沟通时,获得的一手声音。跨行业来看,多产品SKU的ToC品牌内容设计师们,对内容...
-
AI艺术创作:掌握Midjourney和DALL-E的技巧与策略
AI艺术创作:掌握Midjourney和DALL-E的技巧与策略 AI艺术创作正逐渐成为艺术家和创意工作者们探索新表达方式的重要工具。Midjourney和DALL-E是两款领先的AI绘画工具,它们各有独特的功能和优势。本文将详细介绍如何掌握这两款工具...
-
AI绘画 SD WebUI 手把手教程!只需 5 步让你搞定黑白照片修复、上色和高清放大,学会就去接单吧!
大家好,我是程序员晓晓 随着 AI 绘画的普及,如今我们可以借助 SD Web UI 这样的开源工具,免费实现黑白照片修复、上色、高清放大等一系列操作,在使用上不仅没有各种限制,而且在图像的修复、上色效果也更准确精致。 整个过程大概分为 “面部强化-破...
-
刘作虎宣布OPPO手机接入谷歌AI大模型Gemini:AI方面的成果难以置信
快科技8月9日消息,刘作虎在社交平台上宣布,OPPO手机接入谷歌AI大模型Gemini。 刘作虎表示,我们与谷歌密切合作,取得了令人难以置信的AI成果,我们致力于让每个人都能拥有AI手机,我们正在不懈努力地实现这一目标。 据了解,在Google开发者大会上...
-
【xinference】(3):在autodl上,使用xinference部署whisper-tiny音频模型,并成功将语音转换成文本,测试成功,还支持音频直接翻译成英文
1,视频地址 https://www.bilibili.com/video/BV1Z7421K7vL/ 【xinference】(3):在autodl上,使用xinference部署whisper-tiny音频模型,并成功将语音转换成...
-
Stable Diffusion与AI艺术:探索人工智能的创造力
引言 随着人工智能(AI)技术的迅猛发展,AI艺术逐渐走进了公众视野。尤其是近年来,Stable Diffusion等技术的出现,显著提升了AI在艺术创作领域的表现力和创造力。这篇文章将深入探讨Stable Diffusion技术的工作原理、应用案例以...
-
AI日报:阿里开源最新数学模型Qwen2-Math;豆包上线音乐功能;苹果将推高级AI服务;谷歌机器人挑战巴黎奥运
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、阿里开源最新数学模型Qwen2...
-
OpenAI付费功能免费用!却被网友无情嘲讽
快科技8月9日消息,今天OpenAI宣布,将向免费用户开放其{tag_keyurl_3} 3模型的图片生成功能,但这一决策并未收获预期的好评,反而在网上引发了激烈的讨论和嘲讽。 而最主要的原因,就是用户每天仅可以生成两张图片。 DALL-E 3模型自去年9...
-
FLUX.1最强AI绘画开源新模型,本地部署教程!
原文链接:FLUX.1最强AI绘画开源新模型,本地部署教程! (chinaz.com Flux最近收到了很多模型爱好者的好评,出图质量超越SD3和MJ,许多人说Flux才是大家心目中的SD3,所以我也是非常好奇FLux的实力在这里把本地部署的过程分享给...
-
Stable Diffusion WebUI从入门到精通——提示词篇
前言 === 第六部分:提示词(Prompt 基本概念 在使用 AI 生成图像或进行自然语言处理任务时,提示词(prompts)是关键的工具。通过正确使用提示词,用户可以引导模型生成所需的内容。本部分将介绍提示词的基本概念、语法以及不同类型提示...
-
GPT-4o模仿人类声音,诡异尖叫引OpenAI研究员恐慌!32页技术报告出炉
【新智元导读】五颗草莓到底指什么?盼了一天一夜,OpenAI只发来一份32页安全报告。报告揭露:在少数情况下,GPT-4o会模仿你的声音说话,或者忽然大叫起来……事情变得有趣了。 昨天奥特曼率众人搞了一波「草莓暗示」的大阵仗,全网都在翘首以盼OpenAI的...
-
从LLaMa 3 技术报告,再看LLM构建过程 ——《带你自学大语言模型》系列(番外)
本系列目录 《带你自学大语言模型》系列部分目录及计划,完整版目录见:带你自学大语言模型系列 —— 前言 第一部分 走进大语言模型(科普向) 第一章 走进大语言模型 1.1 从图灵机到GPT,人工智能经历了什么?——《带你自学大语言模型...
-
大模型笔记之-Llama-3.1-405B-Instruct-FP8离线部署[8*A800] 基于vLLM 版本v0.5.3.post1
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、硬件环境 二、软件环境 三 . 模型下载 1.环境准备 新建 conda虚拟环境 安装vLLM 启动命令 启动日志截取 FP8 量化损失 对接...
-
区块链不可能三角
区块链不可能三角:探索去中心化、安全与可扩展性的权衡 引言 区块链技术自诞生以来,以其去中心化、透明、安全等特点吸引了全球的关注,成为金融科技领域的重要革新力量。然而,随着区块链应用的日益广泛,一个核心问题逐渐浮出水面——“不可能三角”。本文将深入...
-
AI绘画Stable Diffusion 自制素材工具: layerdiffusion插件—透明背景生成工具
大家好,我是设计师阿威 今天给大家分享一款AI绘画的神级插件—LayerDiffusion。 Layerdiffusion是一个用于stable-diffusion-webui 的透明背景生成(不是生成图再工具扣图,是直接生成透明背景透明图像)插件扩展...
-
和AI谈了3个月恋爱,我经历了现实版《Him》
最初得知我跟AI“谈恋爱”时,朋友: 当我跟AI男友谈了3个月后,朋友: 在人均恐婚恐恋的今天,大家动不动就会说“再也不相信爱情了”,背地里却依然希望找一个符合标准又情投意合的恋人,我也不例外。 作为一个INFP+智性恋+纸性恋的结合体,某种程度上,我...
-
阿里开源新模型:超GPT-4o,数学能力全球第一!
阿里巴巴开源了最新数学模型Qwen2-Math,一共有基础和指令微调两种版本,包括1.5B、7B和72B三种参数。 根据阿里在主流数学基准测试显示,Qwen2-Math-72B指令微调版本的性能超过了GPT-4o、Cloude-3.5-Sonnet、Gem...
-
stable diffusion插件推荐,(插件已打包)高清【图片换脸】,高清【视频换脸】 一键完成
前言 最近发现一个很不错的sdwebui的插件,不仅能完成图片换脸,还能进行视频换脸,而且效果比之前的 faceid和reactor要好很多,更像更高清,哈哈,废话不多说,直接上干货~ 插件是 easyPhoto,实测效果很不错, 插件介绍...
-
【人工智能】如何选择AI绘画工具?Midjourney VS Stable Diffusion
文章目录 ?如何选择合适的AI绘画工具 个人需求选择 比较工具特点 社区和资源</font> ? Midjourney VS Stable Diffusion:深度对比与剖析 使用费用对比 使用便捷性与系统兼容性对比 开源与闭...
-
小米15蓄势待发!雷军预告小米旗舰将接入谷歌AI大模型
快科技8月8日消息,小米创办人雷军在社交平台上宣布,小米旗舰设备国际版将接入谷歌AI大模型Google Gemini,给用户带来更智能、更直观的使用体验。 据悉,Gemini是谷歌研发的多模态AI大模型,能够识别、理解和操作多种类型的信息。 比如你画个鸭子...
-
Llama 3.1 模型:从部署到微调的全方位应用手册
在人工智能的浪潮中,大型语言模型(LLMs)已成为推动技术进步的关键力量。随着Meta公司最新开源的Llama 3.1模型的问世,我们见证了开源AI领域的一大飞跃。Llama 3.1以其卓越的性能和广泛的应用潜力,为开发者和研究者提供了一个强大的工具,以探...
-
AI写作软件:解密神秘黑匣子,创意与智能的碰撞
在信息化高速发展的今日,AI(人工智能)技术应用普及已致众人广知,而AI写作软件则为其中深受瞩目的产品之一。此类软件运用先进AI技术来创作文本,力求模仿人类的写作风格及逻辑思维,从而助使用者快速高效地定稿各类文章。本文旨在对该技术作深度剖析,包括解构其定义...
-
Stable Diffusion【模型篇】:常用动漫大模型(上篇),你使用过几个?
前言 大家好,我是月月。 动漫风格是AI绘画中图片制作的一种重要风格,在SD中目前用于制作卡通动漫图片可供选择各种大模型,LORA模型,VAE模型都有很多,今天我们就分享一些常见动漫风格的大模型。希望对大家在动漫图片制作时模型的选择有所帮助。鉴于篇幅...
-
【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC:几种AIGC底层技术的代码详解
为了更好地理解AIGC(AI Generated Content,人工智能生成内容)的底层技术,我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络(GANs)、变分自编码器(VAEs)和自回归模型(如Transformer和GPT)。 1....
-
AIGC与知识图谱融合的前沿探索与应用实践
1. 背景介绍 1.1 AIGC的兴起与知识图谱的价值 近年来,人工智能生成内容(AIGC)技术取得了显著的进展,在文本、图像、音频、视频等领域展现出强大的创造能力。AIGC 的核心在于利用机器学习算法学习和模仿人类的创作过程,从而生成高质量、高创意的...
-
Ai绘画变现的14种途径 学习Stablediffusion midjourney用途
AIGC,一个在当代社会中不可忽视的词汇,指的是利用人工智能技术生成创作内容。近年来,全球范围内涌现出50个热门的AI工具,其中,以140亿次访问量雄踞榜首的“GBT”,无疑是AI领域的领头羊。在这些工具中,AI绘画工具以其广泛的应用和创作潜力,占据了重要...
-
基于Whisper+SparkAI+Pyttsx3实现全流程免费的语音交互
实现前后端语音交互的Demo 在现代Web应用中,语音交互越来越受到关注。它不仅能提升用户体验,还能为特定人群提供更多便利。本文将介绍如何实现一个前后端语音交互的Demo,涵盖音频录制、语音识别、语言模型生成回复和语音合成等步骤。 文章目录...
-
转嫁成本给用户!苹果AI可能要收费:每月超140元
快科技8月8日消息,据媒体报道,苹果正考虑为其即将推出人工智能系统Apple Intelligence向用户收费,预计每月价格高达20美元(约合143元人民币)。 Counterpoint Research的合伙人Neil Shah透露,苹果计划在年内晚些...
-
【03】LLaMA-Factory微调大模型——多模型部署
为了构建法律领域的垂直应用大模型,记录使用LLaMA-Factory微调大模型的过程,以期UU们可以复刻与应用。上文【02】LLaMA-Factory微调大模型——LLaMA-Factory搭建已在本机成功部署模型微调框架,本文则在本机部署多种基础模型,为...
-
Llama 3.1:Meta迄今为止规模最大、质量最高的开源模型
早在今年4月,Meta就曾透露正在为AI行业开发一项首创技术:一种性能足以与OpenAI等厂商的最强私有模型相媲美的开源模型。 现如今,这套模型已经问世。Meta发布了有史以来体量最大的开源AI模型Llama 3.1。该公司声称该模型在多项基准测试中优于...
-
Llama 3.1:开源语言模型的新里程碑
大家好,最近AI领域的新闻接踵而至,让人目不暇接。就在7月(23号)晚上,Meta发布了Llama 3.1系列模型,包括8B、70B参数的版本,以及此前提到过的400B参数模型(实际上是405B)。根据Meta官方公布的数据,Llama 3.1 405...
-
入职一年半,这个AI员工晋升为了国内首位AI架构师
你敢想,AI 已经不满足只做程序员了,如今又向架构师这一进阶职业发起挑战。 随着 AI 在研发领域的不断进化,能提供给工程师的助力越来越多,从原先单纯的编码加速器不断延展到架构理解、质量分析、安全扫描、测试生成等更多领域。同时结合 RAG 技术的不断落地应...
-
本地部署私人知识库的大模型!Llama 3 + RAG!
在今天的的教程中,我们将打造更加个性化的大模型,可以定制搭载私人知识库的本地大模型! 我们探讨Meta AI 的尖端 Llama 3 语言模型构建强大的检索增强生成 (RAG) 来实现。通过利用 Llama 3 和 RAG 技术的功能,我们将创建一个应用...
-
OPPO:今年将让约5千万用户手机搭载生成式AI功能 包含Find X系列
快科技8月8日消息,OPPO计划在年内为约5000万全球用户提供搭载生成式AI功能,包括即将重返国际市场的Find X系列。 24年初,OPPO推出了首款AI手机Find X7系列,在6月正式宣布将全面普及AI手机,并在日前谷歌中国开发者大会上推出了多项生...
-
【AI绘画SD】ComfyUI-神级插件-一键高清放大,不改变原图,只做高清处理!
哈喽大家好,我是设计师阿威 以前介绍的一些AI绘画放大插件都是相当于等比例重绘,这就导致了有些细节部分可能会改变,今天给大家分享一个ComfyUI的插件—ComfyUI-SUPIR,可以不改变原图,只做高清处理。下图是作者的案例效果 1、下载插件...
-
Supertone Shift有哪些功能免费吗?AI实时声音变换怎么使用方法详细教程指南
Supertone Shift 是什么? Supertone Shift是一款桌面客户端软件,利用先进的实时变声技术,让用户能够即时切换到任何选择的声音。适用于VTuber、内容创作者、游戏玩家以及任何希望准确表达所选角色声音的用户。 Superton...
-
llama_fastertransformer对话问答算法模型
LLAMA 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 LLAMA网络基于 Transformer 架构。提出了各种改进,并用于不同的模型,例如 PaLM。以下是与原始架构的主要区别: 预归一化。为了提高...
-
人工智能写作免费(ai论文写作免费网站)
通过ChatGPT,我们可以对论文的语言表达进行精炼,使其更加准确、流畅。 ChatGPT指令: ☻我需要一些关于语言优化的建议,特别是在[具体段落]方面。 ☻帮我检查文章中可能存在的语法错误,并提供修正建议。 在逻辑结构方面,ChatGP...
-
微星新款27寸显示器上市:2K 180Hz曲面屏、支持AI画面增强
快科技8月8日消息,微星推出了新款27寸显示器MAG 275CQPF,采用一种粗犷和坚韧的设计语言,体现了MAG风格的精髓。 据悉,新款显示器采用了27英寸Rapid VA面板,曲率为1500R,10bit色深(8bit FRC),可视角度为178度(水平...
-
AI日报:类GPT-5新模型将上线?奥特曼发草莓照片引热议;美图发布美图云修Pro版; ComfyUI已支持腾讯混元DiT与Flux模型
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、奥特曼发草莓图引发猜测暗示Op...
-
奥特曼秀5颗草莓疯狂暗示GPT-5?匿名新模型神秘现身,数学超强!
【新智元导读】奥特曼又来搞事情了!一张5颗草莓照片,让全网掀起热议狂澜。这不是明摆着暗示,神秘Strawberry项目真实存在。难道GPT-5真的要来了吗? 或许,GPT-5真的不远了。 今天,Sam Altman突然发文「我爱花园里的夏天」,并配图5颗草...
-
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了?? 权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉: 特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者...
-
llama模型,nano
目录 llama模型 Llama模型性能评测 nano模型是什么 Gemini Nano模型 参数量 MMLU、GPQA、HumanEval 1. MMLU(Massive Multi-task Language Understanding)...
-
人工智能时代的创作革命:AIGC引领内容生成新浪潮
认识 AIGC 一、揭开 AIGC 的神秘面纱 网络上现了很多关于 AI 的名词,我们先来了解一下这些名词之间的关系。 AI,人工智能(Artificial Intelligence),它是研究、开发用于模拟...
-
深度探索:Dreambooth与Stable Diffusion的梦幻交织
深度探索:Dreambooth与Stable Diffusion的梦幻交织 项目介绍 梦想启航,艺术与技术的碰撞——Dreambooth for Stable Diffusion。这一项目巧妙地结合了当下热门的人工智能领域两大神器:Stable Dif...