-
如何高效微调多模态Transformers模型:从入门到实践指南
多模态大模型(Multimodal Large Models)是能够处理多种类型数据(如文本、图像、音频等)的机器学习模型。transformers 是当前多模态大模型中的一种重要架构。 目录 Transformers简介 多模态Transforme...
-
AI绘画 | Stable Diffusion后期处理—无需ControlNet也能轻松高清放大图像与老旧照片修复,SD新手必看教程
大家好,我是画画的小强 分享了这么多期AI绘画Stable DIffusion的入门教程和一些常用的插件玩法后,不知道大家有没有发现,SD还有一个功能,似乎没怎么用到过,它就是—后期处理。 今天就给大家分享一下SD中的 “后期处理” 的常用玩法。...
-
Meta Llama 3.1:AI领域的新里程碑
Meta最近推出了其最新的AI模型Llama 3.1,这不仅是一个技术上的飞跃,更是AI领域的一次重大突破。以下是Llama 3.1的一些关键技术亮点,值得每一位AI爱好者和开发者关注。 参数规模与性能 Llama 3.1包含三种规格:8B(80亿)、...
-
【多模态大模型】LLaMA in arXiv 2023
一、引言 论文: LLaMA: Open and Efficient Foundation Language Models作者: Meta AI代码: LLaMA特点: 该方法在Transformer的基础上增加了Pre-normalization (...
-
Datawhale X 魔塔 AI夏令营 AIGC方向Task1
小白学习笔记,如有错误请各位大佬指正 一、跑通baseline教程 Datawhale 教程链接Datawhale 二、baseline代码分析 1.安装库 !pip install simple-aesthetics-predictor !p...
-
Datawhale X 魔搭 AI夏令营 第四期 魔搭-AIGC方向 Task03笔记
从零入门AI生图原理&实践 是 Datawhale 2024 年 AI 夏令营第四期的学习活动(“AIGC”方向),基于魔搭社区“可图Kolors-LoRA风格故事挑战赛”开展的实践学习。 Datawhale官方的速通教程链接: Task 1...
-
Datawhale X 魔搭 AI夏令营第四期 AIGC方向 task02笔记
AI工具使用 1. baseline 代码 2. 使用通义千问理解代码 2.1 工作流程 2.2 逐行释意 3. 使用通义千问生成 Prompt 3.1 生成的 Prompt 3.1 根据 Prompt 生成的图片 1. b...
-
Midjourney连夜发布v6.1版本 | Midjourney API v6.1
Midjourney官方在7月31号发布了v6.1版本,作为AI产品来说,MJ版本更新的节奏相对于其他主流产品慢很多,是距离上次v6.0发布已经长达7个月之久的版本迭代。本次迭代的内容相信是对整体“AI文生图”产品来说又是一个质的提升。 首先我们来看官方...
-
SD原班人马打造最强图片生成模型Flux,群友们直呼再也不用抽盲盒了,Midjourney实测
最近晓薇的AI群都在晒Flux的图片,因此今天我打算分享一下Flux工具的使用体验,用过的都惊叹抽卡效率大大提升了! 概述 近期,黑森林实验室(Black Forest Lab)重磅推出了全新图像生成模型FLUX.1。 三种版本满足不同需求:性能强...
-
作者管理软件-纲要设计
声明:本软件还在持续开发周期,在示例演示过程所截取图片以及实际界面可能与最终成品存在差异,但业务功能和实现目标基本不会有太大变化,请结合最新应用程序来进行辅助写作。 主界面 板块设计: 1:【作品选择器】:可通过【开始】->【自定义过滤器】...
-
AI日报:每天免费25张!Midjourney网页版向所有用户开放;爱诗科技上线PixVerse V2.5;Claude移动应用收入破100万美元
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ 1、Midjourney全面开放网...
-
【三维重建】Pixel-GS:三维高斯泼溅的像素感知的梯度密度控制(去除浮点,提升精度)
项目:https://pixelgs.github.io/标题:Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting来源:香港大学;腾讯AI Lab...
-
强推8款AI写作工具,从此不用发愁写文章!
在数字化与智能化浪潮的推动下,AI写作工具已成为内容创作者、职场人士及学生群体不可或缺的高效助手。这些工具利用先进的自然语言处理技术和深度学习算法,能够自动生成高质量的文章、报告、文案等,极大地提升了写作效率与品质。以下是一系列精选的AI写作工具集合介绍,...
-
AI能直接生成海报了,我愿称Ideogram为新晋之王
大半夜的,可能是我认为做海报、做logo、做文字最猛的AI绘图产品,Ideogram,更新了他们的2.0版本。 把文字嵌入和整个图片的美学质量,又一次推上了巅峰。 可能很多人不知道Ideogram。 在AI绘图里面,这个产品确实也有一点冷门。 不过并不妨...
-
Whisper Burn 开源项目教程
Whisper Burn 开源项目教程 whisper-burnA Rust implementation of OpenAI's Whisper model using the burn framework项目地址:https://gitcode.c...
-
AI绘画工具有哪些你知道吗?推荐14款AI绘画软件
前言 AI绘画,也称为人工智能绘画或机器生成艺术,是指使用人工智能算法来创作视觉艺术作品的过程。 AI绘画软件是实现这一过程的工具,它们通常利用深度学习技术,分析大量的艺术作品来学习艺术风格和构图,来生成新的图像或模仿特定艺术家的风格。 一、...
-
【愚公系列】《AIGC辅助软件开发》017-AI辅助后端编程:用ChatGPT写简单的生鲜小超市项目
? 作者简介,愚公搬代码 ?《头衔》:华为云特约编辑,华为云云享专家,华为开发者专家,华为产品云测专家,CSDN博客专家,CSDN商业化专家,阿里云专家博主,阿里云签约作者,腾讯云优秀博主,腾讯云内容共创官,掘金优秀博主,亚马逊技领云博主,51CTO博客专...
-
【AI绘画】Midjourney前置指令/settings设置详解
文章目录 ?Midjourney前置指令/settings设置详解 ?Use the default model(AI绘画所使用的大模型) Midjourney Model(Midjourney 模型) Niji Model(Niji模型)...
-
防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎
快科技8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。 百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、Y...
-
AIGC:基于ON-DO模型的AA游戏脚本规范(AA Game Script)
AIGC:基于ON-DO模型的AA游戏脚本规范(AA Game Script) ygluu 卢益贵 关键词:游戏脚本、lua脚本、AIGC、游戏前端服务端、游戏策划、游戏配置表、红点系统 目录 一、前言 二、ON-DO模型 三、变量名规范 四...
-
v0 AI生成网页使用地址 Vercel可视化前端AI对话编程使用入口
v0 是什么? v0 是由Vercel推出的基于AI的生成式用户界面系统,它可以根据简单的文本提示生成适用于项目的React代码。v0 使用AI模型生成代码,基于shadcn/ui和Tailwind CSS,提供了易于复制和粘贴的代码。v0 不使用任何V...
-
快速上手文心一言
在日常工作和学习中,人工智能的应用越来越广泛。文心一言是百度推出的一款人工智能大语言模型产品,它可以根据上一句话预测生成下一段话,帮助我们获取信息、知识和灵感。以下是对文心一言的介绍和使用方法。 一、什么是文心一言 文心...
-
SD差点挂掉,后备军们兴奋入场,AI生图应用正在爆发?
首先是由称得上 SD 原班人马的黑森林实验室推出的 FLUX.1。黑森林实验室由 Stable Diffusion 的核心开发者 Robin Rombach 领衔创立,团队成员基本上都是 Stable Diffusion3的作者,其中三名元老级成员还是 S...
-
【Stable Diffusion】最强模型——Flux推荐和下载
前言 Flux是一个由黑森林实验室(Black Forest Lab)推出的模型,开发人员由Stable Diffusion前离职人员构成。做到了很多SD和MJ都做不到或者很难做到的事情。其特点主要如下: 参数规模大****:官方号称模型有12B...
-
AI能直接生成海报了,我愿称Ideogram为新晋之王。
大半夜的,可能是我认为做海报、做logo、做文字最猛的AI绘图产品,Ideogram,更新了他们的2.0版本。 把文字嵌入和整个图片的美学质量,又一次推上了巅峰。 可能很多人不知道Ideogram。 在AI绘图里面,这个产品确实也有一点冷门。 不过并不妨...
-
AI测试入门:认识AIGC与多模态技术
AI测试入门:认识AIGC与多模态技术 前言 一、 什么是AIGC? 二、 AIGC的技术基础 三、 AIGC的工作原理 四、AIGC的应用场景 4.1. 媒体与出版 4.2. 市场营销 4.3. 教育 4.4. 游戏开发 4.5. 艺术创作...
-
AI落地在快手正在加速——快手二季报读后感
快手昨天发布了2024年第二季报:营业收入同比增长11.7%,调整后净利润同比增长73.7%;二者均大幅超过了市场一致预期。快手的MAU(月活用户)、DAU(日活用户 和用户时长仍在增长,无论是用户数据还是营收利润数据——相信这都是一份让资本市场无可指摘的...
-
码住这款图片处理神器!一键搞定图片尺寸修改,效率翻倍!
Hey,设计界的小伙伴们!你是否还在为不同平台的图片尺寸要求而烦恼?证件照、产品图、社交媒体配图...尺寸不一,手动修改简直让人头大。别急,今天我要分享一个超给力的免费工具—千鹿设计助手,让你的图片处理工作变得轻松又高效! 功能优势: 1. 一键批量改...
-
MSRA古纾旸:2024年,视觉生成领域最重要的问题有哪些?
文章链接: https://arxiv.org/pdf/2407.18290 亮点直击 概述了视觉生成领域中的各种问题。 这些问题的核心在于如何分解视觉信号,其他所有问题都与这一核心问题密切相关,并源于不适当的信号分解方法。 本文旨...
-
Whisper Android 项目使用教程
Whisper Android 项目使用教程 whisper_androidOffline Speech Recognition with OpenAI Whisper and TensorFlow Lite for Android项目地址:https...
-
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南 stable-diffusion.cppStable Diffusion in pure C/C++项目地址:https://gitcode.com/gh_mirrors/st/...
-
一文看懂llama2(原理&模型&训练)
Llama2(大型语言模型2) Llama2(大型语言模型2)主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理: Transformer 架构: Llama2采用了Transformer网络,它通过自注意力机制来处理...
-
T-Eval:大模型智能体能力评测基准解读 | ACL 2024
AI Agent(智能体)作为大模型的重要应用模式,能够通过使用外部工具来执行复杂任务,完成多步骤的工作流程。为了更全面地评估模型的工具使用能力,司南及合作伙伴团队推出了T-Eval评测基准,相关成果论文已被ACL 2024主会录用,点击链接可查看原文:h...
-
掌握 Llama 3.1:轻松本地部署与远程使用的全攻略
前言: Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄...
-
AIGC: 5 IT从业者如何使用AI赋能业务?
上图是一个使用AI生成的图片, 描述一下这篇文章的背景。 程序员系统学习了OpenAI提供的api接口,并熟练利用提示词结合业务解决业务问题。 现状 讲一个故事来开始今天的内容。 架构师老李在技术圈里以其卓越的技术洞察力而著称。另一边,Carter...
-
vllm 聊天模板
vllm 聊天模板 背景 如何使用chat template generation prompt & add_generation_prompt chat templates的额外输入 工具使用 / 函数调用 Chat Template...
-
Stable Diffusion最新XL版发布,最简单的一键安装包也升级了
7月初,Stable Diffusion发布了XL版及两个模型,当时仅有个别图形界面工具支持,如ComfyUI,操作不便,且很多常用插件无法使用。 最常用的WebUI并未第一时间支持。 前几天,WebUI在开发者模式支持XL的模型,很多绘画爱好者一拥而...
-
如何在本地运行Llama 3系列:完整指南
今天咱们来聊聊 AI 界的重要事情——那些像 Llama3 系列这样的超大型语言模型(LLMs),现在居然可以在咱们自己的地盘上运行啦!想象一下,这就像是把一个超级智能的助手请进了家门,而且还是私密的,不用担心信息泄露的问题。 本文,虽然是基于之前 Ll...
-
大模型格局变天:Llama3.1 诞生
前言 相信大家翘首企盼的都是同一个主角,Meta藏到现在的王牌、最被社区看好能直接叫板GPT-4o的新一代开源大模型—Llama 3.1系列,终于正式发布了。 鉴于4月公开的两个Llama 3小参数模型8B和70B表现不俗,令开发者们对*参数版本的强...
-
AI绘画Stable Diffusion基础教程!
Ai绘图真的太火了,挡都挡不住。本着“不断好奇,不停学习”的理念,我打算介绍下Stable Diffusion,有兴趣的小伙伴可以一起学习。 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一...
-
多模态合规分析平台,保障AIGC营销新时代对客服务高质合规
随着生成式人工智能技术加速应用于人类日常生产生活,AIGC(人工智能生成内容)正逐渐成为营销领域的新选择。 与此同时,全渠道数字化时代来临,企业与客户的互动形式更加丰富,包括线上营销平台、私域微信运营、5G视频客服等多形态媒介,沟通更加频繁,营销素材的影...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
Datawhale Al夏令营 AIGC方向 task2
1、代码解读 1.1、安装 Data-Juicer 和 DiffSynth-Studio # 安装 Data-Juicer 和 DiffSynth-Studio !pip install simple-aesthetics-predictor # 安...
-
Flux.1 版本又更新,更快更省显存,画质依旧美丽!
小伙伴们都知道 Flux.1 的出图效果很棒,但是对电脑的配置要求也同样很高,随便就要十几 G 显存才能体验,光这配置就劝退了很多小伙伴。 硬件要求真的是硬伤,不过地球是圆的,技术也总是在发展的,就在这几天,ControlNet 的作者张吕敏大大带着他的...
-
Midjourney提示词-动物系列-50
an anthropomorphic horse hyperdetailed photography, Hyperdetailed, Unreal Engine, Cinematic Lighting, Blacklight, Photorealistic...
-
AIGC:开启智能创作新时代
一、AIGC 的兴起与发展 AIGC 的兴起与发展 AIGC 的兴起是多种因素共同作用的结果。从技术层面看,深度学习算法的不断优化,如 Transformer 架构的出现,使得模型能够处理更复杂的数据和任务,为 AIGC 的发展提供了强大的技术支撑。预...
-
Datawhale 魔搭 AI夏令营 第四期 AIGC方向 Tesk2 可图Kolors-LoRA模型进阶学习
AI生图的能力与局限 AI生图的原理 AI利用 深度学习技术来训练神经网络,训练过程中,神经网络会学习到真实图像中的纹理、结构、颜色等特征,并将这些特征应用于生成新的图像。从而生成具有高保真度的图像。训练后,通过输入关键提示词来让模型...
-
本地部署,Whisper: 开源语音识别模型
目录 简介 特点 应用 使用方法 总结 GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak SupervisionRobust Speech Reco...
-
Stable Diffusion WebUI 1.10.0来了
大家好,我是每天分享AI应用的萤火君! 前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:...
-
ComfyUI中的sam模型国内下载方法
was-node-suite-comfyui这个节点安装的时候,有它内部的config配置文件,里面其实给了一些下载地址,配置文件里是这么写的: "sam_model_vith_url": "https://dl.fbaipublicfiles.com/...