-
Datawhale X 魔搭 AI夏令营(AIGC Task3)学习笔记
目录 认识ComfyUI 1. 什么是 ComfyUI 2. ComfyUI 核心部件 3. ComfyUI 图片生成流程 4. ComfyUI 的优势 使用ComfyUI 下载ComfyUI: 运行ComfyUI: 自我学习: LOR...
-
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【新智元导读】就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了! Transformer...
-
2024年国内版AI写作对话工具推荐
以下排名随意编排,无先后。 提高工作效率的AI神器? | 国内版 笔尖AI写作 能写文案、读文献、互动答疑,多场景写作模板,不限于某个领域,12+种职位的 100+ 工作场景,10秒即可生成一篇专业文章。 推荐指数⭐⭐⭐⭐ 豆包 聊天机器人、写...
-
You.com 希望区别于谷歌成为解决复杂工作查询的 AI 搜索引擎
计算机科学家 Richard Socher 早在斯坦福大学攻读博士学位时就构思了 You.com,但在 2009 年至 2014 年间,由于谷歌的统治地位,Socher 选择暂时搁置这一概念。 随着提示工程的发展——即为生成式 AI 工具创建输入以生成所...
-
AIGC:clip-interrogator
文字生成图片是近年来多模态和大模型研究的热门方向,openai提出的CLIP提供了一个方法建立起了图片和文字的联系,但是只能做到给定一张图片选择给定文本语义最相近的那一个,实际项目开发中我们总是需要从一张图片获取描述,clip-interrogator应运...
-
无需抠图!AI绘画直接文本生成透明底图层,设计师必看的ComfyUI透明图层生成工作流教程!(附插件模型)
大家好,我是画画的小强 AI 绘画自出现以来一直都在不断发展完善,实现了很多我们在实际应用中迫切需要的功能,比如生成正确的手指、指定的姿势、准确的文本内容等。上周,又一个重磅新功能在开源的 SD 生态内实现了——直接通过文本直接生成透明底图像和图层!这将...
-
部署本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2
本地语音聊天机器人:在Seeed Studio reComputer Jetson上部署Riva和Llama2 所有教程都免费开源,请动动小手点个小星星https://github.com/Seeed-Projects/jetson-examples...
-
超越SD3,比肩MJ v6,文生图模型FLUX.1开源
近日,图片生成模型FLUX.1引爆了AIGC社区,其在视觉质量、图像细节和输出多样性等方面性能优越,输出极佳的图片生成效果。 FLUX.1系列模型由Black Forest Labs开源,创始人Robin Rombach是Stable Diffu...
-
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
【导读】 适逢Llama 3.1模型刚刚发布,英伟达就发表了一篇技术博客,手把手教你如何好好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。 Epoch AI上个月刚刚发文[预言数据墙」迫近,结果英伟达转头就甩出了340B开源巨兽Ne...
-
【LLM】一、利用ollama本地部署大模型
目录 前言 一、Ollama 简介 1、什么是Ollama 2、特点: 二、Windows部署 1.下载 2.安装 3.测试安装 4.模型部署: 5.注意 三、 Docker部署 1.do...
-
智能语音生成会议纪要的神器
嘿,技术爱好者们,今天我想分享一个令人兴奋的智能语音项目。它巧妙地结合了faster-whisper、Pyannote以及一系列先进的大语言模型,旨在为会议纪要的自动化生成带来新的可能。 开发了一个智能语音生成会议纪要的神器 在线体验:智能语音...
-
华为Mate 60/X5、Pocket 2新增重磅功能:支持AI消除了 拍照神器
快科技8月24日消息,华为李小龙今天晒图展示了AI消除功能,并表示华为Mate 60系列、华为Mate X5、华为Pocket 2三款老机型都已经新增支持。 据悉,该功能此前仅限于Pura 70系列、nova 12 Ultra星耀版、nova Flip三款...
-
【课程总结】day24(上):大模型三阶段训练方法(LLaMa Factory)
前言 本章我们将通过 LLaMA-Factory 具体实践大模型训练的三个阶段,包括:预训练、监督微调和偏好纠正。 大模型训练回顾 训练目标 训练一个医疗大模型 训练过程实施 准备训练框架 LLaMA Factory是一款开源低...
-
WhisperS2T:加速语音转文本的高效解决方案
WhisperS2T:加速语音转文本的高效解决方案 WhisperS2TAn Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference E...
-
程序员掌握Stable Diffusion,下班后打造月入3000+的AI绘画副业
一、引言 在技术日新月异的今天,程序员这个职业不仅要求我们不断学习新技术,还需要我们具备一定的创新思维。作为一名程序员,我在接触到Stable Diffusion(以下简称SD)后,发现了新的副业机会。以下是我如何利用SD在下班后赚取额外收入,最终实...
-
弹幕背后:B站UP主创作服务解析
引言 在B站,每一条飘过的弹幕都是一个故事的碎片,它们汇聚成一幅幅生动的社交画卷。这里,不仅仅是一个视频分享平台,弹幕背后更是一个充满活力的创作者生态系统。B站以其独特的弹幕文化,为创作者和观众之间搭建起了一座互动的桥梁,让创意与情感在虚拟空间中自由...
-
ControlNetPlusProMax来袭:SDXL可控性灵魂CN组件再升级,多合一组件再添新功能
大家好我是安琪!!! 在数字图像生成领域,ControlNetPlusProMax的推出无疑是一次重大突破。作为SDXL的可控性灵魂CN组件的升级版,ControlNetPlusProMax在多合一组件的基础上,增添了更多实用新功能,为你的创意绘画之旅带...
-
全球首个语音指挥FPS AI ,腾讯魔方携最新AI成果亮相科隆展
AI究竟会如何改变游戏?这应该是全球游戏行业近年最为关注的问题之一。在最近正在德国举办的全球最大游戏展—科隆游戏展上,腾讯游戏魔方工作室群技术中心联合《暗区突围:无限》项目组,首次对外公布其全球首个语音指挥FPSAIF.A.C.U.L.的技术Demo。这是...
-
AI二创「黑神话」点燃全网!爆改二郎神,送自家狗子一键「成精」
【新智元导读】国产3A顶流《黑神话·悟空》,与AI联动起来了!网友纷纷开启二创,有人用AI续写神话,有人把自家二哈变成了精怪,甚至还有人自制了桌面壁纸! 全球玩家鏖战《黑神话·悟空》! 已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们。...
-
AI智能体,年轻人的情感搭子
「AI智能体太好了,现实生活当中,我永远没办法得到永远不变的爱。」这是一位网友使用AI情感陪伴类App后的真实感受。 现在每月都有成百上千万的年轻人,近乎沉醉地与各种AI智能体对话。 他们每月花费在这些软件上的时间,甚至超过一周。他们把智能体当做恋人、朋友...
-
法律 | 法律人AI使用指南
原文:法律 | 法律人AI使用指南|法官|法院|文书|公司法_网易订阅 01 引言 过去半年多,我一直在尝试着用AI来辅助自己的各项法律工作,将AI融入自己的日常工作之中,并试图形成自身稳定的“法律+AI”工作流。在此过程中,我时常惊讶于AI高效的工...
-
有大佬曾吐槽搜索全广告!百度已有18%搜索结果由AI生成:称更准确了
快科技8月23日消息,李彦宏近日在第二季度财报电话会上表示,已有18%的搜索结果由AI生成,为用户提供更准确和直接的答案。 据悉,智能体在百度生态的分发量大幅增加,7月日均分发次数超800万次,为5月的两倍。 本季度,百度智能云营收达51亿元,同比增长14...
-
Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析
Llama 3.1 发布了!Llama 3.1 有三种规格: 8B 适合在消费者级 GPU 上进行高效部署和开发,70B 适合大规模 AI 原生应用,而 405B 则适用于合成数据、大语言模型 (LLM 作为评判者或蒸馏。这三个规格都提供基础版和指令调优...
-
comfyUI-MuseTalk用户交互体验的参数设计和设置
comfyUI-MuseTalk用户交互体验的参数设计和设置 目录 comfyUI-MuseTalk的参数设置 一、ComfyUI-VideoHelperSuite 二、comfyUI-MuseV合成的参考视频 2.1、什么时候会用到MuseV?...
-
Datawhale X 魔搭 AI夏令营-第四期 AIGC-Task 2
目录 认识AI助手——通义千问 操作指南 主要功能模块 精读baseline代码 分析代码的主体架构 逐行解释代码 其他疑问-向AI追问 进行实战——基于话剧的连环画制作 提示词准备 执行Task1的30分钟速通Baseline 修改...
-
GOLLIE : ANNOTATION GUIDELINES IMPROVE ZERO-SHOT INFORMATION-EXTRACTION
文章目录 题目 摘要 引言 方法 实验 消融研究 题目 Techgpt-2.0:解决知识图谱构建任务的大型语言模型项目 论文地址:https://arxiv.org/abs/2310.03668 摘要 大...
-
用Ollama 和 Open WebUI本地部署Llama 3.1 8B
说明: 本人运行环境windows11 N卡6G显存。部署Llama3.1 8B 简介 Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和...
-
16 使用Llama Index提取术语和定义的指南
使用Llama Index提取术语和定义的指南 Llama Index有许多用例(如语义搜索、总结等),这些用例都有很好的文档记录。然而,这并不意味着我们不能将Llama Index应用于非常特定的用例! 在本教程中,我们将介绍使用Llama Ind...
-
非Transformer时代到来!全新无注意力模式超越Llama传奇
来源 | 机器之心 ID | almosthuman2014 Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。 此后,采用 Mamba 架构的模型...
-
v0 AI生成网页使用地址 Vercel可视化前端AI对话编程使用入口
v0 是什么? v0 是由Vercel推出的基于AI的生成式用户界面系统,它可以根据简单的文本提示生成适用于项目的React代码。v0 使用AI模型生成代码,基于shadcn/ui和Tailwind CSS,提供了易于复制和粘贴的代码。v0 不使用任何V...
-
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南
纯C/C++实现的Stable Diffusion项目介绍及快速启动指南 stable-diffusion.cppStable Diffusion in pure C/C++项目地址:https://gitcode.com/gh_mirrors/st/...
-
掌握 Llama 3.1:轻松本地部署与远程使用的全攻略
前言: Llama 3.1 是 Meta(Facebook 的母公司)发布的一系列最先进的开源大语言模型。Llama 3.1 系列包括 8B(80 亿参数)、70B(700 亿参数)和 405B(4050 亿参数)模型。其中,405B 是 Meta 迄...
-
AI绘画Stable Diffusion基础教程!
Ai绘图真的太火了,挡都挡不住。本着“不断好奇,不停学习”的理念,我打算介绍下Stable Diffusion,有兴趣的小伙伴可以一起学习。 目前市面上比较权威,并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney(简称 MJ),另一...
-
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元
探索音乐的智慧:MU-LLaMA 模型引领文本到音乐生成新纪元 MU-LLaMAMU-LLaMA: Music Understanding Large Language Model项目地址:https://gitcode.com/gh_mirrors/...
-
Flux.1 版本又更新,更快更省显存,画质依旧美丽!
小伙伴们都知道 Flux.1 的出图效果很棒,但是对电脑的配置要求也同样很高,随便就要十几 G 显存才能体验,光这配置就劝退了很多小伙伴。 硬件要求真的是硬伤,不过地球是圆的,技术也总是在发展的,就在这几天,ControlNet 的作者张吕敏大大带着他的...
-
秋叶V4.9整合包发布!什么是Stable Diffusion?如何安装Stable Diffusion?
Stable Diffusion秋叶整合包,一键安装Stable Diffusion,门槛极低,完全免费,支持Nvidia全系列显卡。 来自B站up主秋葉aaaki近期推出的Stable Diffusion整合包v4.9版本,能够让零基础用户轻松在本地部...
-
【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人
系列篇章? No. 文章 1 【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践 2 【Qwen2部署实战】Qwen2初体验:用Transformers打造智能聊天机器人 3 【Qwen2部署实战】探索Qw...
-
Datawhale AI夏令营第四期魔搭- AIGC方向 task02笔记
大纲 一、前言 二、代码块解读 2.1 依赖包安装 2.2 数据集下载 2.3 metadata.jsonl文件生成(图片及对应标签) 2.4 设置data-juicer 配置文件并执行,处理metadata.jsonl文件生成result....
-
Midjourney提示词-动物系列-38
a Tiny delightful Anthropomorphic adventurer cat, in intricate detailed leather armor, standing in the forest, soft fairy lighti...
-
【2024W30】肖恩技术周刊(第 8 期):奥运会热度不高?
周刊内容: 对一周内阅读的资讯或技术内容精品(个人向)进行总结,分类大致包含“业界资讯”、“技术博客”、“开源项目”和“工具分享”等。为减少阅读负担提高记忆留存率,每类下内容数一般不超过3条。更新时间: 星期天历史收录: shawn-weekly订阅方式:...
-
Feishu-Midjourney 开源项目实战指南
Feishu-Midjourney 开源项目实战指南 Feishu-Midjourney? 飞书 x midjourney = 你真正的创意伙伴项目地址:https://gitcode.com/gh_mirrors/fe/Feishu-Midjourn...
-
知识图谱大模型系列之 17 使用 Llamaindex、Neo4j 和 Llama 3 构建具有知识图谱的高级 RAG 聊天机器人(教程含源码)
简介 通过集成知识图谱来构建高级检索增强生成 (RAG 聊天机器人的分步指南。在检索增强生成 (RAG 解决方案中集成知识图谱可通过提供结构化和关系上下文显著提高响应的相关性和深度。知识图谱在 RAG 解决方案中非常有用,例如在医疗保健领域。例如,...
-
本地部署 Llama-3-EvoVLM-JP-v2
本地部署 Llama-3-EvoVLM-JP-v2 0. 引言 1. 关于 Llama-3-EvoVLM-JP-v2 2. 本地部署 2-0. 克隆代码 2-1. 安装依赖模块 2-2. 创建 Web UI 2-3.启动 Web UI 2-4...
-
《逆水寒》新玩法首曝:自创AI生命体 陪玩家一起打本、探险
快科技8月20日消息,在游戏与人工智能技术的深度融合与创新探索中,NPC受限于文本的局限性与玩家的交互往往存在刻板、机械化的特点,即使游戏公司投入人力物力丰富NPC的文本数量,但玩家仍不满足于现有NPC的表现。如今,这个情况发生了转变。 逆水寒作为国内首家...
-
技术证书认证-附考试答案-AIGC与大模型通识-英特尔大湾区科技创新中心证书认证
目录 课程简介 面向人群 考核步骤 试题答案 知孤云出岫主页 课程以及考试链接:AIGC与大模型通识 - 英特尔大湾区科技创新中心 【英特尔大湾区科技创新中心】公益新课《AIGC与大模型通识》上线官网!首期结业认证进行中,提升...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
ComfyUI教程一:安装使用前的准备
前言 ComfyUI的用户越来越多,老李也接触了很多初学者,他们希望老李能在开始培训前讲一些相关基础知识,所以我就把自己之前的经验总结一下,方便刚刚接触comfyUI的同学学习。 今天我把comfyUI需要的几个基础软件给大家讲一下,主要面向的是普通...
-
Stable Diffusion秋叶WebUI V4.9整合包来了,超详细安装教程,轻松看懂
这款整合包可以一键在本地部署Stable Diffusion!!适用于零基础想要使用AI绘画的小伙伴~ 秋叶大佬V4.9整合包给大家准备好了,扫描下方,即可免费获取 秋叶整合安装包安装教程 如果你的电脑时第一次安装,需要先下载启动器运行依赖,安装依...
-
Midjourney Imagine API 申请及使用(大陆地区)
注意:本 API 属于生成式人工智能 API,背后部分技术基于 Midjourney,为避免跨境数据传输给国家和企业带来的安全风险,请务必在使用时不要输入带有国家和企业机密的相关信息,同时本 API 也会严格遵循中华人民共和国《生成式人工智能服务管理办法》...
-
AIGC浪潮中的程序员:日常编码与自我提升的平衡术
随着人工智能技术的飞速进步,AIGC(人工智能生成内容)技术在软件开发领域的应用日益广泛,它不仅改变了编码工作的方式,更对我们的职业发展路径和技能结构提出了新的要求。在这样一个快速变化的环境中,如何深度平衡日常编码工作与提升式学习,成为了一个亟待解决的重要...