-
0基础使用LLAMA大模型搞科研,自动阅读论文、代码修改、论文润色、稿件生成等等
0基础使用LLAMA大模型搞科研,自动阅读论文、代码修改、论文润色、稿件生成等等。 使用 LLAMA大模型 辅助科研可以带来多方面的好处和优势,主要包括: 提高文献调研效率: LLAMA大模型 可以帮助研究人员快速获取特定研究领域的概述,提供相...
-
Whisper开源免费的语音识别:OpenAI如何用AI改变字幕制作与语音理解的未来!
OpenAI的Whisper语音识别系统的用途广泛且强大,主要包括但不限于以下几点: 会议和讲座记录转写:Whisper可以帮助学生和职场人士快速将会议、讲座或课堂的录音转换成文字稿,便于复习、整理笔记或分享内容。 视频字幕生成:对于电影和电视节...
-
Stable Diffusion插件推荐| oldsix-新人三大必备辅助提示词插件之二
01、插件介绍 老六也是一款提示词辅助插件,它除了基本的几千个提示词库之外,另外多了几个功能让我很满意,比如支持随机抽卡以及支持动态随机提示词。 下面来介绍下安装以及使用。 02、插件安装 在扩展-从网址安装,输入 https...
-
AIGC绘画设计——Stable Diffusion进阶使用
本文讲解,模型底模,VAE美化模型,Lora模型,hypernetwork。 文本Stable Diffusion 简称sd 欢迎关注留言,不定期追加更新! 使用模型 C站:https://civitai.com/ huggingface:ht...
-
一遍就会!Stable Diffusion 文生图最全、最强教程!
文生图/txt2img 文生图是Stable Diffusion中最基础、最实用也是最好玩的功能。顾名思义,文生图通过简单的文字描述(英文)就能生成你想要的图片。当然这个图片肯定不是完美的,如若你想生成完美的、惊艳的图片,还需要深入了解和学习文生图详细...
-
Stable Diffusion Mjdjourney新手超详细安装教程,亲测有效
安装 Stable Diffusion 需要一定的技术基础和系统配置。以下是基本的安装方法,适用于 Windows 系统。 前提条件 兼容的 GPU:建议使用支持 CUDA 的 NVIDIA GPU。 Python 3.7+:确保已安装 Pytho...
-
快速部署stable diffusion@Ubuntu
Stable Diffusion可以根据文本描述生成相关的图像,是当前最热门的文生图模型。 在Ubuntu下,可以选择快速安装,或者手动一步步安装。 快速安装 使用文档中的方法,先下载一个sh文件,然后执行这个文件,就自动安装依赖,自动启动服务了...
-
利用llama.cpp量化部署Llama-3-Chinese-8B-Instruct大模型
相关大模型项目:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3 量化部署是将机器学习模型压缩以减少内存占用和计算成本的过程。本文将详细介绍如何使用llama.cpp工具进行模型量化并在本地部署。 环...
-
部署Video-LLama遇到的坑
环境:linux,conda,python 3.10下载:下载时首先在中国直接拉去huggingface的git链接很大概率上实行不同的因为被ban了,如果想下载只能找镜像网站。镜像网站比如modelscope就非常好用,魔搭社区网速非常快!我这边使用的是...
-
ChatGPT开源的whisper音频生成字幕
1、前言 好了,那接下来看一下whisper开源库的介绍 有五种模型大小,其中四种仅支持英语,提供速度和准确性的权衡。上面便是可用模型的名称、大致的内存需求和相对速度。如果是英文版的语音,直接想转换为英文。 本来我是想直接在我...
-
ubuntu部署stable-diffusion-webui
1、下载stable-diffusion-webui 我这里使用的是阿里的oss缓存,可以直接下载 wget https://pai-vision-data-sh.oss-cn-shanghai.aliyuncs.com/aigc-data/code/...
-
Stable Diffusion的本地部署教程
以下是在Windows 10电脑上的操作步骤: 一、下载安装包 从以下夸克网盘下载地址下载安装包到本地,地址如下: 链接:https://pan.quark.cn/s/7c51556d27eb 提取码:cFdx 输入提取码之后,界面如下图:...
-
不管黑丝或者白丝还是想撕坏它,都可以用LoRA(Stable Diffusion进阶篇:ComfyUI 附加网络)
先来几张图 现在来教教大家怎样做出这样的图片 在学习WebUI的那些基础知识点的时候,有一个东西是每一个初学者都绕不开的大山-附加网络。 这个东西对于每一个接触Stable Diffusion的小伙伴来说就像是小学门口小卖部卖的辣条、初中课本上的涂...
-
重磅!Llama-3,最强开源大模型正式发布!
4月19日,全球科技、社交巨头Meta在官网,正式发布了开源大模型——Llama-3。 据悉,Llama-3共有80亿、700亿两种参数,分为基础预训练和指令微调两种模型(还有一个超4000亿参数正在训练中)。 与Llama-2相比,Llama-3使用...
-
LLaMA-Factory微调多模态大语言模型教程
本文旨在结合笔者自身的实践经历,详细介绍如何使用 LLaMA-Factory 来微调多模态大语言模型。目前仓库已支持若干流行的MLLM比如LLaVA-1.5,Yi-VL,Paligemma等。 2024.5.29 注:本文后续不再更新,如果想了解更新的特...
-
Ai绘画工具,Stable Diffusion提示词使用指南
哈喽,大家好,我是程序员晓晓 今天给大家分享的是Stable Diffusion提示词相关内容。 一、基本概述 1、提示词通常是在文生图和图生图的时候会使用到,就是这里的两个功能。 2、提示词由多个描述性词汇组成,由逗号隔开,结尾不需要加分隔符(注...
-
Stable Diffusion面部修复!ADetailer超详细简易技巧教学
这个面部修复扩展可以使图像从这样 变成这样 在低分辨率绘制全身图像时,面部和手部一直是一个难以处理的问题。 这个面部修复的扩展可以完美修复面部,但手部就会用到其他插件。 今天我们主要介绍stable diffusion 的ADetailer...
-
在 Apple Silicon Mac(M1、M2 或 M3)上运行最新 LLM 模型 Meta Llama 3 的分步指南
您是否正在寻找在基于 Apple Silicon 的 Mac 上运行最新 Meta Llama 3 的最简单方法?那么您来对地方了!在本指南中,我将向您展示如何在本地运行这个强大的语言模型,使您能够利用自己机器的资源来实现隐私和离线可用性。本教程将包括在...
-
LLMs:Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调)、安装、案例实战应用之详细攻略
LLMs:Chinese-LLaMA-Alpaca的简介(扩充中文词表+增量预训练+指令精调 、安装、案例实战应用之详细攻略 导读 :2023年4月17日,哈工大讯飞联合实验室,本项目开源了中文LLaMA模型和指令精调的Alpaca大模型,以进一步...
-
拥有你自己的Copilot!基于Llama3和CodeGPT部署本地Copilot,断网也能使用!
当谈到代码自动补全和辅助编程工具时,GitHub Copilot是一个备受推崇的选择。然而,有时我们可能希望在本地环境中构建一个类似的解决方案,以便更好地控制数据和隐私,更重要的是Llama3是免费,而Github Copilot是收费的。本文将分享如何基...
-
【Stable Diffusion】插件 ADetailer,修脸修手无敌
文章目录 概要 整体架构流程 技术名词解释 技术细节 小结 概要 正常显卡一次生成高精度图片速度超慢,大多不建议这样,那么在低分辨率绘制全身图像时,面部和手部一直是一个难以处理的问题。这个面部修复的扩展可以完美修复面部...
-
Stable Diffusion教程|SD WebUI必备插件安装 菜鸟轻松成高手
一个刚学AI绘画的小菜鸟怎么快速成为Stable Diffusionde的高手?答案就是SD插件,只要学会使用SD的各种插件,帮你写正向和负向提示词,修复人脸/身体/手指,高清放大图片,指定人物pose,图片微调等等都可以轻松搞定,善用插件是成为高手必经之...
-
在Windows下搭建Stable Diffusion环境中途出错咋弄?
在Windows下搭建Stable Diffusion环境需要以下几个步骤: 安装Git和Anaconda 首先,确保你的计算机上已经安装了Git和Anaconda。如果没有安装,可以分别访问官方网站进行下载和安装: Git: https://git...
-
在Windows上用Llama Factory微调Llama 3的基本操作
这篇博客参考了一些文章,例如:教程:利用LLaMA_Factory微调llama3:8b大模型_llama3模型微调保存-CSDN博客 也可以参考Llama Factory的Readme:GitHub - hiyouga/LLaMA-Factory: U...
-
探索未来文本交互的利器 - Nvim-Llama:将大型语言模型引入Neovim的革命性尝试...
? 探索未来文本交互的利器 - Nvim-Llama:将大型语言模型引入Neovim的革命性尝试 项目地址:https://gitcode.com/jpmcb/nvim-llama 在快速演进的人工智能领域,即时、高效的与语言模型交互已经成为开发者的梦...
-
用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型!
用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型! 文章目录 用 LLama-Factory 训练和微调 LLama3,打造你的专属 AI 模型! 什么是模型微调? 为什么使用 LLama-Fact...
-
Stable Diffusion WebUI安装简单教程
这里先提前说明一下,如果只是完成Stable Diffusion安装,那只提供命令行方式,加载模型并提供基础的文本分析、特征提取、图片生成这些核心功能,但自身是没有可视化UI的。我们通常看到的页面是Stable Diffusion WebUI提供的功能。所...
-
基于Llama 3的最强开源医疗AI模型OpenBioLLM-Llama3,刷新榜单
项目概述 OpenBioLLM-70B是一款先进的开源生物医学大型语言模型,由Saama AI实验室基于Llama 3技术精心开发并微调。此模型专为生物医学领域设计,利用尖端技术,在多种生物医学任务中实现了最先进的性能表现。 背景: Saam...
-
基于LLaMA-Factory微调Llama3
本文简要介绍下基于LLaMA-Factory的llama3 8B模型的微调过程 环境配置 # 1. 安装py3.10虚拟环境 conda create -n py3.10-torch2.2 python=3.10 source activate c...
-
GPT-4o攻破ARC-AGI无法被挑战的神话!71%准确率成新SOTA
【新智元导读】号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动,GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA! ARC-AGI是唯一可以用来衡量通用人工智能进展的基准,创造者François Chollets曾...
-
LLM记录:五一 Llama 3 超级课堂
LLM记录:五一 Llama 3 超级课堂 想玩大模型,自己又没那个环境,参加五一 Llama 3 超级课堂,简单记录一下llama3-8b的相关体验,实在是邀请不到人,还好后面开放了24G显存,好歹模型能跑起来了,只能说感谢大佬! Llama 3...
-
Copilot本地部署:(1)Github学生认证
(1)Github学生认证 a.在github中补全必要信息 ①登录github账号后(没有账号可用邮箱自行注册), 在https://github.com/settings/billing/payment_information中,填写好必填字段(...
-
Stable Diffusion本地部署教程
0.介绍与版本 1)介绍 Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员在Latent Diffusion Model的基础上于2022年8月创建并推出。其核心技术源于A...
-
stable diffusion本地部署@win10
一键无脑安装stable-diffusion-webui stable diffusion是当前非常出色的文生图模型,要优于以前gan文生图模型。现在有了stable-diffusion-webui软件,可以一键安装,大大简化了操作难度。本文档就是sta...
-
Llama 3超级课堂作业笔记
文章目录 基础作业 完成 Llama 3 Web Demo 部署 环境配置 下载模型 Web Demo 部署 对话截图 使用 XTuner 完成小助手认知微调 Web Demo 部署 自我认知训练数据集准备 训练模型 推理验证 使用...
-
stable diffusion无限贴近真人的调教方法,助力AI变现(下)
对于人像,我的研究重点主要是如何让脸更贴近原图。这篇文章就通过一些专题的实践,讲讲我对还原人脸的一些出图思路、技巧和心得,会从出图思路、优化方向出发,逐步拆解,希望能给大家带来启发。 本篇的重点内容有: 如何根据一张图像还原人脸? 如何使用 stab...
-
【Stable Diffusion】(基础篇二)—— Stable Diffusion图形界面介绍和基本使用流程
本系列笔记主要参考B站nenly同学的视频教程,传送门:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibili 在上一篇博客中,我们成...
-
【全网瞩目】最强文生图模型,Stable Diffusion 3技术报告解禁
12号,终于在Hugging Face上出现了 Stable Diffusion 3 Medium。没错,正如他所承诺的,最强文生图模型真的开源了。而且此次开源不仅是以SD2的比较下性能得到了更好的升级,同时也向我们展示了最前沿的DiT技术——MMDiT。...
-
Stable Diffusion复现——基于 Amazon SageMaker 搭建文本生成图像模型(3)
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前! 既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上鸿蒙开发知识点,真正体系化!...
-
微软欲将Windows打造成AI操作系统,推出Copilot+电脑
微软希望将生成式AI带到Windows及其运行的电脑的前沿。 在本周年度Build开发者大会的两场主题演讲中,该公司发布了一系列名为Copilot+的Windows新机型,以及如Recall等生成式AI功能,帮助用户查找过去浏览过的应用、文件和其他内容。...
-
AIGC在移动APP开发中的应用及未来前景
随着科技的不断进步,人工智能生成内容(AIGC,Artificial Intelligence Generated Content)在移动应用开发中的应用越来越广泛。AIGC不仅能提高开发效率,还能带来更好的用户体验。本文将探讨AIGC...
-
Whisper-AT:抗噪语音识别模型(Whisper)实现通用音频事件标记(Audio Tagger)
本文介绍一个统一音频标记(Audio Tagger)和语音识别(ASR)的模型:Whisper-AT,通过冻结Whisper的主干,并在其之上训练一个轻量级的音频标记模型。Whisper-AT在额外计算成本不到1%的情况下,可以在单次前向传递...
-
变分自编码器(VAE)在AIGC中的应用及其技术解析
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
霉霉开口唱碧昂丝的歌,又是AI!口型不出戏,五官姿态也自然,复旦百度等出品|GitHub揽星1k+
一张人像、一段音频参考,就能让霉霉在你面前唱碧昂丝的《Halo》。 一种名为Hallo的研究火了,GitHub已揽星1k+。 话不多说,来看更多效果: 不论是说话还是唱歌,都能和各种风格的人像相匹配。从口型到眉毛眼睛动作,各种五官细节都很自然。 单独...
-
Gemini视频推理遥遥领先GPT-4o,Jeff Dean连续转发三次,首个视频多模态基准Video-MME来了
OpenAI和谷歌接连两场发布会,把AI视频推理卷到新高度。 但业界还缺少可以全面评估大模型视频推理能力的基准。 终于,多模态大模型视频分析综合评估基准Video-MME,全面评估多模态大模型的综合视频理解能力,填补了这一领域的空白。 Gemini1.5P...
-
MetaAI发布Llama 3模型:4000亿参数的AI新标杆
开源和闭源大战 前几天,百度李彦宏说闭源才有意义。 周鸿祎在哈佛论坛演讲上说,别听李彦宏胡说八道,没有开源就没有Linux,就没有今天的互联网,李彦宏自己都是借助开源的力量走到今天,现在反手说开源不好了?话音刚落,Meta这个奶妈就又开源了,我们又回...
-
DeepSeek-Coder-V2代码语言模型免费吗?AI编程辅导代码生成使用方法详细教程指南
DeepSeek-Coder-V2 是一个开源的Mixture-of-Experts (MoE 代码语言模型,性能与GPT4-Turbo相当,在代码特定任务上表现卓越。它在DeepSeek-Coder-V2-Base的基础上,通过 6 万亿token的高...
-
推荐项目:Stable Diffusion WebUI - WD14 Tagger
推荐项目:Stable Diffusion WebUI - WD14 Tagger 项目地址:https://gitcode.com/toriato/stable-diffusion-webui-wd14-tagger 项目简介 Stable Dif...
-
Stable Diffusion初体验——基于机器学习通过神经网络的强大AI平台
文章目录 前言 最新热门活动!! 平台介绍 一.创建应用 Stable Diffusion WebUI 初始化 上传模型,VAE,lora 介绍sd模型,vae,lora模型 进入应用 文生图 工作区 调参区 图生图 结语 小程序活...
-
Whisper.cpp本地化:Windows端部署详解与实操
简介 什么是Whisper? OpenAI的Whisper是一个自动语音识别(ASR)系统,它经过了大量多语言和多任务的监督数据训练,能够进行多语言语音识别、语音翻译和语言识别等任务。Whisper模型使用了一个编码器-解码器的Transforme...