-
windows10下whisper的安装使用和CUDA的配置
buzz基于whisper的客户端,可以优先尝试,支持Mac, Windows和Linux https://github.com/chidiwilliams/buzzhttps://github.com/chidiwilliams/buzz whis...
-
用检索增强生成让大模型更强大,这里有个手把手的Python实现
本文首先将关注 RAG 的概念和理论。然后将展示可以如何使用用于编排(orchestration)的 LangChain、OpenAI 语言模型和 Weaviate 向量数据库来实现一个简单的 RAG。 检索增强生成是什么? 检索增强生成(RAG)这一...
-
python语音识别whisper
一、背景 最近想提取一些视频的字幕,语音文案,研究了一波 二、whisper语音识别 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 stable-...
-
基于llama模型进行增量预训练
目录 1、llama模型转换(pytorch格式转换为HuggingFace格式 1.1、拉取Chinese-LLaMA-Alpaca项目 1.2、准备文件夹 1.3、下载llama官方原始模型 1.4、移动文件到指定位置 1.5、执行转换脚...
-
stable diffusion教程,详细版,包括解决各种问题
前提: 需要环境 git git下载地址Git - Downloading Package 直接装即可 python3.10.6 下载地址 Python Release Python 3.10.6 | Python.org 记得p...
-
Grounding dino + segment anything + stable diffusion 实现图片编辑
目录 总体介绍 总体流程 模块介绍 目标检测: grounding dino 目标分割:Segment Anything Model (SAM 整体思路 模型结构: 数据引擎 图片绘制 集成 样例 其他问题 附录 总体介绍...
-
深入理解LLaMA, Alpaca, ColossalChat 系列模型
知乎:紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca:大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...
-
Pycharm配置Copilot一直waiting for github authentication
版本 pycharm版本:2022.1.3社区版 copilot插件版本:1.1.27.1708 问题 安装插件后,login时一直waiting for github authentication。看了一些issue有的回退版本,有的通过fq然...
-
Upscayl:开源AI图像放大增强工具 | AIGC实践
连续写了两篇比较理论的文章——一篇行业思考,一篇技术讨论——可能劝退了很多不明真相的人民群众,一看后台数据,好么…… 马上周末了,今天分享一篇轻松小文,介绍一款开源免费、成熟度高、操作简单、效果显著的开源AI图像放大增强工具——Upscayl。...
-
Stable Diffusion - After Detailer 插件 脸部和手部 重绘算法与应用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131699857 After Detailer 是一个用于 Stabl...
-
大语言模型-中文chatGLM-LLAMA微调
微调大语言模型-ChatGLM-Tuning大语言模型-微调chatglm6b大语言模型-中文chatGLM-LLAMA微调大语言模型-alpaca-lora 本地知识库大语言模型2-document ai解读大语言模型-DocumentSearch解...
-
处理stable-diffusion-webui本地部署过程中的commit hash <none>问题的一个方法
安装webui时一直卡在commit hash none RuntimeError: Couldn't determine Stable Diffusion's hash: 69ae4b35e0a0f6ee1af8bb9a5d0016ccb27e36dc...
-
大语言模型之七- Llama-2单GPU微调SFT
(T4 16G)模型预训练colab脚本在github主页面。详见Finetuning_LLama_2_0_on_Colab_with_1_GPU.ipynb 在上一篇博客提到两种改进预训练模型性能的方法Retrieval-Augmented Gener...
-
Stable Diffusion XL训练LoRA
主要包括SDXL模型结构,从0到1训练SDXL以及LoRA教程,从0到1搭建SDXL推理流程。 【一】SDXL训练初识 Stable Diffusion系列模型的训练主要分成一下几个步骤,Stable Diffusion XL也不例外: 训练集...
-
阿里云白嫖GPU搭建Stable Diffusion Webui (保姆级教程)
1. 准备条件 1.1 环境搭建(白嫖阿里云GPU资源包) 显卡:VRAM 4GB 以上 (建议使用NVIDIA显卡 内存:建议8G以上 Python版本:>3.10 1.1.1 阿里云先领取资源包 https://free.ali...
-
AI「cosplay」关键在人设!复旦、人大等发布大五人格+MBTI测试:特质还原率达82.8%,拒绝OOC
想和喜欢的动漫小说角色聊天?想要一个虚拟伴侣?想要自己的数字智能体? 随着大语言模型(Large Language Models, LLM)的发展,这些过去的幻想似乎越来越近了。 Character AI、Chat 凉宫春日、病娇AI女友模拟器……基于大...
-
Win11的dev通道更新Build23493版本后启用Windows Copilot的解决办法
博客嘛,多偷懒少打字,先上图: 首先是微软宣布了对dev通道版本推送了Windows Copilot for Windows 11,但是相信像我这样的小白想体验又对win一窍不通的人应该也有不少,经历了一次重装,五次版本的回退再更新后终于...
-
Omniverse Replicator环境配置和使用说明
Omniverse Replicator使用说明 本教程将介绍Omniverse Replicator的环境配置和使用说明, 参加Sky Hackathon的同学可以参考本教程来合成训练数据集. 文章目录 Omniverse Repl...
-
10月份stable diffusion animatediff等插件使用指南,又来更新了
插件一直会更新,包含了基本市面上流行的90%插件,好用的插件更是不会错过,往期插件请看往期文章,如果你没有时间一直关注sd更新的进展,请关注我,一个月用几个小时看一下我的文章,最短时间跟进sd。也算是我的个人笔记 sd插件 sd-webui-ani...
-
中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT
中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...
-
ChatGLM-LLaMA-chinese-insturct 学习记录(含LoRA的源码理解)
ChatGLM-LLaMA-chinese-insturct 前言 一、实验记录 1.1 环境配置 1.2 代码理解 1.2.1 LoRA 1.4 实验结果 二、总结 前言 介绍:探索中文instruct数据在C...
-
LLM - Model Load_in_8bit For LLaMA
一.引言 LLM 量化是将大语言模型进行压缩和优化以减少其计算和存储需求的过程。 博主在使用 LLaMA-33B 时尝试使用量化加载模型,用传统 API 参数控制量化失败,改用其他依赖尝试成功。这里先铺下结论: ◆ Load_in_8bit ✔️...
-
如何使用 ChatGPT 生成 Stable diffusion 提示词
chatgpt免费体验入口网址: http://chat.xutongbao.top 一、教chatgpt写提示词 StableDiffusion是一款利用深度学习的文生图模型,支持通过使用提示词来产生新的图像,描述要包含或省略的元素。 我...
-
如何白嫖copilot
有两种办法白嫖: Free trial: 可以subscribe,绑定了visa卡之后,有两个月的免费体验阶段,中间可以随时取消。 Github Pro:如果有edu邮箱的话,可以白嫖copilot。需要先申请一个edu pro。 详情: G...
-
Stable Diffusion系列(一):古早显卡上最新版 WebUI 安装及简单操作
文章目录 Stable Diffusion安装 AnimateDiff插件适配 sdxl模型适配 Stable Diffusion使用 插件安装 界面设置 基础文生图 加入lora的文生图 Stable Diffusion安...
-
AI视野:奥特曼重回OpenAI;魔搭社区推出开源版GPTS;谷歌Bard遭遇提示注入攻击;Meta重组并解散AI监管团队
???AI新鲜事 反转!奥特曼重回OpenAI 据报道,OpenAI 前 CEO Sam Altman与前总裁Greg Brockman在 OpenAI 旧金山总部与公司高管会面。微软和其他投资人正在努力恢复Sam Altman的职位。 Emmett...
-
【AI热点技术】ChatGPT开源替代品——LLaMA系列之「羊驼家族」
ChatGPT开源替代品——LLaMA系列之「羊驼家族」 1. Alpaca 2. Vicuna 3. Koala 4. ChatLLaMA 5. FreedomGPT 6. ColossalChat 完整的 ChatGPT 克隆解决方案 中...
-
OpenAI安全系统负责人长文梳理:大模型的对抗攻击与防御
随着 ChatGPT 的发布,大型语言模型应用正在加速大范围铺开。OpenAI 的安全系统团队已经投入了大量资源,研究如何在对齐过程中为模型构建默认的安全行为。但是,对抗攻击或 prompt 越狱依然有可能让模型输出我们不期望看到的内容。 目前在对抗攻击...
-
一文读懂 AI Agents 技术
想象一下:软件实体能够自主地与环境交互,根据收集的数据做出决策,并以最少的人为干预执行基于特定场景。幸好,借助 AI Agents 技术,这个现实比你想象的更接近了。这些智能代理正在彻底改变行业,并改变我们的生活方式。但是,大家可能会好奇:AI Agen...
-
whisper.cpp在Windows VS的编译
Whisper是OpenAI开源的一款语音识别的模型,包含有英语和多国语言的模型,根据实际情况来看,其支持的90多种语言的准确率着实表现惊艳,英文甚至可以做到3%左右的误词率,官方图表显示中文的误词率大约是14%,但是实际使用的情况来看,误词率也是相当低,...
-
DiagrammerGPT:GPT-4主导的颠覆性双层文生图表模型
近期,北卡罗来纳大学提出了一项重大技术突破,通过将GPT-4充当“规划师”和“审计师”,构建了DiagrammerGPT框架,实现了文本描述生成科学图表的布局规划。该框架利用GPT-4的强大自然语言处理能力指导图表布局生成,创新性地设计了闭环反馈机制,通过...
-
Qt Creator 11 开放源码集成开发环境新增集成终端和 GitHub Copilot 支持
导读 Qt 项目今天发布了 Qt Creator 11,这是一款开源、免费、跨平台 IDE(集成开发环境)软件的最新稳定版本,适用于 GNU/Linux、macOS 和 Windows 平台。 Qt Creator 11 的亮点包括支持标签、多外...
-
stable diffusion安装踩坑
#本文为个人安装stable diffusion踩坑日志,内容比较凌乱,参考价值不大。 #踩坑花了三天时间#Q:491516541 环境:笔记本 win10,12G内存,GTX850m(2G显存 #准备工作: 安装Python 3.10.10 安装git...
-
GPT-4充当“规划师、审计师”,颠覆性双层文生图表模型
DALL-E3、Midjourney、Stable Diffusion等模型展现出了强大的创造能力,通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片,但在生成科学图表(柱状、直方、箱线、树状等)方面却略显不足。 这是因为模型在生成图表时会遗漏...
-
【C#】Whisper 离线语音识别(微软晓晓语音合成的音频)(带时间戳、srt字幕)...
语音合成&语音识别 用微软语音合成功能生成xiaoxiao的语音。 用Whisper离线识别合成的语音输出srt字幕。 一、语音合成 参考这个网址:https://www.bilibili.com/read/cv1906463...
-
复旦、人大等发布大五人格+MBTI测试 角色扮演AI特质还原率达82.8%
近期,由复旦大学和中国人民大学合作的Chat凉宫春日团队发布了一项关于AI角色扮演的研究。该研究强调了良好的人设还原度对于评价AI角色扮演的重要性,特质还原率高达82.8%。研究使用了大五人格的NEO-FFI问卷和MBTI的16Personalities测...
-
AIGC - 生产力新工具 Copilot
文章目录 介绍 能干啥 IDEA 安装 介绍 https://github.com/features/copilot 能干啥 Copilot的主要功能包括: 代码补全和提示:Copilot会根据上下文,智能提...
-
GitHub:程序员正积极使用 AI 编程、JavaScript 语言依然最流行
IT之家 11 月 20 日消息,GitHub 发布了 2023 年度 Octoverse 开源状态报告,其中主要强调了 AI 在开发过程中的作用,并围绕云和 Git 的开源活动展开。 官方介绍称,今年的三大趋势如下: 开发人员正在大量使用生成式 A...
-
训练AI助理实现SumTo100游戏自学习与结果预测
译者 | 朱先忠 审校 | 重楼 简介 在一款完美的信息类游戏中,如果你所需要的一切都能够让每一个玩家在游戏规则中看到,这不是一件很神奇的事情吗? 但遗憾的是,对于像我这样的普通玩家来说,阅读有关一款新游戏的玩法规则只是学习玩复杂游戏旅程中的一小部分,而...
-
「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR
多模态对比表示(multi-modal contrastive representation, MCR)的目标是将不同模态的输入编码到一个语义对齐的共享空间中。 随着视觉-语言领域中CLIP模型的巨大成功,更多模态上的对比表征开始涌现出来,并在诸多下游任...
-
用上最新的 GitHub Copilot Chat 了!
本文首发于我的“职场圈”知识星球: 大家好!我是韩老师。 两周前,GitHub Copilot X 横空出世: 重磅!GitHub Copilot X 来了! 带来了五大功能: GitHub Copilot Chat(边写...
-
Ubuntu 22.04.2 LTS LTS x86_64 安装 stable-diffusion-webui 【2】基本版本完结。
前篇 Ubuntu 20.04 LTS x86_64 安装 stable-diffusion-webui_hkNaruto的博客-CSDN博客 内容太多,分第二篇继续 中途重装了机器,20.04 ,apt upgrade后自动升级到22.04.2...
-
用 7 行代码在本地运行 Llama 2!(苹果silicon-mac m1 m2)项目源码含模型
总而言之: xcode-select --install # Make sure git & clang are installed git clone https://github.com/ggerganov/llama.cpp.git cd...
-
AMD显卡Ubuntu20.4系统下部署stable diffusion
今天来给大家做一个AMD显卡使用stable diffusion的小白(硬核)教程。最近这段时间AI特别火,很多小伙伴看到各种大佬用AI画的老婆非常精美(色情),弄的人心痒痒,自己也想画一个心仪的老婆(画作)。...
-
GitHub Copilot使用指南
GitHub Copilot 是由 GitHub 开发的 AI 编程插件,GitHub Copilot 由 OpenAI Codex 提供支持,OpenAI Codex 是一种由 OpenAI 创建的生成式预训练语言模型,可根据评论和代码的上下文提供上下文...
-
LLama大模型初体验——Linux服务器部署LLama注意事项
LLama大模型初体验——Linux服务器部署LLama注意事项 一、基本步骤 基本步骤可以参考这个链接:超详细Llama2部署教程——个人gpt体验攻略! llama开源仓库:https://github.com/facebookresearc...
-
用Colab免费部署AI绘画云平台Stable Diffusion webUI
Google Colab 版的 Stable Diffusion WebUI 1.4 webui github 地址:https://github.com/sd-webui/stable-diffusion-webui 平台搭建 今天就来交大家如果来...
-
021-Qt 配置GitHub Copilot
Qt 配置GitHub Copilot 文章目录 Qt 配置GitHub Copilot 项目介绍 GitHub Copilot 配置 GitHub Copilot Qt 前置条件 升级Qt GitHub Copilot 前置条件...
-
OpenAI大动作:Whisper large-v3重塑语音识别技术
在最近的OpenAI首届开发者大会上,一个引人注目的技术亮点是Whisper large-v3的发布。这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。今天,我们就来深入了解这个技术突破,并探讨它如...
-
VSCode使用插件Github Copilot进行AI编程
演示示例 函数封装 根据上下文 根据注释 详情请看GitHub Copilot 安装插件 在VS Code中安装插件 GitHub Copilot 登录账号 点击VS code左下角账户图标,点击【Sign in】,会自动在浏...