-
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解
论文地址:https://arxiv.org/pdf/2311.08046.pdf GitHub 地址:https://github.com/PKU-YuanGroup/Chat-UniVi Huggingface 地址:https://huggi...
-
自主操作计算机框架Self-Operating Computer:用GPT-4V来模拟人类的鼠标点击和键盘输入
自动化技术的最新进展引人瞩目,其中一项引人注目的技术是Self-Operating Computer框架。这一框架采用了先进的GPT-4V模型,通过模拟人类的鼠标点击和键盘输入,实现了令人惊叹的自主操作。在演示中,我们看到了框架自动打开浏览器并访问Goog...
-
服务器CentOS 7 安装 Stable Diffusion WebUI ,并映射到本地浏览器
目录 配置环境 下载安装Stable Diffusion WebUI 解决安装过程的报错 报错一: Couldn't checkout {name}'s hash: {commithash} 报错二:Couldn't determine St...
-
获取了文心一言的内测及与其ChatGPT、GPT-4 对比结果
百度在3月16日召开了关于文心一言(知识增强大语言模型)的发布会,但是会上并没现场展示demo。如果要测试的文心一言 也要获取邀请码,才能进行测试的。 我这边通过预约得到了邀请码,大概是在3月17日晚就收到了,原本想着18号来测试一下文心一言到底怎么样,...
-
Code Llama系列教程之 微调 CodeLlama 34B 以进行聊天(打造自己的代码AI)
虽然 Meta 的 Llama2 在 AI 领域引起了广泛关注,但 34b 模型却缺席了相当长一段时间。对于许多人来说,这个 34b 模型是运行本地 LLM 的理想选择,因为它与使用 4 位量化的单个 4090 GPU 兼容。我一直在热切地等待 Meta...
-
Stable Diffusion - ControlNet 插件中扩展局部重绘 InpaintOnly + LaMa 算法与应用
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131643131 LaMa: https://github.com...
-
stable diffusion安装从0到1总结:包括遇到的坑和步骤
注:最低电脑配置:8G Vram+16G RAM+30G磁盘空间以上,20系列显卡及以上,windows>linux>macos。 文件可以不放在系统盘。举个例子:安装在D盘,在D盘创建一个StableDiffusion文件夹。下载下面文件:...
-
GTX1660Ti 本地部署 Stable Diffusion踩坑记录
踩坑记录 通过GitHub以及csdn开始安装 安装Anaconda,编译器以及CUDA、Cudnn 编译器 CUDA与Cudnn安装,**涉及电脑显卡的版本配置问题** 本地部署 踩坑实录 常见问题 Pytorch版本问题 显卡问...
-
免费长期部署微信机器人,小白也能轻松上手玩 AI
之前分享过本地搭建微信机器人的方式,昨天有同学问我说,本地电脑无法长期开着,但是想要微信机器人一直在线怎么办? 作为程序员的第一反应肯定是,购买个云服务器然后在云服务器上部署即可。然后同学又说自己不是程序员,不会玩云服务器,就想要个简单的方式。 找了...
-
stable-diffusion-webui部署
Stable Diffusion于2022-08-23开源,点击体验 扩散模型的定义与采样方法 扩散模型通过定义一个不断加噪声的前向过程来将图片逐步变为高斯噪声,再通过定义了一个逆向过程将高斯噪声逐步去噪变为清晰图片以得到采样。 在采样过程中,根据是...
-
Copilot 工作原理
Copilot 是如何工作的?它的背后算法是什么? Copilot 的工作原理可以大致分为两个阶段:第一阶段是从海量代码库中抽取出有效的代码段和语句,这些代码段用于训练AI模型;第二阶段则是谷歌的自然语言处理技术和深度神经网络技术,将文本解析成进一步的代...
-
在linux系统上运行Stable Diffusion web UI
stable-diffusion-webui项目地址 该项目是一个针对Stable Diffusion模型的浏览器操作界面,基于Gradio。 环境: 在恒源云上租的服务器,操作系统:Ubuntu、显卡:A4000-16G。恒源云官网链接 项目的Re...
-
【深度学习】AUTOMATIC1111 / stable-diffusion-webui docker
代码:https://github.com/AUTOMATIC1111/stable-diffusion-webui/ CUDA 11.8 制作了一个镜像,可以直接开启stable diffusion的web ui 服务。 确定自己的显卡支持CUDA1...
-
stable diffusion v1及v2版本 本地部署方法、踩坑
v1版本: 确保你至少有12G显存 git: GitHub - CompVis/stable-diffusion: A latent text-to-image diffusion modelhttps://github.com/CompVis/s...
-
中文LLaMA模型和指令精调的Alpaca大模型:中文数据进行二次预训练,进一步提升了中文基础语义理解能力
项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身...
-
Microsoft Copilot所做的限制性prompt
Source: 01 You are an Al programming assistant. 02 When asked for you name, you must respond with "GitHub Copilot" 03 Follow...
-
ai绘画工具Stable Diffusion,Windows本地环境搭建教程(保姆级)
配置要求 Windos 10及以上的操作系统; GPU显存最低4G, NVIDIA卡; 由于各种模型体量比较大,一个大模型2-5G,需留有充足的存储空间(20g+ ; 为什么选择Stable Diffusion 灵活开源,强大的ai生成工具...
-
当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍
目录 模型生成效果展示(prompt 全公开) 如何注册 Stable Diffusion 使用 SD(dreamstudio.ai )的收费标注如何 SD 提供哪些参数可以设置 如何使用种子来改进一张作品 我用 SD 创作的图片著作权如何归属...
-
Llama-Factory的baichuan2微调
Llama-Factory:https://github.com/hiyouga/LLaMA-Factory/tree/main 请使用 --quantization_bit 4/8 来启用 QLoRA 训练。 默认模块应作...
-
Docker AIGC等大模型深度学习环境搭建(完整详细版)
本文是《Python从零开始进行AIGC大模型训练与推理》(https://blog.csdn.net/suiyingy/article/details/130169592)专栏的一部分,所述方法和步骤基本上是通用的,不局限于AIGC大模型深度学习环境。...
-
【Python】ChatAnywhere,ChatGPT API实现的简易版copilot,能够在word、wps、office中写文档使用,任意软件内可用
Chat-Anywhere 在任意软件内使用快捷键补全选中文本,word和wps中都可以方便的使用, 特性 在任意软件内使用 编写文档的好助手 演示动图 选中文本作为上下文提示,按下快捷键Ctrl+Alt+\激活补全,开始后将会自...
-
stable diffusion的微调和lora微调代码版本
目前业界主流的sd训练基本都是基于diffusers和ldm的,这是huggingface的训练库,后者是stability ai在compvis等机构的基础上完善的,我目前工作上推理一般采用webui架构,训练采用diffusers,因此需要把webui...
-
decapoda-research/llama-7b-hf 的踩坑记录
使用transformers加载decapoda-research/llama-7b-hf的踩坑记录。 ValueError: Tokenizer class LLaMATokenizer does not exist or is not curre...
-
stable diffusion 安装教程
stable diffusion安装教程 环境准备 硬件要求 安装软件 Python 安装 安装git 安装cuda工具 安装工具包 模型下载 生成图片 成果展示 环境准备 硬件要求 1.需要拥有NVIDIA显卡...
-
【Python】部署stable diffusion的踩坑分享(Couldn‘t clone Stable Diffusion+stderr显示乱码)
问题描述 在部署stable diffusion时,进行到运行webui-user.bat环节时出现 主要困难点在于错误流(stderr)显示为乱码,无法判断错误原因 以及网上找不到对应解决方案 解决方法 1、首先解决乱码问题 win11...
-
Stable Diffusion作图
使用stable diffusion作图 1安装stable diffusion(Windows) 前置环境git、python10(低于此版本会导致部分py模块无法导入) 1.1 下载 stable diffusion webui (通过...
-
AI网红月入8万,只用PS即可打造
月入八万的网红美女,短短几个月就在ins上获得了超过15万粉丝。 还有些名人向她发送了私信,甚至500万粉丝的知名演员,也向她发出了约会邀请…… 这位粉红色长发的美女名叫Aitana,是一名25岁、来自巴塞罗那、性格外向的健身爱好者。 日常生活、穿搭展...
-
AIGC数据库工具-阿里开源Chat2DB
前言 今天无意间发现了一个AIGC数据库工具,chat2DB,重点!!!阿里开源,其设计产品的思想给了我很多灵感,故记录一下,并分享给大家。 概述: Chat2DB 是一款有开源免费的多数据库客户端工具,支持windows、mac本地安装,也支持...
-
通过 Amazon SageMaker JumpStart 部署 Llama 2 快速构建专属 LLM 应用
来自 Meta 的 Llama 2 基础模型现已在 Amazon SageMaker JumpStart 中提供。我们可以通过使用 Amazon SageMaker JumpStart 快速部署 Llama 2 模型,并且结合开源 UI 工具...
-
GitHub Copilot for Business 正式发布,重新定义开发生产力
AI 时代代码再也无需程序员亲自编写 给一段自然语言的需求 或者一小段代码做示意 GitHub Copilot 作为 AI 结对程序员 可以直接从中提取上下文 即时对单独行乃至整个函数提出建议开发生产力直接拉满 而现在,它来了「GitHub Cop...
-
使用openai-whisper 语音转文字
前言: 最近由于ChatGPT 的大热,AI 应用领域再次进入大众的视线,今天介绍一款AI应用whisper 可以较为准确的将人声转换为文字(支持多国语言) 一、安装 安装有两种方式pip 和源码编译安装,这里介绍pip安装方式...
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin 论文链接:https...
-
AIGC Stable Diffusion WebUI windows安装指南
安装电脑配置要求: NVIDIA显卡 显存>=4G(越大越好) 安装需要软件: git python cuda stable-diffusion-webui 梯子(魔法上网) 安装步骤: git安装 下载地...
-
Mac book M1/M2 安装 stable diffusion流程(SD)
一、 创建虚拟环境 由于后期炼丹的时候需要很多图片资源,因此如果你的硬盘空间和我一样不是很多的话,我建议你也将环境安装在外接移动硬盘上。 我们在创建虚拟环境时可以使用如下命令来指定虚拟环境安装的位置,同时我们还指定了 Python 的版本。 安装m...
-
Stable Diffusion WebUI 各操作系统安装教程
最近几天在 2 台 Mac、2 台 PC、一台云无 GPU 的 Linux 安装了 Stable Diffusion WebUI,这里记录下如何安装,以及一些注意点和坑。 以下内容针对 Windows(N 卡)、MacOS(m 系列芯片)、Linux(U...
-
Stable Diffusion Web-UI 安装指南
Stable DIffusion 是 Stability.AI 开源的 text-to-image 模型,目前类似产品有 Midjourney 以及 OpenAI 的 DELL-2 ;从AI绘画效果上来说,Midjourney 目前公认是最好的;但从模型的...
-
【whisper】在python中调用whisper提取字幕或翻译字幕到文本
最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。 一、...
-
安装stable-diffusion-webui时一直卡在Installling gfpgan的界面
前言 出现这个问题的原因是,安装gfpgan涉及到国外的仓库,就算科学上网以后,在终端里面还是访问不到这个国外仓库,解决办法就只有手动安装,遇到一些pip安装不了的包都可以尝试去github上找到对应的包仓库进行手动安装。 解决办法:手动安装gfpg...
-
GitHub Copilot 快速入门
GitHub Copilot 是 AI 结对程序员。 可以使用 GitHub Copilot 在编辑器中获取整行或整个函数的建议。 1. 简介 让我们首先了解一些关于 GitHub Copilot 的内容。 这是 GitHub 和 OpenAI 的合作...
-
安装stable-diffusion时gfpgan安装失败
错误代码如下: Installing gfpgan Traceback (most recent call last : File "launch.py", line 380, in <module> prepare_enviro...
-
【城南】如何识别AI生成图?视觉AIGC伪造检测技术综述
图片无法加载可参考阅读:知乎文章 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ry2Qw8uO-1685675351028 (https://r3mu87a8e6.feishu.cn/space/api/box/stre...
-
stable diffusion安装问题求教!
最后的webui-user.bat执行的过程真的是痛苦而漫长,网上什么破教程,问题一个接一个,解决一个就跳出另一个! 现在卡在这里了! 求教!如何解决。 Traceback (most recent call last : File "D:\SD...
-
Redis内存空间预估与内存优化策略:保障数据安全与性能的架构实践AIGC/AI绘画/chatGPT/SD/MJ
推荐阅读 AI文本 OCR识别最佳实践 AI Gamma一键生成PPT工具直达链接 玩转cloud Studio 在线编码神器 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间 资源分享 「java、pytho...
-
C#使用whisper.net实现语音识别(语音转文本)
目录 介绍 效果 输出信息 项目 代码 下载 介绍 github地址:https://github.com/sandrohanea/whisper.net Whisper.net. Speech to text made simpl...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架...
-
谷歌和微软联手培养AI未来:推出面向初学者的入门课程
近期,谷歌和微软联手推动人工智能(AI)领域的军备竞赛迈向教育行业,分别发布了针对初学者的AI入门课程。这标志着人工智能不仅仅是科技领域的竞争,也成为培养下一代科学家、思想家和AI领袖的教育重点。 首先,谷歌携手Raspberry Pi基金会推出了名为「E...
-
DALLE2论文解读及实现(一)
DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents paper: https://cdn.openai.com/papers/dall-e-2.pdf githu...
-
AI绘画|免费开源!一键部署的AI绘画工具Fooocus
一、项目介绍 (一 Fooocus:探索创意的图像生成软件。 该项目发布仅仅一周便在Github上收获了超过6k的star!! 其爆火的背后和Fooocus的三个特点分不开: 发扬了Stable Diffusion的开源精神...
-
IDEA提出ToG思维图谱 大模型性能提升214%!
近期,由IDEA研究院、微软亚洲研究院、香港科技大学等多方研究团队合作推出的Think-on-Graph技术,在深度推理领域掀起了一场革新。这一技术通过紧耦合大模型(LLM)与知识图谱(KG ,成功弥补了大模型在金融、法律、医疗等领域幻觉问题上的能力短板。...
-
AI视野:Azure AI新增40种大模型;Yi-34B-Chat微调模型开源;GPT-4在图灵测试中成功率超过41%;微软谷歌推出AI入门课程
???AI新鲜事 微软Azure AI新增40种大模型 微软宣布在Azure AI云开发平台中新增40个大模型,包括Whisper V3、Stable Diffusion、Phi、Falcon、SAM、CLIP、Code Llama等,支持文本生成、图像处...