-
谷歌:LLM找不到推理错误,但能纠正它
今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。 那么,LLM 能否判断出自己的推理存在错误?最近,剑桥大学和...
-
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
2D 扩散模型极大地简化了图像内容的创作流程,2D 设计行业也因此发生了变革。近来,扩散模型已扩展到 3D 创作领域,减少了应用程序(如 VR、AR、机器人技术和游戏等)中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型,生成具有评分蒸馏采样(S...
-
第二课-一键安装SD-Stable Diffusion 教程
前言 看完这篇文章并跟着操作,就可以在本地开始 SD 绘图了。 理论上来说,这篇课程结束,想要画什么图都可以画了。 启动器介绍 SD 是开源的,可以在 github 上找到。但直接下载源码安装,非常费劲,而且因为国内外差异,就是我这样的秃头程序员...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框...
-
中文版LLaMA:Chinese-LLaMA-Alpaca
GitHub:GitHub - ymcui/Chinese-LLaMA-Alpaca: 中文LLaMA&Alpaca大语言模型+本地CPU/GPU训练部署 (Chinese LLaMA & Alpaca LLMs 以ChatGPT、GP...
-
LLaMA-Factory可视化界面微调chatglm2;LoRA训练微调模型 简单案例
参考:https://github.com/huggingface/peft https://github.com/hiyouga/LLaMA-Factory 1、LLaMA-Factory可视化界面微调chatglm2 类似工具还有流萤,注意是做中...
-
AI(二):初体验(Cursor、Copilot、Bito、Notion、ChatExcel、Gamma、Tome、ChatPDF、AI-Video、SD、ChatGPTAPI、Midjourney)
Cursor Cursor官网下载:https://www.cursor.so/ && https://github.com/getcursor/cursor Cursor.so是一款基于GPT的代码生成工具,它可以帮助开发者快速生成...
-
【多模态】3、CLIP | OpenAI 出品使用 4 亿样本训练的图文匹配模型
文章目录 一、背景 二、方法 2.1 使用自然语言来监督训练 2.2 建立一个超大数据集 2.3 选择预训练的方式——对比学习而非预测学习 2.4 模型缩放和选择 三、效果 四、思考 论文:Learning Transferabl...
-
〔002〕Stable Diffusion 之 简单汉化和双语汉化 篇
✨ 目录 ▷ 汉化预览 ▷ 下载插件方法一 ▷ 下载插件方法二 ▷ 下载插件方法三 ▷ 简单汉化 ▷ 双语汉化 ▷ 汉化预览 在上一篇文章中,我们安装好了 Stable Diffusion 开源 AI 绘画工具 但是整...
-
StableDiffusion实用插件推荐- Image Browsing介绍
插件介绍 ImageBrower不仅是一个图像浏览器,也是一个强大的图像管理器。精确的图像搜索与多选择操作相结合,大大提高了效率。支持独立运行,无需sd - web。 上面是这款插件的官方的介绍,我主要还是使用他的图片管理功能,感觉非常方...
-
(三)SadTalker 让stable diffusion 人物可以说话
功能说明 github 项目SadTalker 可以根据一张图片、一段音频,合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后,结合一段音频合成面部说话的视频(抖音常见的数字...
-
openai的whisper语音识别介绍
openAI发布了chatgpt,光环一时无两。但是openAI不止有这一个项目,它的其他项目也非常值得我们去研究学习。 今天说说这个whisper项目 https://github.com/openai/whisper ta是关于语音识别的。它提出了...
-
Stable-Diffusion-WebUI从代码下载到使用技巧
一、写在前面 本文用于对AI绘画感兴趣但无计算机编程基础的人,包含本人安装和使用过程中的心得,可供新学者参考。 心理准备: 电脑性能越高越好,最好有高端显卡,如30系以上。低端显卡也可以,速度和质量感人就是; 会要求下载一些软件、模型,涉及环境变...
-
Stable Diffusion 用2D图片制作3D动态壁纸
如果想让我们的2D图片动起来可以使用stable-diffusion-webui-depthmap-script插件在SD中进行加工让图片动起来。 这是一个可以从单个图像创建深度图,现在也可以生成3D立体图像对的插件,无论是并排还是浮雕。生成的结果可在3...
-
在GPU云服务器中部署Stable Diffusion web UI
在GPU云服务器中部署Stable Diffusion web UI 1. 前言 2. 关于云服务器的选择 3. 关于机器的选择 4. 部署Stable Diffusion Python和CUDA 检查pip源 下载Stable Diffus...
-
炸裂!本地部署,轻松切换多个 AI 模型
周末一直在耍 AI 本地部署个人知识库,基本都是基于 OpenAI 的开放接口进行封装,亦或者你本地部署自己部署一个小模型。 感觉这两个要求对小白玩家都太高了,一个要求有科学上网能力,一个要求你电脑带高端显卡能够本地部署。 今天给大家带来一个炸裂产品gp...
-
Stable Diffusion + EbSynth + ControlNet 解决生成视频闪烁
一、安装 1.1、安装ffmpeg 下载地址: 解压,配置环境变量 E:\AI\ffmpeg\bin 检查是否安装成功 1.2、安装SD的 EbSynth 插件 插件地址 https://github.com/s9roll7/ebsynth_...
-
芝加哥大学研究人员推出3D画笔:使用文本生成局部风格化纹理的AI方法
芝加哥大学的研究人员与Snap Research合作,推出了一种名为3D画笔(3D Paintbrush)的人工智能方法,通过文本描述自动生成网格上的局部语义区域的纹理。这一创新使得用户可以通过直观的、自由形式的文本输入控制纹理编辑,为各种网格描述其编辑。...
-
大火的4D Radar开源数据汇总
本文经自动驾驶之心公众号授权转载,转载请联系出处。 4D Radar在自动驾驶领域中越来越受关注,在价格和功能上都有比较大的竞争力,相关研究也逐渐open,今天为大家盘点下开源的4D Radar数据,为相关科学研究提供保障! 1Astyx 数据集链接:h...
-
如何使用GPTQ量化使LLM更轻
译者 | 李睿 审校 | 重楼 大型语言模型(LLM 应用的一大挑战是其耗费巨大的内存和计算需求,通常需要数十GB的GPU内存。这使得它们不仅昂贵而且难以运行。 为了缓解这些问题,研究人员开发了几种LLM压缩技术,其中包括“量化”。量化通过改变参数的存...
-
stable-diffusion 电商领域prompt测评集合
和GhostReivew一个思路,还是从比较好的图片或者是civitai上找一些热门的prompt,从小红书上也找到了不少的prompt,lexica.art上也有不少,主要是为了电商场景的一些测评: 小红书、civitai、Lexica、Liblib....
-
讯飞星火_VS_文心一言
获得讯飞星火认知大模型体验授权,第一时间来测试一下效果,使用申请手机号登录后,需要同意讯飞SparkDesk体验规则,如下图所示: 同意之后就可以进行体验了,界面如下: 讯飞星火效果体验 以下Prompt来自https://github.co...
-
谷歌Colab云端部署Stable Diffusion 进行绘图
系列文章目录 本地部署Stable Diffusion教程,亲测可以安装成功 Stable Diffusion界面参数及模型使用 文章目录 系列文章目录 前言 一、Colab是什么? 二、操作步骤 1.找到对应的脚本 2.在谷歌...
-
Open Vocabulary Detection 开放世界目标检测竞赛 2023获胜团队方案分享
OVD技术简介 目标检测是计算机视觉领域中的一项核心任务,其主要目标是让计算机能够自动识别图片中目标的类别,并准确标示每个目标的位置。目前,主流的目标检测方法主要针对闭集目标的开发,即在任务开始之前需要对待检测目标进行类别定义,并进行人工数据标注,通...
-
Copilot插件安装及IDEA配置
白嫖也可以但是前提要进行了学生认证,否则要花钱 认证方法在这 没有认证的购买方法 打开GitHub Copilot 网址:GitHub Copilot · Your AI pair programmer 直接在这登录账号购买即可 教程在这Copi...
-
pycharm连接GitHub copilot提示错误:...request id: 3, error code: -32603(请求id:3,错误代码:-32603)
检查网络,输入www.github.com看是否能接着成功 记得copilot插件要升级到最新 重启IDE 也有可能是其他问题 修改host文件 检查copilot是否授权allow 参考博客 webstrom连接GitHub copi...
-
本地免费GPT4?Llama 2开源大模型,一键部署且无需硬件要求教程
目前扎克布格带来了最新的Llama 2开源NLP大模型,目前有三个版本分别是70亿参数量,130亿参数量和700亿参数量,庞大的数据集和参数量保证了模型的强大,官网宣称性能与gpt4相比不落下风,又因为开源使得我们可以实现本地化gpt4的梦...
-
stable diffusion实践操作-宽高设置以及高清修复
系列文章目录 stable diffusion实践操作 文章目录 系列文章目录 前言 一、SD宽高怎么设置? 1.1 宽高历史 二、高清修复 1. 文生图中的高清修复 1.按钮Hires.fix 2.不同放大算法对比 1.第一...
-
使用 LoRA 技术对 LLaMA 65B 大模型进行微调及推理
前几天,Meta 发布了 LIMA 大模型,在LLaMA-65B的基础上,无需使用 RLHF,只用了 1000 个精心准备的样本数据进行微调,就达到了和 GPT-4 相媲美的程度。这激发了我探索 LLaMA 65B 大模型的兴趣。 之前的一系列大模型相...
-
【Stable-Diffusion-WebUI】Windows系统安装Stable-Diffusion-WebUI
写在前面 基于 stable-diffusion 封装的 webui 开源项目,通过界面交互的方式来使用 stable-diffusion,降低了使用门槛,可以通过本地部署的方式进行访问,对电脑的配置要求较高,以下配置要求仅供参考 GPU显卡:最好6...
-
Llama 2 论文《Llama 2: Open Foundation and Fine-Tuned Chat Models》阅读笔记
文章目录 Llama 2: Open Foundation and Fine-Tuned Chat Models 1.简介 2.预训练 2.1 预训练数据 2.2 训练详情 2.3 LLAMA 2 预训练模型评估 3. 微调 3.1 s...
-
stable diffusion webui过滤敏感信息NSFW
简介 过滤敏感信息(如涩图),可使用stable-diffusion-webui-nsfw-censor扩展,github仓库地址为:点这里 安装该扩展后,如果扩展认为是敏感信息,则会直接生成一张【黑色】的图片 安装方式 1、运行sd webu...
-
Photoshop安装StableDiffusion插件安装使用教程解决面临高峰需求问题
插件介绍 借助 Auto-Photoshop-StableDiffusion-Plugin,您可以直接在 Photoshop 中使用 Automatic1111 Stable Diffusion 的功能,而无需在程序之间切换。这使您可以在熟悉的环境中轻松...
-
本地运行 LLAMA & GPT-3.5-TURBO开源项目
git: nomic-ai/gpt4all: gpt4all: an ecosystem of open-source chatbots trained on a massive collections of clean assistant data i...
-
视频生成: 基于Stable Diffusion的微调方法
chatGPT带来了几个月的AIGC热度,文本图像生成模型大行其道,但AI在视频生成任务上尚没有较好的开源仓库,并受限于“缺那么几百块A100"的资源问题,大多数人无法展开视频生成的研究。好在目前有不少针对视频生成的相关paper,也有不少开源实现...
-
【AI绘图】Stable Diffusion WebUI环境搭建
Stable Diffusion WebUI开源地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui 首先根据要求做以下准备工作: 1. 安装 Python 3.10.6, 安装时记得勾...
-
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 S...
-
微软的人工智能 Copilot 到底有多强大?带你来体验一下
本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 郭霖 即可关注,每个工作日都有文章更新。 说实话,这是一篇我早就应该写的文章,我也不知道为什么我能拖这么久。 但好像从来也没有读者朋友们催我写过这类文章,这为我的拖更提供了很好的理由...
-
AIGC绘画:基于Stable Diffusion进行AI绘图
文章目录 AIGC深度学习模型绘画系统 stable diffusion简介 stable diffusion应用现状 在线网站 云端部署 本地部署Stable Diffusion AIGC深度学习模型绘画系统 stab...
-
自驱力超强的羊驼?斯坦福微调LLaMa
大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力,但严重依赖于人类编写的指令数据,而这些数据在数量、多样性和创造性方面都是有限的。 斯坦福科研人员引入了self-instruction框架,提高指令遵循能力来自我迭代进化,与Instr...
-
如何本地部署基于stable-diffusion的AI绘画(jupyter,python实现,详细,附代码)
基于stable - diffusion 的本地部署AI绘画教程 自从Stable Diffusion 1.0模型发布以来,“AI文本图片生成”真正的变成普通人也能使用的技术。同时各种国内外AI绘图软件,也不断频繁更新,AI绘画的关注度也越来越高...
-
Stable Diffusion WebUI安装SadTalker插件
引言 AI绘画已经火了有几个月了,不知道大家有没有去体验一下呢? 要说可操作性最强的莫过于Stable Diffusion WebUI,简称SD,下面我们就来介绍一下如何给SD安装上SadTalker插件,记录一下安装和使用过程中踩过的坑~ 安装...
-
JetBrains发布2023开发者报告!35岁危机存在吗?谁是最好的编程语言?
在开发者中影响力巨大的JetBrains发布了他们一年一度的「开发者生态系统现状」报告。 这份报告汇集了来自全球26348名开发者的见解,主题涵盖从编程语言、工具和技术,到人口统计数据等一些有趣的事实。 我们可以从中观察到广大程序员群体在各个方面的情况...
-
Stable Diffusion搭建全过程记录,生成自己的专属艺术照
引言 最近硅星人多次报道过 AI 图片生成技术,提到过 DALL·E、Midjourney、DALL·E mini(现用名 Craiyon)、Imagen、TikTok AI绿幕等知名产品。实际上,Stable Diffusion 有着强大的生成...
-
阿里开源!集成了 AIGC 的免费数据库工具:Chat2DB
今天推荐的这个项目是「Chat2DB」,一款开源免费的数据库客户端工具,支持 Windows、Mac 本地安装,也支持服务器端部署,Web 网页访问。 和传统的数据库客户端软件 Navicat、DBeaver 相比 Chat2DB 集成了 AIGC 的能...
-
李沐大模型公司细节曝光,项目GitHub空仓标星超500
AI大神李沐大模型创业方向,终于“水落石出”: 利用大模型能力,做游戏引擎,且是面向4A游戏。 关于4A游戏这个概念,目前业内没有统一的“名词解释”,但通常理解为比3A游戏更强大一点的游戏(doge)。 被曝从亚马逊首席科学家的职务上离职后,李沐联手其导师...
-
模型杂谈:使用 IN8 量化推理运行 Meta “开源泄露”的大模型(LLaMA)
接着之前文章《模型杂谈:快速上手元宇宙大厂 Meta “开源泄露”的大模型(LLaMA)》一文中的话题,继续聊聊如何使用 INT8 量化的方式来让低显存的设备能够将模型运行起来。 写在前面 前几天,在知乎上看到《如何评价 LLaMA 模型泄露?》问题...
-
AIGC 文生图及 stable diffusion webui 练习笔记
文章目录 环境要求 一. stable-diffusion-webui 安装 windows/linux 安装 docker 容器内安装 二. 运行 web-ui 插件安装 civitai helper additional netwo...
-
每日学术速递1.30
CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 更多Ai资讯: 今天带来的arXiv上最新发表的3篇文本图像的生成论文。 Subjects: cs.LG、cs.Cv、cs.AI、c...
-
给想玩AIGC的小白:教你从0搭一个图文视频生成网站(附插件&源码)
?腾小云导读 Stable Diffusion的发布是AI图像生成发展过程中的一个里程碑,相当于给大众提供了一个可用的高性能模型,让「AI 文本图片生成」变成普通人也能玩转的技术。最近一些网友将网上的真人图片不断喂给模型,让其自主学习...