git 第62页 - AIGC资讯

InsCode Stable Diffusion使用教程（非常详细）从零基础入门到精通，看完这一篇就够了

记录一下如何使用 InsCode Stable Diffusion 进行 AI 绘图以及使用感受。一、背景介绍目前市面上比较权威，并能用于工作中的 AI 绘画软件其实就两款。一个叫 Midjourney（简称 MJ），另一个叫 Stable Di...

生成式AI 2023-12-26 人工智能

1493阅读

安装stable-diffusion-webui踩坑经历

软件下载在b站up秋葉aaaki up很贴心有一个整合包可以直接运行。在github下载的原始版本sd-webui ，下载过程遇到clip包安装失败，参考了这两个文章可以解决打开stable diffusion webui时，提示缺少cl...

AIGC 2023-12-26 人工智能

1027阅读

谷歌Bard更新中文支持；GPT-4：1.8万亿参数、混合专家模型揭秘； Meta推出商用版本AI模型

? AI新闻 ? 谷歌的AI聊天工具Bard更新，增加中文支持摘要：谷歌的AI聊天工具Bard新增中文环境，用户可以使用简体和繁体中文进行交流。然而，与竞品相比，Bard的回复略显生硬，语义理解还有待提升。此外，谷歌还更新了Bard的日志页面，新...

大数据 2023-12-26 人工智能

972阅读

stable-diffusion画图

1、在python官网下载python3 安装 2、安装 CUDA 在安装 CUDA 之前查看nvidia版本我的版本是11.6就在nvidia官网下载对应版本 3、在github中下载stable-diffusion-webui git clon...

人工智能 2023-12-25 人工智能

832阅读

LLM微调（四）| 微调Llama 2实现Text-to-SQL，并使用LlamaIndex在数据库上进行推理

Llama 2是开源LLM发展的一个巨大里程碑。最大模型及其经过微调的变体位居Hugging Face Open LLM排行榜（https://huggingface.co/spaces/HuggingFaceH4/open_llm_lea...

AIGC 2023-12-25 人工智能

921阅读

Stable-Diffusion|从图片反推prompt的工具：Tagger（五）

stable-diffusion-webui-wd14-tagger 前面几篇：Stable-Diffusion|window10安装GPU版本的 Stable-Diffusion-WebUI遇到的一些问题（一）【Stable-Diffusion|入门怎...

生成式AI 2023-12-25 人工智能

1000阅读

AI视野：必应推出GPT-4Turbo模型；抖音测试“AI搜”功能；小红书内测AI聊天机器人；OpenAI计划新一轮融资

????大模型动态必应推出GPT-4Turbo模型微软推出Bing Chat的最新模型，GPT-4Turbo，为用户提供更准确和最新的信息。目前仅限部分用户试用，使用方法需通过检查资格确认。阿里团队推新AI模型I2VGen-XL 视频合成领域迎来...

人工智能 2023-12-25 人工智能

857阅读

挑战Transformer的Mamba是什么来头？作者博士论文理清SSM进化路径

在大模型领域，Transformer 凭一己之力撑起了整个江山。但随着模型规模的扩展和需要处理的序列不断变长，Transformer 的局限性也逐渐凸显，比如其自注意力机制的计算量会随着上下文长度的增加呈平方级增长。为了克服这些缺陷，研究者们开发出了很多...

生成式AI 2023-12-25 人工智能

1155阅读

AI绘画：Roop插件的特性与安装！

交叉”学科”来了！我们之前讲过可以实现单图换脸的Roop，也讲过可以通过文字描述画画的项目Stable-Diffusion-WebUI。现在这两者要通过sd-webui-roop产生交汇。我们先来简单的看一下这个插件可以干什么！功能特点...

生成式AI 2023-12-25 人工智能

1144阅读

Stable Diffusion - Easy Diffusion 图像生成工具的环境配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://blog.csdn.net/caroline_wendy/article/details/131524075 版本v2.5.41 Stab...

大数据 2023-12-25 人工智能

1364阅读

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Paper name LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Paper Reading Note Paper URL: htt...

人工智能 2023-12-25 人工智能

920阅读

发现【Stable-Diffusion WEBUI】的神奇插件：离线自动翻译中文提示词

文章目录（零）前言（一）提示词翻译（Prompt Translator）（1.1）尚需改进（零）前言本篇主要提到了WEBUI的提示词翻译插件，之前我说不喜欢联网的插件，而它是离线翻译。更多不断丰富的内容参考：?《...

人工智能 2023-12-25 人工智能

1250阅读

LLama Factory 安装部署实操记录（二）

1. 项目地址 GitHub - hiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, ChatGLM E...

人工智能 2023-12-25 人工智能

1779阅读

stable-diffusion-webui服务器centos部署实践（成功）

之前关注stable-diffusion仅仅是因为stable-diffusion模型，但实践证明，stable-diffusion如果么有那么好的提示词功力，恐怕生成的图就是“畸形的，缺胳膊少腿的，多一块，少一块的”，如V1实践，V2实践，纸糊效果。...

生成式AI 2023-12-25 人工智能

744阅读

Tracking Any Object Amodally ：让AI像人一样可以追踪任何对象

Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体，即使在部分遮挡或不完全可见的情况下也能理解其完整结构。在这个项目中，计算机被训练成能够“理解”并追踪到部分遮挡物体的完...

人工智能 2023-12-25 人工智能

834阅读

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！”

“私密离线聊天新体验！llama-gpt聊天机器人：极速、安全、搭载Llama 2，尽享Code Llama支持！” 一个自托管的、离线的、类似chatgpt的聊天机器人。由美洲驼提供动力。100%私密，没有数据离开您的设备。 Demo http...

AIGC 2023-12-25 人工智能

929阅读

Point Transformer V3：更简单、更快、更强!

本文经自动驾驶之心公众号授权转载，转载请联系出处。原标题：Point Transformer V3: Simpler, Faster, Stronger 论文链接：https://arxiv.org/pdf/2312.10035.pdf 代码链接：h...

生成式AI 2023-12-25 人工智能

1126阅读

阿里团队推新AI模型I2VGen-XL：单张静止图像就能生成高质量视频

视频合成最近取得了显著的进步，这得益于扩散模型的快速发展。然而，它在语义准确性、清晰度和时空连续性方面仍然存在挑战。它们主要源于文本-视频数据的稀缺性和视频的复杂固有结构，使得模型难以同时确保语义和定性的卓越性。阿里巴巴、浙江大学和华中科技大学的研究人员...

AIGC 2023-12-25 人工智能

837阅读

Github Copilot绑定Jetbrains IDE无效的解决方案

在Github中进行教育认证后不会自动开通Copilot功能，因此，在进行了Github教育认证之后，在使用之前要进入Github Copilot官网开通Coplilot，如果忽略了这一点，绑定Jetbrains IDE时就会产生绑定无效并卡在“Waiti...

生成式AI 2023-12-25 人工智能

909阅读

Llama 2 with langchain项目详解（三）

Llama 2 with langchain项目详解（三） 17.3 Llama 2 with langchain基础本节讲解在LangChain中使用Llama 2模型的基础知识，展示如何运行LangChain的代码，及在云端运行Llama 2的700...

生成式AI 2023-12-25 人工智能

770阅读

紧跟潮流，抓住趋势，跟上全民AI的节奏，开源IM项目OpenIM产品介绍，为AIGC贡献力量

开源价值高度自主、安全可控、开放自由，私有化部署，一切皆可控透明度和可信度：开源软件的源代码是公开的，任何人都可以查看和检查代码，从而增强了软件的透明度和可信度。用户可以了解软件的内部结构和运作方式，发现和修复潜在的安全漏洞和错误。自由度和可定...

生成式AI 2023-12-25 人工智能

1039阅读

使用llama.cpp在本地搭建vicuna 13B语言模型

有人做了windows下的脚本放到github上了，直接运行就可以了。我在本机试了一下13B的模型能运行，但生成速度非常慢，回复一个问题基本上要花5分钟以上的时间。我的机器配置 3900X 32G内存。 https://github.com/mps2...

大数据 2023-12-25 人工智能

763阅读

文字识别表格识别，这个库直接调用

PaddleOCR是一个基于PaddlePaddle深度学习框架开发的开源OCR（Optical Character Recognition）工具。除了光学字符识别（OCR）功能外，最新版本的PaddleOCR还引入了表格识别功能。表格识别是一种将图像...

人工智能 2023-12-24 人工智能

1162阅读

midjourney指令笔记+踩坑日记+gpt论文润色指令

跟人拼团入手了midjourney，长期记录更新。 midjourney指令笔记+踩坑日记指令笔记踩坑日记 GPT论文润色指令指令一指令二指令三指令四指令五指令笔记关键词参考网址：prompttool...

AIGC 2023-12-24 人工智能

1046阅读

Novel ai(stable-diffusion-webui)的本地部署经历

整体思路整体参考的就是下面的网站的内容，采用的里面是Anaconda搭建虚拟环境部署的步骤（网站里面用的Miniconda其实上和Anaconda整体思路是一样的） tip：Anaconda的配置是比较简单的，可以直接在网上搜索，需要注意的是建议先卸...

人工智能 2023-12-24 人工智能

937阅读

AI绘画中CLIP文本-图像预训练模型

介绍 OpenAI 在 2021 年提出了 CLIP（Contrastive Language–Image Pretraining）算法，这是一个先进的机器学习模型，旨在理解和解释图像和文本之间的关系。CLIP 的核心思想是通过大规模的图像和文本对进行...

AIGC 2023-12-24 人工智能

1053阅读

OpenAI Whisper + FFmpeg + TTS：动态实现跨语言视频音频翻译

本文作者系360奇舞团前端开发工程师摘要：本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS（Text-to-Speech）技术，以实现将视频翻译为其他语言并更换声音的过程。我们将探讨如何使用 Ope...

生成式AI 2023-12-24 人工智能

1183阅读

Ubuntu 22.04安装英特尔显卡驱动玩转AIGC

作者：英特尔网路与边缘计算事业部开发者关系经理李翊玮本文将介绍如何使用EIV 用5行指令在快速搭建含英特尔显卡及OpenVINO的AI开发环境, 并简洁说明如何使用OpenVINO 及英特尔显卡优化文生图模型Stable Diffusion 的速度。...

AIGC 2023-12-24 人工智能

1206阅读

baichuan-7B-chat微调报错及解决记录使用的仓库：LLaMA-Factory 2023年11月27日

我所使用的代码仓库是LLaMA-Factoryhiyouga/LLaMA-Factory: Easy-to-use LLM fine-tuning framework (LLaMA, BLOOM, Mistral, Baichuan, Qwen, Chat...

大数据 2023-12-24 人工智能

1723阅读

CMU权威对比Gemini，GPT-3和Mistral8×7B！GPT-3.5依旧拿捏Gemini，开源模型差距依然不小

谷歌最近发布的Gemini掀起了不小的波澜。毕竟，大语言模型领域几乎是OpenAI的GPT一家独大的局面。不过作为吃瓜群众，当然希望科技公司都卷起来，大模型都打起来！所以，作为科技巨无霸谷歌的亲儿子，Gemini自然承受了很高的期待。虽然Gemi...

大数据 2023-12-24 人工智能

1028阅读

工具：Copilot实战经验分享

在人工智能（AI）和机器学习（ML）领域，Copilot已经成为一个备受瞩目的工具。它是由微软和OpenAI联合开发的，以帮助开发者更高效地完成编程任务。在这篇文章中，我将分享一些关于Copilot的实战经验，以及如何利用它来提高编程效率。 Copil...

人工智能 2023-12-24 人工智能

983阅读

stable-diffusion安装和简单测试

参考：https://github.com/CompVis/stable-diffusion理解DALL·E 2， Stable Diffusion和 Midjourney的工作原理Latent Diffusion Models论文解读【生成式AI】淺談圖...

人工智能 2023-12-24 人工智能

961阅读

Stable Diffusion 深度图像库插件使用小记

前言 Controlnet 横空出世以来，Stable Diffusion 从抽卡模式变为引导控制模式，产生了质的飞跃，再也不用在prompt中钻研如何描述生成人物的动作模式，他对AI画师来说生产力提高不知道多少倍，文末...

大数据 2023-12-24 人工智能

1163阅读

window安装Stable-Diffusion-WebUI详细教程

直接上效果图，这是通过stable diffusion webui 利用古风模型生成的图片，实在是太好看了！！！看了这些图，有没有心痒痒的？今天就来带大家入个门！先把软件搞起来！【前言】 Stable Diffusion是2022年发布的深度学...

生成式AI 2023-12-24 人工智能

1098阅读

【stable-diffusion使用扩展+插件和模型资源（下）】

插件模型魔法图片等资源：https://tianfeng.space/1240.html 书接上文：（上）插件推荐 1.lobe theme lobe theme是一款主题插件，直接可以在扩展安装界面进行了重新布局，做了一些优化，...

AIGC 2023-12-24 人工智能

1033阅读

Install Stable Diffusion WebUI on Ubuntu 22.04.2 LTS

1. Environment OS：Ubuntu 22.04 LTS Kernel：5.15.0-60-generic CPU: Intel(R Xeon(R Gold 6278C CPU @ 2.60GHz, 8vCPUs GPU: 1 * N...

人工智能 2023-12-24 人工智能

929阅读

精讲stable diffusion的controlNet插件

controlNet插件是stable diffusion的一个重要插件，甚至可以说正是因为有了controlNet插件，stable diffusion才会具有midjourney所不具备的独特魅力！我们今天就一起来学习下controlNet插件的安...

生成式AI 2023-12-24 人工智能

1069阅读

【AIGC】Chatglm2-lora微调

ChatGLM2介绍 ChatGLM2-6B源码地址：https://github.com/THUDM/ChatGLM2-6B ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低...

AIGC 2023-12-24 人工智能

985阅读

Copilot：AI自动写代码，人工智能究竟还能取代什么？

Copilot：AI自动写代码，人工智能究竟还能取代什么？前言在AI绘画掀起一阵热潮之后，AI写代码又逐渐进入了我们的视野，似乎这一步我们还没想到就迅速到来了，难道说AI在取代画家之后，还要取代程序员吗？相信我们都曾幻想过这一天，在编写那些...

生成式AI 2023-12-24 人工智能

1085阅读

Copilot：一个基于人工智能的编程助手，让你编程更轻松

编程是一项有趣而又富有挑战的工作，它需要不断地学习、思考、创造和解决问题。但是编程也有很多困难和繁琐的地方，比如要记住各种语法规则、查找合适的代码示例、处理各种错误和异常、编写重复的代码等等。有没有一种工具，可以帮助我们编程，让我们更专注于业务逻辑，更高效...

生成式AI 2023-12-24 人工智能

1029阅读

Llama中文社区开源预训练Atom-7B-chat大模型体验与本地化部署实测(基于CPU，适配无GPU的场景)

一、模型简介原子大模型Atom由Llama中文社区和原子回声联合打造，在中文大模型评测榜单C-Eval中位居前十（8月21日评测提交时间）。 Atom系列模型包含Atom-7B和Atom-...

大数据 2023-12-24 人工智能

1111阅读

GPT系列训练与部署——GPT2环境配置与模型训练

本文为博主原创文章，未经博主允许不得转载。本文为专栏《Python从零开始进行AIGC大模型训练与推理》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/13...

大数据 2023-12-24 人工智能

994阅读

14秒就能重建视频，还能变换角色，Meta让视频合成提速44倍

就今天的人工智能发展水平来说，文生图、图生视频、图像/视频风格迁移都已经不算什么难事。生成式 AI 天赋异禀，能够毫不费力地创建或修改内容。尤其是图像编辑，在以十亿规模数据集为基础预训练的文本到图像扩散模型的推动下，经历了重大发展。这股浪潮催生了大量图...

生成式AI 2023-12-24 人工智能

785阅读

击败扩散模型，清华朱军团队基于薛定谔桥的新语音合成系统来了

近日，由清华大学计算机系朱军教授课题组发布的基于薛定谔桥的语音合成系统 [1]，凭借其「数据到数据」的生成范式，在样本质量和采样速度两方面，均击败了扩散模型的「噪声到数据」范式。论文链接：https://arxiv.org/abs/2312.03...

人工智能 2023-12-24 人工智能

1147阅读

测试时领域适应的鲁棒性得以保证，TRIBE在多真实场景下达到SOTA

测试时领域适应（Test-Time Adaptation）的目的是使源域模型适应推理阶段的测试数据，在适应未知的图像损坏领域取得了出色的效果。然而，当前许多方法都缺乏对真实世界场景中测试数据流的考虑，例如：测试数据流应当是时变分布（而非传统领域适应中...

AIGC 2023-12-24 人工智能

895阅读

最强英文开源模型LLaMA架构探秘，从原理到源码

导读：LLaMA 65B是由Meta AI（原Facebook AI）发布并宣布开源的真正意义上的千亿级别大语言模型，发布之初（2023年2月24日）曾引起不小的轰动。LLaMA的横空出世，更像是模型大战中一个搅局者。虽然它的效果（performance）...

人工智能 2023-12-24 人工智能

1330阅读

【LLM】LLaMA简介：一个650亿参数的基础大型语言模型

LLaMA简介：一个650亿参数的基础大型语言模型 Paper Setup 其他资料作为 Meta 对开放科学承诺的一部分，今天我们将公开发布 LLaMA (大型语言模型 Meta AI ，这是一个最先进的大型语言基础模型，旨在帮...

AIGC 2023-12-23 人工智能

1232阅读

【AIGC核心技术剖析】用于高效 3D 内容创建生成（从单视图图像生成高质量的纹理网格）

3D 内容创建的最新进展主要利用通过分数蒸馏抽样（SDS）生成的基于优化的 3D 生成。尽管已经显示出有希望的结果，但这些方法通常存在每个样本优化缓慢的问题，限制了它们的实际应用。在本文中，我们提出了DreamGaussian，这是一种新颖的3D内容生...

生成式AI 2023-12-23 人工智能

873阅读

stable-diffusion-webui环境部署

stable-diffusion-webui环境部署 1. 环境创建 2. 安装依赖库 3.下载底模 4. 获取lora参数文件 5.运行代码 6. 报错信息报错1 报错2 1. 环境创建创建虚拟环境 conda cr...

生成式AI 2023-12-23 人工智能

876阅读

Stable Diffusion攻略集（Stable Diffusion官方文档、kaggle notebook、webui资源帖）

文章目录第一部分一、 Features：Textual Inversion（文本反转） 1.1 Textual Inversion 简介 1.1.1 摘要 1.1.2 算法 1.1.3 模型效果 1.2 Textual Invers...

AIGC 2023-12-23 人工智能

1375阅读