git 第57页 - AIGC资讯

【腾讯云HAI】都2023年了，HAI没玩过AIGC？

:::info 腾讯云高性能应用服务(Hyper Application lnventor，HA ，是一款面向 Al、科学计算的 GPU 应用服务产品，为开发者量身打造的澎湃算力平台。无需复杂配置，便可享受即开即用的GPU云服务体验。在 HA] 中，根据应...

AIGC 2024-01-09 人工智能

1109阅读

AutoDL从0到1搭建stable-diffusion-webui

前言 AI绘画当前非常的火爆，随着Stable diffusion，Midjourney的出现将AI绘画推到顶端，各大行业均受其影响，离我们最近的AI绘画当属Stable diffusion，可本地化部署，只需电脑配备显卡即可完成AI绘画工作，此篇...

人工智能 2024-01-09 人工智能

1106阅读

【Stable Diffusion应用案例系列】【1】一键抠图--rembg插件安装与使用

《博主简介》小伙伴们好，我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源，可关注公-仲-hao:【阿旭算法与机器学习】，共同学习交流~ ?感谢小伙伴们点赞、关注！《------往期经典推荐----...

大数据 2024-01-09 人工智能

937阅读

AIGC：【LLM（七）】——Baichuan2：真开源可商用的中文大模型

文章目录一.模型介绍二.模型部署 2.1 CPU部署 2.2 GPU部署三.模型推理 3.1 Chat 模型推理 3.2 Base 模型推理四.模型量化 4.1 量化方法 4.2 在线量化 4.3 离线量化 4.4 量化效果...

生成式AI 2024-01-09 人工智能

1068阅读

Whisper OpenAI开源语音识别模型

介绍 Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）和多任务（multitask）监督数据对 Whisper 进行了训练...

大数据 2024-01-09 人工智能

2034阅读

2023的AI工具集合，google和claude被禁用解决和edge的copilot

一、前言 AI工具集合首先，OpenAI的ChatGPT以其深度学习模型和强大的语言处理能力引领了AI聊天机器人的潮流。自2022年11月30日上线以来，它创下了100万用户的注册记录，并被广泛应用于全球财富500强公司。为了实现盈利，OpenAI发...

人工智能 2024-01-09 人工智能

1033阅读

whisper深入-语者分离

文章目录学习目标：如何使用whisper 学习内容一：whisper 转文字 1.1 使用whisper.load_model( 方法下载，加载 1.2 使用实例对文件进行转录 1.3 实战学习内容二：语者分离（pyannote.aud...

生成式AI 2024-01-09 人工智能

1003阅读

1、aigc图像相关

aigc图像相关一、Diffusion webui 在autodl上部署一些问题二、lora和kohyass （1）角色模型（2）风格模型（3）dreambooth （4）模型合并（5）Lora加Adetail 其他三、sd a...

人工智能 2024-01-09 人工智能

2215阅读

分享15个全球顶尖的AIGC图片生成平台

人工智能正在改变许多行业的格局，而其中改变最直观和影响最大的就是AIGC领域的图像创作。发展至今已经有很多AI图像生成平台，他们的共同特点就是使用人工智能将文本转换为图像，这是一次革命性的突破，也就是说通过这些AI工具可以在几秒钟内将文字转换成更具可视...

生成式AI 2024-01-09 人工智能

3619阅读

如何用Stable Diffusion模型生成个人专属创意名片？

目录 1 什么是二维码？ 2 什么是扩散模型？ 3 Stable Diffusion环境搭建 4 开始制作创意名片结语 1 什么是二维码？二维码是一种用于存储和传输信息的方便而广泛使用的图像编码技术。它是由黑色方块和白色空白区...

大数据 2024-01-08 人工智能

1074阅读

Jetson Orin安装riva以及llamaspeak，使用 Riva ASR/TTS 与 Llama 进行实时交谈，大语言模型成功运行笔记

NVIDIA 的综合语音 AI 工具包 RIVA 可以处理这种情况。此外，RIVA 可以构建应用程序，在本地设备（如 NVIDIA Jetson）上处理所有这些内容。 RIVA 是一个综合性库，包括：自动语音识别（ASR）文本转语音合成（TT...

生成式AI 2024-01-08 人工智能

1279阅读

Colossal-AI团队开源了SwiftInfer 大模型无限流式输入推理飙升46%

近日，国产开源项目SwiftInfer实现了无限流式输入推理，成功提升了大模型推理性能46%。这是一个重大突破，可以为多轮对话场景提供高效可靠的落地方案。它采用了attention sink注意力机制、窗口注意力优化、KV Cache机制优化等方法，Sw...

生成式AI 2024-01-08 人工智能

878阅读

四行代码让大模型上下文暴增3倍，羊驼Mistral都适用

无需微调，只要四行代码就能让大模型窗口长度暴增，最高可增加3倍! 而且是“即插即用”，理论上可以适配任意大模型，目前已在Mistral和Llama2上试验成功。有了这项技术，大模型（LargeLM）就能摇身一变，成为LongLM。近日，来自得克萨斯农...

人工智能 2024-01-08 人工智能

819阅读

Stable Diffusion web UI 安装、启动脚本、常见问题、插件（linux）

Stable Diffusion本身是一个模型，对于大多数想试试的人来说，使用这个web ui版本最合适建议先看完再动手，虽然不难但是有门槛（主要要解决网络问题），如果深入需要会python如果只是想试试的，建议直接下载别人打好的包，自己搭建确实很麻烦20...

人工智能 2024-01-08 人工智能

1556阅读

Stable Diffusion 文生图技术原理

图像生成模型简介图片生成领域来说，有四大主流生成模型：生成对抗模型（GAN）、变分自动编码器（VAE）、流模型（Flow based Model）、扩散模型（Diffusion Model）。从2022年开始，主要爆火的图片生成模型是Diffusi...

人工智能 2024-01-08 人工智能

1975阅读

学习实践-Whisper语音识别模型实战（部署+运行）

1、Whisper内容简单介绍 OpenAI的语音识别模型Whisper，Whisper 是一个自动语音识别（ASR，Automatic Speech Recognition）系统，OpenAI 通过从网络上收集了 68 万小时的多语言（98 种语言）...

生成式AI 2024-01-08 人工智能

1129阅读

13个优秀开源语音识别引擎

语音识别（ASR）在人机交互方面发挥着重要的作用，可用于：转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括：分析音频、音频分解、格式转换、文本匹配，但实际的语音识别系统可能会更复杂，并且可能包括其他步骤和功能组件...

人工智能 2024-01-08 人工智能

1278阅读

在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现

引言自然语言处理 (NLP 领域的进展日新月异，你方唱罢我登场。因此，在实际场景中，针对特定的任务，我们经常需要对不同的语言模型进行比较，以寻找最适合的模型。本文主要比较 3 个模型: RoBERTa、Mistral-7B 及 Llama-2...

人工智能 2024-01-08 人工智能

1123阅读

400万token上下文、推理再加速46%！最新开源方案升级MIT成果，推理成本再降低

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。 StreamingLLM可以在不牺牲生成效果、推理速度的前提下，实现多轮对话共400万个token，22.2倍推理速度提升。该项...

大数据 2024-01-08 人工智能

956阅读

使用LLaMA-Factory微调ChatGLM3

1、创建虚拟环境略 2、部署LLaMA-Factory （1）下载LLaMA-Factory https://github.com/hiyouga/LLaMA-Factory （2）安装依赖 pip3 install -r requi...

人工智能 2024-01-08 人工智能

1442阅读

大模型无限流式输入推理飙升46%！国产开源加速「全家桶」，打破多轮对话长度限制

在大型语言模型（LLM）的世界中，处理多轮对话一直是一个挑战。前不久麻省理工Guangxuan Xiao等人推出的StreamingLLM，能够在不牺牲推理速度和生成效果的前提下，可实现多轮对话总共400万个token的流式输入，22.2倍的推理速度提升...

人工智能 2024-01-08 人工智能

1145阅读

只需2分钟，单视图3D生成又快又好！北大等提出全新Repaint123方法

将一幅图像转换为3D的方法通常采用Score Distillation Sampling（SDS）的方法，尽管结果令人印象深刻，但仍然存在多个不足之处，包括多视角不一致、过度饱和、过度平滑的纹理，以及生成速度缓慢等问题。为了解决这些问题，北京大学、新加坡...

AIGC 2024-01-08 人工智能

877阅读

AI解读视频张口就来？这种「幻觉」难题Vista-LLaMA给解决了

近年来，大型语言模型如 GPT、GLM 和 LLaMA 等在自然语言处理领域取得了显著进展，基于深度学习技术能够理解和生成复杂的文本内容。然而，将这些能力扩展到视频内容理解领域则是一个全新的挑战 —— 视频不仅包含丰富多变的视觉信息，还涉及时间序列的动态...

AIGC 2024-01-08 人工智能

984阅读

AI视野：阿里开源AnyText；Pika推出付费计划；阿里推文生3D数字人项目；Magnific AI图片分辨率扩大至10K*10K

????大模型动态阿里开源AnyText 阿里开源多语言视觉文字生成与编辑模型——AnyText，AnyText对生成文字的把控可媲美专业PS，用户可自定义规划文字出现的位置，图片的强度、力度、种子数等，目前在Github超2，400颗星非常受欢迎。...

人工智能 2024-01-08 人工智能

986阅读

百度文心一言，是中国版的ChatGPT吗？

百度文心一言，是中国版的ChatGPT吗？文心一言发布会网友评论：百度在让人失望这件事上，从来没让人失望过！技术原理一句没有，商业价值滔滔不绝。 ChatGPT？CheatGPT！难怪暴跌，还没看两眼就困了，没话可以直播咬打火机，股...

AIGC 2024-01-08 人工智能

851阅读

强大人工智能编码助手code AI 自动分析代码结构并优化

code AI是一款强大的人工智能编码助手，旨在提供便捷高效的编码体验。它结合了先进的机器学习技术和丰富的编程知识，为开发人员提供了全面的编码支持和智能建议。通过深度学习算法，codeAI 能够自动分析代码结构，并识别出潜在的错误和优化机会。它能够快速定...

人工智能 2024-01-08 人工智能

913阅读

LLMs之RAG：LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用)的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embe

LLMs之RAG：LangChain-Chatchat(一款中文友好的全流程本地知识库问答应用的简介(支持 FastChat 接入的ChatGLM-2/LLaMA-2等多款主流LLMs+多款embedding模型m3e等+多种TextSplitter分词...

人工智能 2024-01-08 人工智能

1597阅读

告别逐一标注，一个提示实现批量图片分割，高效又准确

Segment Anything Model (SAM 的提出在图像分割领域引起了巨大的关注，其卓越的泛化性能引发了广泛的兴趣。然而，尽管如此，SAM 仍然面临一个无法回避的问题：为了使 SAM 能够准确地分割出目标物体的位置，每张图片都需要手动提供一...

生成式AI 2024-01-08 人工智能

894阅读

AI绘画 | stable diffusion简介和原理

Stable Diffusion中文的意思是稳定扩散，本质上是基于AI的图像扩散生成模型。 Stable Diffusion是一个引人注目的深度学习模型，它使用潜在扩散过程来生成图像，允许模型在生成图像时考虑到文本的描述。这个模型的出现引起了广泛的关注和讨...

AIGC 2024-01-08 人工智能

1681阅读

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用，如智能手机、物联网设备和嵌入式系统，这些边缘设备通常具有有限的计算能力和存储空间，它们无法有效地运行大型语...

AIGC 2024-01-08 人工智能

880阅读

GitHub Copilot 与 JetBrains AI Assistant 使用初步使用对比

GitHub Copilot 使用要在 JetBrains IDE 中使用 GitHub Copilot，必须安装 GitHub Copilot 扩展。以下过程将指导您在 IntelliJ IDEA 中安装 GitHub Copilot 插件。...

AIGC 2024-01-08 人工智能

1290阅读

如何在你的电脑上完成whisper的简单部署

如何在你的电脑上完成whisper的简单部署（超详细教程）前言一、显卡驱动、CUDA ToolKit、cuDNN的下载 1. 显卡驱动 2. CUDA ToolKit 3. cuDNN的安装二、windows下安装conda 三、使...

大数据 2024-01-08 人工智能

1676阅读

专为数据库打造：DB-GPT用私有化LLM技术定义数据库下一代交互方式

2023 年 6 月，蚂蚁集团发起了数据库领域的大模型框架 DB-GPT。DB-GPT 通过融合先进的大模型和数据库技术，能够系统化打造企业级智能知识库、自动生成商业智能（BI）报告分析系统（GBI），以及处理日常数据和报表生成等多元化应用场景。DB-G...

大数据 2024-01-08 人工智能

933阅读

英伟达推新AI语音识别模型Parakeet 号称优于Whisper

领先的开源对话 AI 工具包 NVIDIA NeMo宣布推出 Parakeet ASR 模型系列，这是一系列最先进的自动语音识别（ASR）模型，能够以出色的准确性转录英语口语。Parakeet ASR 模型与 Suno.ai 合作开发，是语音识别领域的一大...

人工智能 2024-01-08 人工智能

1021阅读

Stable-Diffusion和ControlNet插件安装全过程,以及使用心得汇总.

Stable-Diffusion的安装我采用的是YouTuBe视频的 <<How to Install & Use Stable Diffusion on Windows>> 需要魔法上网...

人工智能 2024-01-08 人工智能

984阅读

正式发布！ERNIE Bot SDK：轻松调用文心一言能力（含token福利）

ERNIE Bot SDK提供便捷易用的接口，可以调用文心一言的能力，包含文本创作、通用对话、语义向量、AI作图等，具体支持接入功能如下：对话补全（Chat Completion）函数调用（Function Calling）语...

人工智能 2024-01-08 人工智能

1097阅读

本地部署Stable Diffusion教程，亲测可以安装成功

系列文章目录 Stable Diffusion界面参数及模型使用谷歌Colab云端部署Stable Diffusion 进行绘图文章目录系列文章目录前言一、Stable Diffusion是什么？二、安装前的准备 1...

人工智能 2024-01-08 人工智能

1581阅读

文心一格: AIGC简介及文心一格简单使用

文章目录 @[toc] 一、AIGC 二、AI作画三、Prompt 四、文心一格 1.文心一格小程序 2.使用方法 3.使用小程序进行AI绘图六、未来发展小结其他一、AIGC AIGC（AI Generat...

AIGC 2024-01-08 人工智能

1453阅读

本地部署Stable Diffusion Webui AI 记录

Stable Diffusion Webui AI本地部署基本分为两种方式： 1、使用大佬的打包好的安装包一键部署 b站秋葉aaaki 2、手动部署（个人实践记录）参考文章本地部署基本要求 1、需要拥有NVIDIA显卡，GTX1060 （或...

人工智能 2024-01-08 人工智能

1946阅读

AI绘画中UNet用于预测噪声

介绍在AI绘画领域中，UNet是一种常见的神经网络架构，广泛用于图像相关的任务，尤其是在图像分割领域中表现突出。UNet最初是为了解决医学图像分割问题而设计的，但其应用已经扩展到了多种图像处理任务。特点对称结构：UNet的结构呈现为“U...

人工智能 2024-01-08 人工智能

976阅读

Mac本地部署Stable Diffusion，超详细，含踩坑点（AI 绘画保姆级教程）

一、引言相继在两个云平台 Kaggle 和 AutoDL 上部署了 Stable Diffusion 后，这周决定再在 Mac 本地部署一下 Stable Diffusion！其实看 Stable Diffusion WebUI 的 Githu...

人工智能 2024-01-08 人工智能

2024阅读

解决新版Edge浏览器右上角不显示Copilot图标的问题

概述本文主要介绍一种在Windows平台上，通过删除或替换配置文件来解决新版Edge浏览器右上角不显示Copilot图标的方法，该方法适用于Edge的正式版和Dev版。另外，文章最后还补充了一种通过下载旧版Edge浏览器解决这个问题的方法，以备将...

人工智能 2024-01-08 人工智能

2098阅读

争议不断的AI绘画，靠啥成为了顶流？

今年以来，AIGC迅速崛起。所谓AIGC，即AI-Generated Content，指的是利用人工智能来生成内容，被认为是继专业产出内容（PGC）、用户产出内容（UGC）后的新型内容创作方式。不久前掀起热议的“AI绘画”就是AIGC的一个典例。在...

AIGC 2024-01-08 人工智能

946阅读

Meta最新模型LLaMA详解（含部署+论文）

来源：投稿作者：毛华庆编辑：学姐前言本课程来自深度之眼《大模型——前沿论文带读训练营》公开课，部分截图来自课程视频。文章标题：LLaMA: Open and Efficient Foundation Language Mode...

大数据 2024-01-08 人工智能

1029阅读

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度，与此同时，Faster-Whisper也...

人工智能 2024-01-08 人工智能

929阅读

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value ‘native‘ is not defined for option ‘gpu-architecture‘

【AI实战】llama.cpp量化cuBLAS编译；nvcc fatal:Value 'native' is not defined for option 'gpu-architecture' llama.cpp量化介绍 llama.cpp 编...

人工智能 2024-01-08 人工智能

1088阅读

本地部署语音转文字（whisper，SpeechRecognition）

本地部署语音转文字 1.whisper 1.首先安装Chocolatey 2.安装 3.使用 2.SpeechRecognition 1.环境 2.中文包 3.格式转化 4.运行 3.效果 1.whisper 1.首先安...

大数据 2024-01-08 人工智能

1232阅读

【stable diffusion LORA训练】改进lora-scripts，命令行方式训练LORA，支持SDXL训练

分享下自己改进的一个lora训练脚本，在ubuntu下如果SD-WEBUI的环境已经搭好的话，只需要下载lora-script就可以支持训练了，直接命令行方式训练。首先，我们需要克隆下项目： git clone https://github.com/...

生成式AI 2024-01-08 人工智能

2399阅读

【AI工具】-Stable Diffusion本地化部署教程

前言今天我们要介绍的是时下最流行的AI绘图软件Stable Diffusion，虽然Diffusion.ai已经开放api，但是长时间的商业化调用我们需要购买很多的金币。所以我们需要找一个平替的AI绘图平台，现在主流市场中AI绘图软件主要就是Open...

人工智能 2024-01-08 人工智能

1261阅读

github Copilot的基本使用

一.GitHub Copilot的基本介绍 GitHub Copilot 是由 GitHub 和 OpenAI 合作推出的一款代码自动补全工具，它基GPT（Generative Pre-trained Transformer）技术，可以为程序员提供实时...

大数据 2024-01-08 人工智能

1328阅读