git 第8页 - AIGC资讯

混合专家模型（MoE）入门

模型规模是提升LLM大语言模型性能的关键因素，但也会增加计算成本。Mixture of Experts (MoE 架构通过分布式专家层和动态门控机制，有效降低了计算资源，使模型能够在扩展参数规模的同时保持高效的运行。 Mixtral of Exper...

生成式AI 2024-09-06 人工智能

1143阅读

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork

探索高效能的CPU版语言模型 —— 深入解读LLaMa CPU Fork llama-cpu项目地址:https://gitcode.com/gh_mirrors/ll/llama-cpu 在人工智能的广阔领域中，语言模型的进步一直是推动技术前沿的...

生成式AI 2024-09-06 人工智能

989阅读

OpenVINO版Stable Diffusion教程

OpenVINO版Stable Diffusion教程 stable_diffusion.openvino项目地址:https://gitcode.com/gh_mirrors/st/stable_diffusion.openvino 项目介绍...

大数据 2024-09-06 人工智能

1154阅读

Datawhale AI夏令营第四期 AIGC文生图方向 Task3学习笔记

经过前两个task的学习，对于文生图的基本原理，技术支持，模型微调，工作流程等有了一定的了解，尤其是在prompt工程上面，提示词的质量决定着生成图像的流畅性和观赏性，AI大模型在这一方面为学习者们提供了非常大的帮助，通过大模型生成和优化提示词，能实现学习...

AIGC 2024-09-06 人工智能

1130阅读

Prompt-hunter：一键保存Midjourney细节页面至Notion的高效工具

Prompt-hunter：一键保存Midjourney细节页面至Notion的高效工具 Prompt-hunterSave the Prompt and images from the Midjourney details page to your...

大数据 2024-09-05 人工智能

1133阅读

stable Diffusion 网页用户界面 github

稳定的 Diffusion 网页用户界面使用 Gradio 库实现的稳定扩散的 Web 界面。特征带有图片的详细功能展示：原始的 txt2img 和 img2img 模式一键安装并运行脚本（但您仍然必须安装 pyth...

人工智能 2024-09-05 人工智能

1140阅读

HID-Joy-Con-Whispering 项目使用教程

HID-Joy-Con-Whispering 项目使用教程 HID-Joy-Con-WhisperingTalk to Joy-Con from a PC because it's cool项目地址:https://gitcode.com/gh_mir...

人工智能 2024-09-05 人工智能

1045阅读

Lag-Llama：时间序列预测的开源基础模型中文安装与使用指南

Lag-Llama：时间序列预测的开源基础模型中文安装与使用指南 lag-llamaLag-Llama: Towards Foundation Models for Probabilistic Time Series Forecasting项目地址:h...

AIGC 2024-09-05 人工智能

1173阅读

AI绘画：从零开始教你玩转ComfyUI-保姆级部署教程-手把手带你ComfyUI工作流搭建！

前言第一节：认识ComfyUI并安装本教程专为初学者设计，详细介绍了 2024 年最新版的SD ComfyUI的使用方法。通过逐步指导，让你无需任何基础，快速学会并使用这一强大的AI绘图工具。 1、什么是comfyui ComfyUI就像...

大数据 2024-09-05 人工智能

3959阅读

深度剖析Google黑科技RB-Modulation：告别繁琐训练，拥抱无限创意生成和风格迁移！

给定单个参考图像，RB-Modulation提供了一个无需训练的即插即用解决方案，用于(a 风格化和(b 具有各种提示的内容样式组合，同时保持样本多样性和提示对齐。例如，给定参考样式图像(例如“熔化的黄金3d渲染样式” 和内容图像(例如(a “狗” ，RB...

人工智能 2024-09-05 人工智能

942阅读

AI日报：Claude企业版上线；支付宝外滩大会将推支小宝等3款AI产品；Soul语音大模型惊艳到我了

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/ 1、Anthropic发布企业版A...

生成式AI 2024-09-05 人工智能

1205阅读

ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型

OOTDiffusion 论文 OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on https://arxiv.org/pdf/...

大数据 2024-09-05 人工智能

1185阅读

超级Prompt：几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

起猛了?不过两三天的时间，仅有两个 Markdown 文件的 GitHub 项目为何竟能收获2k star? 仔细一看，其中一个 Markdown 文件是一个流程图，另一个 Readme 文件的主要内容则是一大篇大模型提示词（prompt。而如果你细读这...

大数据 2024-09-05 人工智能

947阅读

小白的DatawhaleAI夏令营AIGC文生图探索日记·可图Kolors-LoRA风格故事挑战赛应用

比赛?：可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制报名赛事(点击即可跳转（一定要进行报名，后面环境中的数据和授权等会用到）赛事链接：https://tianchi.aliyun.com/competit...

AIGC 2024-09-05 人工智能

1054阅读

使用PyTorch从零构建Llama 3

我们上次发了用PyTorch从零开始编写DeepSeek-V2的文章后，有小伙伴留言说希望介绍一下Llama 3。那么今天他就来了，本文将详细指导如何从零开始构建完整的Llama 3模型架构，并在自定义数据集上执行训练和推理。 [图1]：Llama...

人工智能 2024-09-05 人工智能

937阅读

WhisperX: 带时间戳的自动语音识别及说话人分离

WhisperX: 带时间戳的自动语音识别及说话人分离 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API，...

大数据 2024-09-05 人工智能

2037阅读

使用OpenAI Whisper的说话人识别管道

使用OpenAI Whisper的说话人识别管道 whisper-diarizationAutomatic Speech Recognition with Speaker Diarization based on OpenAI Whisper项目地址:...

AIGC 2024-09-05 人工智能

1362阅读

Datawhale X 魔搭 AI夏令营第四期魔搭-AIGC方向 -task-02

一、AI生图的发展历程随着人工智能（AI）技术的不断演进，特别是AIGC（AI-Generated Content，人工智能生成内容）的兴起，AI生图技术——即利用AI算法自动生成图像的技术，已经从一个遥远的梦想转变为现实应用中不可或缺...

大数据 2024-09-04 人工智能

1077阅读

Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程

Stable-Diffusion-WebUI-Collab 在 Google Colab 上的使用教程 stable-diffusion-webui-colabstable diffusion webui colab项目地址:https://gitco...

生成式AI 2024-09-04 人工智能

1341阅读

Distil-Whisper 开源项目教程

Distil-Whisper 开源项目教程 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1% wor...

AIGC 2024-09-04 人工智能

1117阅读

LongLLaMA：扩展上下文处理能力的大型语言模型

LongLLaMA：扩展上下文处理能力的大型语言模型 long_llamaLongLLaMA is a large language model capable of handling long contexts. It is based on Ope...

人工智能 2024-09-04 人工智能

1052阅读

全网最全，保姆级Stable Diffusion系列入门使用教程（图生图、LoRA、提示词权重），建议收藏！

大家好，我是画画的小强今天将给大家讲解 Stable Diffusion 入门使用教程的图生图、LoRA和提示词权重的教程，如果你还没有使用或者安装SD，那么可以看看我的往期入门教程AI绘画『Stable Diffusion』面向小白的免费AI绘画工...

人工智能 2024-09-04 人工智能

1939阅读

如何在家用设备上运行 Llama 3.1 405B？搭建 AI 集群

在开放式 LLM 模型和封闭式 LLM 模型之间的竞争中，开放式模型的最大优势是您可以在本地运行它们。除了电力和硬件成本外，您无需依赖外部提供商或支付任何额外费用。但是，随着模型大小的增加，这种优势开始减弱。运行需要大量内存的大型模型并不容易。幸运的是，张...

AIGC 2024-09-04 人工智能

1079阅读

DataWhale夏令营第四期魔搭- AIGC方向 task02笔记#Datawhale AI夏令营

Task2：精读代码，实战进阶聊聊相关：虽然现在很多的AI绘图都能被大家说“一眼鉴AI”，但随着技术日新月异的变化，我们也需要掌握辨识和判别他的能力。 Deepfake是一种使用人工智能技术生成的伪造媒体，特别是视频和音频，它们看起来或听起来非常真实...

人工智能 2024-09-04 人工智能

909阅读

震撼发布！阿里通义FunAudioLLM：重塑自然语音交互新纪元，开源引领语音处理革命！

近年来，人工智能的进步如 GPT-4o 和 Gemini-1.5极大地改变了人与机器的互动方式，2023这种转变在语音处理领域尤为明显。阿里巴巴通义实验室近日发布并开源了 FunAudioLLM，这是一个旨在增强人与大型语言模型（LLMs）之间...

人工智能 2024-09-04 人工智能

1181阅读

重磅！Stable Diffusion创始团队推出FLUX.1：一夜颠覆MJ v6，DALL·E 3，SD3！

前言 Stable Diffusion 大家已经很熟悉了，是由 CompVis 团队开发的，这是一个隶属于德国慕尼黑大学的计算机视觉研究小组。该团队由多个研究人员和开发者组成，包括 Patrick Esser、Robin Rombach 和 Bjö...

人工智能 2024-09-04 人工智能

1266阅读

推荐项目：Hugo Whisper 文档主题

推荐项目：Hugo Whisper 文档主题 hugo-whisper-themeWhisper is a minimal documentation theme for Hugo.项目地址:https://gitcode.com/gh_mirrors...

生成式AI 2024-09-04 人工智能

976阅读

CVPR`24 | 又快又好！渲染速度比ENeRF快30倍！4K4D:实时4K分辨率4D视图合成

文章链接：https://arxiv.org/pdf/2310.11448 git链接： https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近，一些动态视图合成方法在渲染质量方面...

生成式AI 2024-09-04 人工智能

1029阅读

基于大模型的原神对话系统尝试

一.简介该项目为一次大模型+游戏的尝试，成功实现了一个与原神内角色的对话系统。演示视频：https://www.bilibili.com/video/BV1b48CeuELL github地址：https://github.com/goodlu...

生成式AI 2024-09-04 人工智能

1762阅读

Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南

Stable-Diffusion-WebUI-Prompt_Generator 使用与安装指南 stable-diffusion-webui-Prompt_Generator项目地址:https://gitcode.com/gh_mirrors/st/...

AIGC 2024-09-04 人工智能

1344阅读

WebLlama 项目使用教程

WebLlama 项目使用教程 webllamaLlama-3 agents that can browse the web by following instructions and talking to you项目地址:https://gitcod...

生成式AI 2024-09-04 人工智能

873阅读

【AI绘画】ComfyUI 入门教程：安装 ComfyUI，AIGC新手入门教程

大家好，我是写编程的木木。 ComfyUI 是 Stable Diffusion 的一个基于节点组装绘图流程的图形用户界面（GUI）。通过将不同的节点连接在一起，你可以在 ComfyUI 中构建图像生成工作流。一个完整的工作流看起来像下面这样： C...

AIGC 2024-09-04 人工智能

1429阅读

Mac 部署Stable Diffusion WebUI和ControlNet的保姆级教程（附安装包）

Stable Diffusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述生成详细图像，它也可以应用于其他任务，如内补绘制、外补绘制，以及在提示词（英语）指导下产生图生图的翻译。详细介绍看维基百科词条Stable Diffusi...

AIGC 2024-09-04 人工智能

1403阅读

探索未来游戏开发新纪元: 使用Godot Copilot加速您的创作之旅

探索未来游戏开发新纪元: 使用Godot Copilot加速您的创作之旅 godot-copilotAI-assisted development for the Godot engine.项目地址:https://gitcode.com/gh_mir...

生成式AI 2024-09-03 人工智能

2212阅读

探秘Whispers：守护代码安全的静态分析工具

探秘Whispers：守护代码安全的静态分析工具 whispersIdentify hardcoded secrets in static structured text项目地址:https://gitcode.com/gh_mirrors/wh/wh...

大数据 2024-09-03 人工智能

990阅读

探索时空，让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI

探索时空，让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI sd-webui-deoldifyDeOldify for Stable Diffusion WebUI：This is an extension...

人工智能 2024-09-03 人工智能

1160阅读

MIT新研究揭秘「AI洗脑术」！AI聊天诱导人类「编造」记忆，真假难辨

【新智元导读】MIT研究发现:在AI的操纵下，人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导，形成「现场有枪」的错误记忆。有趣的是，AI的阿谀奉承，会产生「回音室效应」，让偏见更加强化。 GenAI的影响，已经不仅仅是搜索引擎、聊天机器人这么简...

AIGC 2024-09-03 人工智能

963阅读

【无矶之谈】编码能力堪比Copilot、Cursor、GPT-国内可用的智能AI编程

前言简述 Copilot Copilot 是一款由 OpenAI 推出的人工智能代码自动补全AI工具早在2022年4月，我便写了一篇Github Copilot的申请及在Pycharm的配置和使用，那个时候我便在用AI进行编程，当时虽然用的不是...

生成式AI 2024-09-03 人工智能

1688阅读

推荐开源项目：稳定扩散模型工具包（stable-diffusion-model-toolkit）

推荐开源项目：稳定扩散模型工具包（stable-diffusion-model-toolkit） stable-diffusion-webui-model-toolkit项目地址:https://gitcode.com/gh_mirrors/st/st...

生成式AI 2024-09-03 人工智能

1112阅读

主流AI绘画工具-StableDiffusion本地部署方法（mac电脑版本）

Stable Diffusion是一款强大的AI生成图像模型，它可以基于文本描述生成高质量的图像。对于想要在本地运行此模型的用户来说，使用Mac电脑部署Stable Diffusion是一个非常吸引人的选择，特别是对于M1或M2芯片的用户。本文将详细介绍如...

生成式AI 2024-09-03 人工智能

1391阅读

WhisperX：革命性的自动语音识别工具

WhisperX：革命性的自动语音识别工具 whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API，支持多种语音...

人工智能 2024-09-03 人工智能

1768阅读

【技术前沿】Flux.1部署教程入门--Stable Diffusion团队最前沿、免费的开源AI图像生成器

项目简介 FLUX.1 是一种新的开源图像生成模型。它由 Stable Diffusion 背后的团队 Black Forest Labs 开发。官网中有以下功能开源供大家参考： FLUX.1 擅长在图像中准确再现文字，因此非常适合需要清晰文字或...

生成式AI 2024-09-03 人工智能

1920阅读

RAG 入门指南：从零开始构建一个 RAG 系统

本文正文字数约 3300 字，阅读时间 10 分钟。从零开始构建一个应用可以让我们快速理解应用的各个部分。这个方法其实非常适用于 RAG。我在以前的文章中有介绍过 RAG 的概念、原理以及应用等，但其实，亲自动手来构建一个 RAG 系统或许能够...

大数据 2024-09-03 人工智能

1283阅读

GitHub Copilot 支持 IntelliJ IDEA啦，插件装起来！(1)

《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》，点击传送门，即可获取！别以为TJ君说的是天方夜谭，就在前不久的 GitHub Universe 2021开发者大会上，GitHub官方正式宣布了一款名为 Copilot工具的...

大数据 2024-09-03 人工智能

1160阅读

BMAB：Stable Diffusion WebUI的创意增强工具

BMAB：Stable Diffusion WebUI的创意增强工具 sd-webui-bmabAuto masking and inpainting for person, face, hand. Resizing image using detec...

生成式AI 2024-09-03 人工智能

1384阅读

【知识星球】大模型与AIGC+从零学AI+项目与人才招聘共3大知识星球成立，共建有三AI星球社区生态...

大家好，今年我们生态的重点将再次聚焦于知识星球社区，为了尽可能满足各层次学习者学习人工智能的需求，也为了满足非学习者对于项目研发和人才招聘的需求，我们将其分为3大星球社区。有三AI（大模型与AIGC）+ 有三AI（零基础学人工智能）+ 有三...

人工智能 2024-09-02 人工智能

1977阅读

Stable Diffusion 常用模型下载与说明（保姆级）

那么，接下来我们就要学习怎么使用Stable Diffusion 中最重要的各类模型了。因为，相比于Midjourney，Stable Diffusion最大的优势就是开源。相比于Midjourney靠开发人员开发的少数模型，SD则每时每刻都有人在世界...

人工智能 2024-09-02 人工智能

3854阅读

AI助力浮雕创作!万物皆可浮雕?Stable Diffusion AI绘画【浮雕艺术】之文生浮雕！

前言对于浮雕艺术，其实并不了解。但有幸能和“细辛”前辈结识，对浮雕有了简单的了解，浮雕图案的传统方式是先由画师画出图，然后由雕刻师雕刻。画师画图归为浮雕的设计阶段，画师会绘制出浮雕的设计图，‌这为后续的雕刻工作提供了基础和指导。‌设计图可以展现出...

AIGC 2024-09-02 人工智能

1671阅读

探索LLaMA Factory：一站式大模型微调平台

探索LLaMA Factory：一站式大模型微调平台 LLaMA-Factory易于使用的LLM微调框架（LLaMA, BLOOM, Mistral, 百川， Qwen, ChatGLM）。项目地址:https://gitcode.com/gh_mir...

生成式AI 2024-09-02 人工智能

1754阅读

Distil-Whisper：高效快速的语音识别模型

Distil-Whisper：高效快速的语音识别模型 distil-whisperDistilled variant of Whisper for speech recognition. 6x faster, 50% smaller, within 1...

大数据 2024-09-02 人工智能

990阅读