-
LLaMa系列模型详解(原理介绍、代码解读):LLaMa_llama模型
LLaMA详解 LLaMA(Large Language Model Meta AI)是由Meta(前身为Facebook)开发的一种大规模语言模型,旨在提高自然语言处理(NLP)任务的性能。LLaMA基于变换器(Transformer)架构,并经过大...
-
AIGC浅记,什么是GAN模型,它有什么优点和缺点,以及在人脸生成领域有哪些应用
提示:以下是本篇文章正文内容,下面案例可供参考 一、GAN模型是什么? GAN模型,即生成对抗网络(Generative Adversarial Networks),是一种深度学习模型,通过生成器和判别器之间的对抗训练来学习生成数据的分布。GAN模型...
-
BitNet B1.58——模型参数用三个值表示,精度优于 Llama
介绍 论文地址:https://github.com/microsoft/bitblas 源码地址:https://github.com/microsoft/bitblas 与大型语言模型(LLMs)相比,小型语言模型(SLMs)正逐渐成为人们关注的焦...
-
【全网最全】AIGC产品经理面试高频100题答案解析
【全网最全】AIGC产品经理面试高频100题答案解析 说明: 1)目前干货文档总字数9.57万,不管是模型基本功还是每个问题的答案都尽可能详尽; 2)重点给大家深度讲解了机器学习、深度学习、AIGC三个大方向的13个经典模型 3)每个模型从实现...
-
苹果史上第一台AI手机诞生,iPhone 16屠版热搜!中文版明年登场,3nm芯片封神
【新智元导读】刚刚结束的科技春晚上,iPhone16系列惊艳亮相。全新的AI功能,把私人体验拉满到极致。专门打造的A18和A18Pro芯片,将在新机中首发搭载。 就在刚刚,苹果真正意义上第一款原生AI手机,终于在千呼万唤中亮相了。 以全新的Apple In...
-
24年保姆级教程!关于Stable diffusion的各种模型,看这篇就可以了!
前言 在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多种模型后缀,模型之间也有很多种类型,如果是新手小白的话,在这一步就很容易被搞晕。而在本期文章,技术巫帮你系统梳理了SD的模型,相信不管是对于小白还是老手,都会有一定帮助! 一、从模型后...
-
书单 | 大模型的书那么多,如何快速选到适合自己的那一本?来,教你!
大模型的书这么多,该怎么选呢? 本期书单就来教大家怎么快速地从众多大模型书中选到你想要的那一本! 大模型基础 大模型入门不可错过的一本书,就是这本大模型界的经典畅销书**《大规模语言模型》**!系统性强,内容适合初学者,如果你想知道如何构建一个大模型...
-
一文彻底搞懂 Fine-tuning - 超参数(Hyperparameter)
最近这一两周看到不少互联网公司都已经开始秋招提前批了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。 最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。 《...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 task01笔记
赛题内容 参赛者需在可图Kolors 模型的基础上训练LoRA 模型,生成无限风格,如水墨画风格、水彩风格、赛博朋克风格、日漫风格...... 基于LoRA模型生成 8 张图片组成连贯故事,故事内容可自定义;基于8图故事,评估LoRA风格的美感度...
-
从【人工智能】到【计算机视觉】,【深度学习】引领的未来科技创新与变革
前几天偶然发现了一个超棒的人工智能学习网站,内容通俗易懂,讲解风趣幽默,简直让人欲罢不能。忍不住分享给大家,点击这里立刻跳转,开启你的AI学习之旅吧! 前言 – 人工智能教程https://www.captainbed.cn/lzx 1. 引言...
-
一文搞懂AIGC
目录 AIGC的核心技术 AIGC的主要应用 AIGC的未来趋势与挑战 ?边走、边悟?迟早会好 AIGC(AI-Generated Content,人工智能生成内容)是指利用人工智能技术自动生成各种类型的内容,包括文本、图像、音频、视频等...
-
混合专家模型(MoE)入门
模型规模是提升LLM大语言模型性能的关键因素,但也会增加计算成本。Mixture of Experts (MoE 架构通过分布式专家层和动态门控机制,有效降低了计算资源,使模型能够在扩展参数规模的同时保持高效的运行。 Mixtral of Exper...
-
deepmotion(动作捕捉与动画生成)
Deep Motion 是一种高级技术,主要用于捕捉和处理复杂的运动数据,特别是在计算机动画、虚拟现实、增强现实和游戏开发领域。通过深度学习和计算机视觉技术,Deep Motion 提供了精确的运动捕捉和逼真的动画生成功能。 精准的运动捕捉:无需昂贵...
-
stable Diffusion 网页用户界面 github
稳定的 Diffusion 网页用户界面 使用 Gradio 库实现的稳定扩散的 Web 界面。 特征 带有图片的详细功能展示: 原始的 txt2img 和 img2img 模式 一键安装并运行脚本(但您仍然必须安装 pyth...
-
如何在复杂对话中准确识别每位说话人的声音?OpenAI Whisper系统带来新突破,尽管在面对重叠声音时仍需进一步优化。
在复杂对话中准确识别每位说话人的声音是一个挑战,尤其是在面对重叠声音的情况下。OpenAI的Whisper系统虽然在自动语音识别(ASR)方面取得了显著进展,但在处理重叠声音时仍需进一步优化。 Whisper系统通过利用大规模预训练模型和弱监督学习来提取...
-
Datawhale X 魔搭 AI夏令营第四期 魔搭-AIGC方向 -task-02
一、AI生图的发展历程 随着人工智能(AI)技术的不断演进,特别是AIGC(AI-Generated Content,人工智能生成内容)的兴起,AI生图技术——即利用AI算法自动生成图像的技术,已经从一个遥远的梦想转变为现实应用中不可或缺...
-
深入解读Midjourney的起源和发展历程
深入解读Midjourney的起源和发展历程 1.背景介绍 1.1 人工智能时代的到来 随着计算机技术和算力的不断提升,人工智能(AI 技术正在迅速发展,并逐渐渗透到我们生活的方方面面。在这个新兴的AI时代,各种创新应用层出不穷,其中一个备受瞩目的领...
-
CVPR`24 | 又快又好!渲染速度比ENeRF快30倍!4K4D:实时4K分辨率4D视图合成
文章链接:https://arxiv.org/pdf/2310.11448 git链接: https://zju3dv.github.io/4k4d/ 本文旨在实现动态3D场景在4K分辨率下的高保真和实时视图合成。最近,一些动态视图合成方法在渲染质量方面...
-
普通人如何零基础进入AIGC大模型人形机器人赛道,自学攻略,应用转化项目案例
要进入人形机器人赛道,普通人需要了解和掌握一系列的技能和知识,包括机器人设计、编程、电子工程、机械工程以及团队合作和项目管理。以下是一个详细的指南,帮助你从零基础开始,逐步进入这个充满挑战和机遇的领域。 基础教育和技能培养 进入人形机器人领域,基础...
-
2500字长文|设计师视角解释AI绘画底层原理
hello,大家好,我是想象。 今天给大家带来的分享是如何通过设计师视角,用设计师语言帮助大家快速理解AI绘画的底层逻辑。 作为一名设计师,我也在很长一段时间不清楚AI绘画到底是怎么出图的,如果没有了解本质,只是了解大概,不理解里面各个参数后面的原理,...
-
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI
探索时空,让旧照片重焕新生 —— DeOldify for Stable Diffusion WebUI sd-webui-deoldifyDeOldify for Stable Diffusion WebUI:This is an extension...
-
8G显存运行Llama 3.1 405B!
我正在接受挑战,在只有 8GB VRAM 的 GPU 上运行 Llama 3.1 405B 模型。 Llama 405B 模型有 820GB!这是 8GB VRAM 容量的 103 倍! 显然,8GB VRAM 无法容纳它。那么我们如何让它工作呢?...
-
Stable Diffusion的微调方法原理总结
目录 1、Textural Inversion(简易) 2、DreamBooth(完整) 3、LoRA(灵巧) 4、ControlNet(彻底) 5、其他 1、Textural Inversion(简易) 不改变网络结构...
-
ViT篇外:NVIDIA Llama-3.1-Minitron 4B
相关阅读: ViT:3 Compact Architecture MobileLLM:“苗条”的模型比较好! 大家也许会很好奇为什么在ViT章节插入了NVIDIA Llama-3.1-Minitron 4B,ViT因为应用场景的特殊性所以都寄...
-
让我们认真讨论一下“AI霸权”时代人类的命运
相信本怪盗团的读者大部分接受过高等教育,其中不乏名校毕业生。我们不妨回忆一下,自己的学生时代,最盼望从事什么职业?毕业后实际从事的又是什么职业?答案一定很多,但是万变不离其宗,其中大部分应该属于所谓“专业白领岗位”。 十多年前我读书的时候,互联网行业尚不流...
-
砍掉激光雷达、小鹏P7 首搭:小鹏发布AI鹰眼视觉智驾方案
快科技8月27日消息,在今晚举行的发布会上,小鹏汽车发布了全新的纯视觉智驾方案AI鹰眼。 据称,AI鹰眼视觉方案比人眼更清晰,采用全球首发的Lofic架构,摄像头精度、可视距离升级,色彩分辨能力更加强,在弱光、逆光、大光差等环境看得都清晰,在黑夜,雨雾天,...
-
Datawhale X 魔搭 AI0夏令营 魔搭-AIGC文生图方向 Tsak 2 震惊!!!AI小白竟然用AI生成这种图片......
本文为AI方向小白记录暑期参加魔搭夏令营-AIGC文生图方向的Task 01 报名赛事链接:可图Kolors-LoRA风格故事挑战赛_创新应用大赛_天池大赛-阿里云天池的赛制 欢迎所有小白,大神前来交流学习。 一.问题的提...
-
精读代码,实战进阶-Datawhale X魔搭AI夏令营 AIGC方向Task02学习笔记
基础知识 AIGC是未来人工智能的重点方向 AIGC高速发展的同时,也被一些心怀不轨之人当作牟利里的技术,如Deepfake技术。 AI生图最早的工具是机械臂输出作画,现代的AI生图模型大多基于深度神经网络基础上训练。 *一般来说,AI生图模型属于多模...
-
关于Stable diffusion的各种模型,看这篇就可以了!
前言 这篇文章主要是帮大家梳理下Stable diffusion里面的各种模型,模型在Stable diffusion中占据着至关重要的地位,不仅决定了出图的风格,也决定了出图质量的好坏。 但在第一次接触SD的时候,我就被里面的模型搞到头大,不仅有多...
-
【扩散模型】DDPM论文理解
DDPM(Denoising Diffusion Probabilistic Models) 更详细解读可以参考(这几个视频看完基本对DDPM的原理就能够把握了) 李宏毅大白话AIb站公式推导1b站公式推导2 基本过程...
-
「深度探索:AIGC——从文本到视觉的奇迹之旅」
文章目录 1. 探讨AIGC技术的发展现状和未来趋势 1.1 引言 1.1.1 定义AIGC 1.1.2 重要性与应用领域 1.1.3 文章目的 2. AIGC技术的发展历程 2.1 起源与早期阶段 2.2 技术突破 2.2.1 深...
-
【三维重建】Pixel-GS:三维高斯泼溅的像素感知的梯度密度控制(去除浮点,提升精度)
项目:https://pixelgs.github.io/标题:Pixel-GS: Density Control with Pixel-aware Gradient for 3D Gaussian Splatting来源:香港大学;腾讯AI Lab...
-
一文看懂llama2(原理&模型&训练)
Llama2(大型语言模型2) Llama2(大型语言模型2)主要基于近年来火爆的Transformer架构。下面是Llama2的几个核心原理: Transformer 架构: Llama2采用了Transformer网络,它通过自注意力机制来处理...
-
AIGC:开启智能创作新时代
一、AIGC 的兴起与发展 AIGC 的兴起与发展 AIGC 的兴起是多种因素共同作用的结果。从技术层面看,深度学习算法的不断优化,如 Transformer 架构的出现,使得模型能够处理更复杂的数据和任务,为 AIGC 的发展提供了强大的技术支撑。预...
-
大白话讲透AI画图:Stable Diffusion
Stable Diffusion 是一种从文本生成 AI 图像的潜空间扩散模型,它不是在高维图像空间中操作,而是首先将图像压缩到潜在空间(latent space)中。 我们将深入了解它的工作机制。知道工作机制有什么用?除了其本身就是个非常值得了解的内容...
-
对标GPT 4o!科大讯飞星火极速超拟人交互来了:情绪价值拉满
快科技8月19日消息,据科大讯飞”官微发文,全新的星火极速超拟人交互正式发布,计划8月30日上线讯飞星火APP,全民开放体验。 据介绍,星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破,对标GPT 4o。 此次星...
-
ComfyUI系列教程(1)--Stable Diffusion基本原理
1.Stable Diffusion文生图基本原理 1.1Stable Diffusion原理介绍 文生图主要基于Stable Diffusion大模型进行。SD的基本结构图如下图所示,主要包括3个部分。其中1是CLIP图像文本对,将图...
-
AIGC 全面介绍
随着人工智能技术的不断进步,生成式人工智能(AI Generated Content, AIGC)成为了一个日益热门的话题。AIGC 指利用人工智能技术生成各类内容,包括文本、图像、音频、视频等。与传统的内容生成方法相比,AIGC 具有速度快、成本低、可定...
-
Fish Speech: 开源文本转语音技术(TTS)的新里程碑
简介 Fish Speech 是一个全新的文本转语音(TTS 解决方案,该项目由fishaudio开发。当前模型使用约十五万小时三语数据训练,对中文支持非常的完美。 能够熟练处理和生成中文、日语和英语的语音,语言处理能力接近人类水平,并且声音表现形式丰...
-
基于飞桨框架的稀疏计算使用指南
本文作者-是 Yu 欸,华科在读博士生,定期记录并分享所学知识,博客关注者5w+。本文将详细介绍如何在 PaddlePaddle 中利用稀疏计算应用稀疏 ResNet,涵盖稀疏数据格式的础知识、如何创建和操作稀疏张量,以及如何开发和训练稀疏神经网络模型。...
-
AI绘画:艺术与科技融合的新篇章
随着人工智能(AI)技术的飞速发展,AI绘画作为一种新兴的艺术形式,正逐步改变着传统艺术创作的格局。从早期的简单模仿到如今的个性化创作,AI绘画不仅提升了艺术创作的效率和质量,还开辟了全新的应用场景和商业模式。本文将深入探讨AI绘画的发展历程和现状、技术...
-
Whisper JAX 深度使用指南
Whisper JAX 深度使用指南 whisper-jaxJAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.项目地址:https://gitcode....
-
学习AIGC的推荐书单:基本概念、技术原理、应用场景、行业影响等
学习AIGC(AI Generated Content,人工智能生成内容)的推荐书单可以涵盖多个方面,包括AIGC的基本概念、技术原理、应用场景、行业影响以及未来趋势等。 晓北斗推荐-图书《生命3.0》 以下是一份精心挑选的书...
-
LLM(大语言模型)和AIGC入门学习路线图
01 — 学习路线图 基础了解 目标: 理解人工智能、机器学习、深度学习的基本概念。 资源: 在线课程(如Coursera, edX上的入门课程)、博客文章、YouTube视频。 专业知识 目标: 深入了解大型语言模型(如GPT-...
-
「AIGC」大语言模型系列-Transformer详解
Transformer模型相对复杂,下面我将提供一个简化版的Transformer模型的Python代码示例,使用PyTorch库实现。这个示例将包括模型的基本结构,如编码器和解码器,自注意力机制,位置编码,以及前馈网络。 请注意,这个示例主要用于教...
-
AI写作软件:解密神秘黑匣子,创意与智能的碰撞
在信息化高速发展的今日,AI(人工智能)技术应用普及已致众人广知,而AI写作软件则为其中深受瞩目的产品之一。此类软件运用先进AI技术来创作文本,力求模仿人类的写作风格及逻辑思维,从而助使用者快速高效地定稿各类文章。本文旨在对该技术作深度剖析,包括解构其定义...
-
【人工智能AIGC技术开发】3.浅谈大话人工智能AIGC:几种AIGC底层技术的代码详解
为了更好地理解AIGC(AI Generated Content,人工智能生成内容)的底层技术,我们将详细介绍几种关键技术。这些技术包括深度学习、生成对抗网络(GANs)、变分自编码器(VAEs)和自回归模型(如Transformer和GPT)。 1....
-
AI写作革命:PyTorch如何助力人工智能走向深度创新
身为专注于人工智能研究的学者,我十分热衷于分析"AI写稿"与"PyTorch"这两项领先技术。面对日益精进的人工智能科技,"AI写作"已不再是天方夜谭;而"PyTorch"如璀璨明珠般耀眼,作为深度学习领域的尖端工具,正有力地推进着人工智能化进程。于此篇文...
-
Gary Marcus:生成式AI泡沫将退,神经符号AI才是未来
近日,人类神经科学和人工智能交叉领域的学者Gary Marcus发文,对生成式人工智能的未来做出了大胆预测:在接下来的12个月内,当前围绕生成式人工智能的泡沫将会破裂。他认为,“生成式人工智能最根本的缺陷在于其可靠性问题”,系统仍会产生幻觉进而生成虚假信息...
-
AIGC核心剖析:NLP与生成模型的协同作用
目录 AIGC核心剖析:NLP与生成模型的协同作用 NLP的基础与挑战 生成模型的强大能力 NLP与生成模型的协同作用 1. 机器翻译 2. 文本摘要 3. 对话系统 结论 AIGC核心剖析:NLP与生成模型的协同作用 在人工智能...