-
开源语音转文本 Speech-to-Text 大模型实战之Whisper篇
前言 随着深度学习技术的不断发展,语音转文本(Speech-to-Text,STT)技术取得了显著的进步。开源社区涌现了许多高效的STT大模型,为开发者提供了强大的工具。本文将以OpenAI推出的Whisper模型为例,详细介绍如何使用该模型进行语音转文...
-
深入探索:Stable Diffusion 与传统方法对比:优劣分析
深入探索:Stable Diffusion 与传统方法对比:优劣分析 一、引言 随着人工智能和深度学习的发展,优化算法在神经网络训练中的重要性日益凸显。传统的优化方法,如随机梯度下降(SGD)、动量法和Adam等,已广泛应用于各类深度学习任务。然而...
-
【AIGC】二、mac本地采用GPU启动keras运算
mac本地采用GPU启动keras运算 一、问题背景 二、技术背景 三、实验验证 本机配置 安装PlaidML 安装plaidml-keras 配置默认显卡 运行采用 CPU运算的代码 step1 先导入keras包,导入数据cifar...
-
基于MindSpore实现BERT对话情绪识别
本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十四天】基于 MindSpore 实现 BERT 对话情绪识别》,作者:JeffDing。 模型简介 BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder...
-
搭建本地whisper语音识别
目录 代码仓库 编辑 选择模型 环境配置 语音识别测试 Whisper是一个通用的语音识别模型。它是在不同音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。 代码仓库 GitHub - ope...
-
Python爬虫入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
初学Python之爬虫的简单入门 一、什么是爬虫? 1.简单介绍爬虫 爬虫的全称为网络爬虫,简称爬虫,别名有网络机器人,网络蜘蛛等等。 网络爬虫是一种自动获取网页内容的程序,为搜索引擎提供了重要的数据支撑。搜索引擎通过网络爬虫技术,...
-
教你基于MindSpore用DCGAN生成漫画头像
本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十天】DCGAN生成漫画头像》,作者:JeffDing。 DCGAN生成漫画头像 在下面的教程中,我们将通过示例代码说明DCGAN网络如何设置网络、优化器、如何计算损失函数以及如何初始化模型...
-
在本地部署 Stable Diffusion:详细教程
第一步:环境准备 1、安装 Python 和 Conda 确保您的计算机上已安装 Python 3.x 版本。 如果您使用 Conda 进行环境管理,请安装 Miniconda 或 Anaconda。 2、创建和激活虚拟环境 打开命令行终端,并执...
-
陶哲轩点破「天机」:不懂数学别想靠ChatGPT飞升!
【新智元导读】冲锋在AI辅助数学研究第一线的陶哲轩,近日又有「神总结」:ChatGPT提升的,是我们在编码、图表等次要任务上的能力;而真要搞好数学研究,基础不扎实的话,AI也是没用的。 使用ChatGPT一年半了,陶哲轩的感想如何? 最近,一直冲锋在探索A...
-
语音识别教程:Whisper
语音识别教程:Whisper 一、前言 最近看国外教学视频的需求,有些不是很适应,找了找AI字幕效果也不是很好,遂打算基于Whisper和GPT做一个AI字幕给自己。 二、具体步骤 1、安装FFmpeg Windows: 进入 ht...
-
Faster-whisper+silero-vad 实时语音转录
环境搭建 需要使用cuda 在 cmd 控制台里输入 nvidia-smi.exe 以查看显卡驱动版本和对应的 cuda 版本 前往 NVIDIA-CUDA 官网下载与系统对应的 Cuda 版本 以 Cuda-11.7 版本为例,根据自己的...
-
AIGC入门(一) 从零开始搭建Transformer!(上)
前言 我记得曾经看过一篇综述,综述里曾这样讲过: 多模态使用Transformer作为基石模型的一个原因之一,就是因为它能够很好地统一视觉(ViT、DiT)和文本,并且无限制地扩大其参数。这是一个在工程上很有作用也很有实际意义的事情。 笔者...
-
【Stable Diffusion本地部署简易教程】从入门到实践
Stable Diffusion 本地部署指南:简单易懂的图文教程 引言 Stable Diffusion是一种深度学习模型,用于生成高质量的图像。本地部署意味着你可以在自己的计算机上运行这个模型,从而无需依赖于在线服务。本教程将循序渐进地指导你如...
-
AIGC的图像生成技术【从卷积神经网络到风格迁移】
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
Stable Diffusion Mjdjourney新手超详细安装教程,亲测有效
安装 Stable Diffusion 需要一定的技术基础和系统配置。以下是基本的安装方法,适用于 Windows 系统。 前提条件 兼容的 GPU:建议使用支持 CUDA 的 NVIDIA GPU。 Python 3.7+:确保已安装 Pytho...
-
AIGC工具使用心得:提升开发效率的利器
目录 AIGC工具使用心得:提升开发效率的利器 引言 AIGC工具是什么? AIGC工具的功能和优势 我的使用心得 结论 AIGC工具使用心得:提升开发效率的利器 引言 随着人工智能的不断发展,我们正在面对越来越多的复杂任务和数据。...
-
在Windows下搭建Stable Diffusion环境中途出错咋弄?
在Windows下搭建Stable Diffusion环境需要以下几个步骤: 安装Git和Anaconda 首先,确保你的计算机上已经安装了Git和Anaconda。如果没有安装,可以分别访问官方网站进行下载和安装: Git: https://git...
-
区分stable diffusion中的通道数与张量维度
区分stable diffusion中的通道数与张量形状 1.通道数: 1.1 channel = 3 1.2 channel = 4 2.张量形状 2.1 3D 张量 2.2 4D 张量 2.2.1 通常 2.2.2 stable d...
-
AIGC中的强化学习技术原理与应用
本文收录于专栏:精通AI实战千例专栏合集 https://blog.csdn.net/weixin_52908342/category_11863492.html 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践...
-
详细解析AI作画原理及相关理论
先来欣赏AI作画 人物方面: 欣赏AI作画自然意境: 目录 引言 一、AI作画原理 二、相关理论 1. 风格迁移理论 2. 生成对抗网络(GAN) 三、代码示例 进一步的优化和改进可能包括: 总结: 引言...
-
LLama的激活函数SwiGLU 解释
目录 Swish激活函数 1. Swish函数公式 LLaMA模型中的激活函数 1. SwiGLU激活函数 2. SwiGLU激活函数的表达式 3. SwiGLU激活函数的优势 Swish激活函数 Swish是一种激活函数,其计算...
-
AIGC-Stable Diffusion进阶1(附代码)
在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。 SD模型的组成 在之前也讲过了,SD由CLIP、UNet、Schedule,VAE组成。再来回顾一下知识点: 1.CLIP Te...
-
【Diffusion实战】基于Stable Diffusion实现文本到图像的生成(Pytorch代码详解)
来试试强大的Stable Diffusion吧,基于Stable Diffusion的pipeline,进一步了解Stable Diffusion的结构~ Diffusion实战篇: 【Diffusion实战】训练一个diffusion模型生成...
-
AIGC-常见图像质量评估MSE、PSNR、SSIM、LPIPS、FID、CSFD,余弦相似度----理论+代码
持续更新和补充中…多多交流! 参考:图像评价指标PNSR和SSIM函数 structural_similarity图片相似度计算方法总结 MSE和PSNR MSE:...
-
使用Python实现深度学习模型:序列到序列模型(Seq2Seq)
本文分享自华为云社区《使用Python实现深度学习模型:序列到序列模型(Seq2Seq)》,作者: Echo_Wish。 序列到序列(Seq2Seq)模型是一种深度学习模型,广泛应用于机器翻译、文本生成和对话系统等自然语言处理任务。它的核心思想是将一个序...
-
【AI应用开发全流程】使用AscendCL开发板完成模型推理
给开发者套件上电后 Step4 登录开发者套件 通过PC共享网络联网(Windows): 控制面板 -> 网络和共享中心 -> 更改适配器设置 -> 右键“WLAN” -> 属性 ->...
-
快速学会一个算法,CNN
今天给大家分享一个超强的算法,CNN 卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,广泛应用于图像和视频分析、自然语言处理和其他相关领域。CNN 通过模拟生物视觉系统的处理方式,能够自动学习数据的层次...
-
LightGBM实战+随机搜索调参:准确率96.67%
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...
-
Llama改进之——SwiGLU激活函数
引言 今天介绍LLAMA模型引入的关于激活函数的改进——SwiGLU1,该激活函数取得了不错的效果,得到了广泛地应用。 SwiGLU是GLU的一种变体,其中包含了GLU和Swish激活函数。 GLU GLU(Gated Linear Units...
-
Stable Diffusion模型基于 TensorFlow 或 PyTorch 训练
安装必要的软件和库: 安装 Python(建议使用 Python 3.x 版本)。 安装 TensorFlow 或 PyTorch,具体版本取决于你的模型是基于哪个框架训练的。 安装其他可能需要的依赖,如 NumPy、Matplotlib 等。...
-
whisper-v3模型部署环境执行
1. 安装whisperV3 github git clone https://github.com/openai/whisper.git pip install -U openai-whisper pip install setuptools-ru...
-
LightGBM算法背景、原理、特点+Python实战案例
大家好,我是Peter~ 今天给大家分享一下树模型的经典算法:LightGBM,介绍算法产生的背景、原理和特点,最后提供一个基于LightGBM和随机搜索调优的案例。 LightGBM算法 在机器学习领域,梯度提升机(Gradient Boosting...
-
Python+whisper.cpp纯本地化语音转文字
想要用Python+whisper.cpp实现纯本地化语音转文字,我的操作环境如下: MacOS Ventura 13.0 Python3.7 conda PyAudio 一开始打算用PyAudio,解决了头文件找不到的问题(网上教程很多)之后,仍...
-
最简单的Stable Diffusion 本地部署教程
为了在本地成功部署Stable Diffusion,你需要遵循一系列详细的步骤,确保所有必要的硬件和软件环境都被正确配置。以下是一个全面的教程,帮助你从零开始搭建Stable Diffusion的运行环境。 1. 硬件和软件环境准备【1】【5】 在开...
-
【AIGC大模型】跑通wonder3D (windows)
这两天看了AI大神李某舟被封杀,课程被下架的新闻,TU商 认为:现在这种玩概念、徒具高大上外表却无实质内容的东西太多了,已经形成一种趋势和风潮,各行各业各圈层都在做大做强这种势,对了,这种行为的学名叫宣传,俗名叫营销,花名叫忽悠,真名叫骗人。老老实实做事...
-
深入探究Python网络数据爬虫技术
在当今信息爆炸的时代,数据作为一种重要的资源,其获取与分析能力已成为个人和企业竞争力的关键。而网络数据爬虫,作为一种能够自动抓取网络信息的工具,日益显现出其强大的作用。本文将深入探究Python网络数据爬虫技术,分析其原理、方法、应用场景以及面临的挑战。一...
-
实战whisper第二天:直播语音转字幕(全部代码和详细部署步骤)
直播语音实时转字幕: 基于Whisper的实时直播语音转录或翻译是一项使用OpenAI的Whisper模型实现的技术,它能够实时将直播中的语音内容转录成文本,甚至翻译成另一种语言。这一过程大致分为三个步骤:捕获直播音频流、语音识别(转录)以及翻译(如...
-
[从0开始AIGC][Transformer相关]:Transformer中的激活函数:Relu、GELU、GLU、Swish
[从0开始AIGC][Transformer相关]:Transformer中的激活函数 文章目录 [从0开始AIGC][Transformer相关]:Transformer中的激活函数 1. FFN 块 计算公式? 2. GeLU 计...
-
第一篇【AI与传奇开心果系列】Python的AI相关库技术点案例示例:详解AI作画原理
AI与传奇开心果博文系列 系列博文目录 Python的AI相关库技术点案例示例系列 博文目录 前言 一、AI作画算法原理介绍 二、深度学习的神经网络AI作画算法原理应用示例代码 三、特征学习AI作画算法原理应用示例代码 四、风格迁移AI作画算...
-
时间序列预测:探索性数据分析和特征工程的实用指南
时间序列分析是数据科学和机器学习领域最广泛的主题之一:无论是预测金融事件、能源消耗、产品销售还是股票市场趋势,这一领域一直是企业非常感兴趣的领域。 随着机器学习模型的不断进步,使除了传统的统计预测方法(如回归模型、ARIMA模型、指数平滑 外,与机器学习...
-
一文带您了解SHAP:机器学习的模型解释
在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(Explainable AI ,XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任...
-
万字长文超全总结Pytorch核心操作!
在深度学习与人工智能领域,PyTorch已成为研究者与开发者手中的利剑,以其灵活高效的特性,不断推动着新技术的边界。对于每一位致力于掌握PyTorch精髓的学习者来说,深入了解其核心操作不仅是提升技能的关键,也是迈向高级应用与创新研究的必经之路。本文精心...
-
时间序列概率预测的共形预测
前面我们介绍了用于时间序列概率预测的分位数回归,今天继续学习基于概率预测的时间序列概率预测方法--共形预测。 现实世界中的应用和规划往往需要概率预测,而不是简单的点估计值。概率预测也称为预测区间或预测不确定性,能够提供决策者对未来的不确定性状况有更好的认...
-
用于时间序列概率预测的分位数回归
分位数回归满足这一需求,提供具有量化机会的预测区间。它是一种统计技术,用于模拟预测变量与响应变量之间的关系,特别是当响应变量的条件分布令人感兴趣时。与传统的回归方法不同,分位数回归侧重于估计响应变量的条件量值,而不是条件均值。 图(A : 分位数回归 分...
-
探秘Python神器:eli5模块如何解读机器学习模型的预测结果?
在Python编程领域,有时候我们会遇到一些复杂的代码或者算法,很难理解其中的逻辑和原理。 为了帮助我们更好地理解代码背后的运行机制,eli5模块应运而生。eli5模块是一个Python库,可以解释机器学习模型的预测结果,帮助我们理解模型是如何做出决策的...
-
社交网络:利用AIGC进行社交网络分析
1.背景介绍 1. 背景介绍 社交网络是现代互联网的重要组成部分,它们连接了数亿个用户,为信息传播、人际交流和商业活动提供了一个平台。社交网络分析是研究这些网络结构和行为的科学,它涉及到许多领域,包括计算机科学、社会学、心理学和经济学。...
-
Ascend C 自定义PRelu算子
本文分享自华为云社区《Ascend C 自定义PRelu算子》,作者: jackwangcumt。 1 PRelu算子概述 PReLU是 Parametric Rectified Linear Unit的缩写,首次由何凯明团队提出,和LeakyRe...
-
五种常用于LLM的令牌遮蔽技术介绍以及Pytorch的实现
本文将介绍大语言模型中使用的不同令牌遮蔽技术,并比较它们的优点,以及使用Pytorch实现以了解它们的底层工作原理。 令牌掩码Token Masking是一种广泛应用于语言模型分类变体和生成模型训练的策略。BERT语言模型首先使用,并被用于许多变体(Ro...
-
【热门话题】Stable Diffusion:本地部署教程
🌈个人主页: 鑫宝Code🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 💫个人格言: "如无必要,勿增实体" 文章目录 Stable Diffusion:本地部署教程 一、引言 二、环境准备 1...
-
AIGC之gradio系列学习教程(二)Components
简述: 让我们继续了解一下 Gradio 的一些主要功能。本指南旨在对构建演示时应注意的各种事项进行高级概述。 Components Gradio 包含 30 多个预构建组件(以及许多用户构建的自定义组件),只需一行代码即可在演示中用...