花费 95 ms
卷积神经网络中一维卷积的计算过程

卷积神经网络(CNN)是深度学习中常用的网络架构,在智能语音中也不例外,比如语音识别。语音中是按帧来处理的,每一帧处理完就得到了相对应的特征向量,常用的特征向量有MFCC等,通常处理完一帧得到的是一个 ...

Mon Jan 25 17:46:00 CST 2021 0 4531
Python学习笔记--语音处理初步

python打开音频文件(IO) 语音音量大小与响度的相关计算 语音处理最基础的部分就是如何对音频文件进行处理。 声音的物理意义:声音是一种纵波,纵波是质点的振动方向与传播 ...

Sat Mar 10 06:58:00 CST 2018 0 6036
机器学习中K-means聚类算法原理及C语言实现

本人以前主要focus在传统音频的软件开发,接触到的算法主要是音频信号处理相关的,如各种编解码算法和回声消除算法等。最近切到语音识别上,接触到的算法就变成了各种机器学习算法,如GMM等。K-means ...

Mon Jul 08 06:28:00 CST 2019 1 1971
语音识别中唤醒技术调研

上篇博客(语音识别传统方法(GMM+HMM+NGRAM)概述)说到我们team要做语音识别相关的项目,而我们公司的芯片是用在终端上的,即我们要做终端上的语音识别。由于目前终端(如手机)上的CPU还不足 ...

Wed May 29 06:26:00 CST 2019 2 1883
语音识别传统方法(GMM+HMM+NGRAM)概述

春节后到现在近两个月了,没有更新博客,主要是因为工作的关注点正从传统语音(语音通信)转向智能语音(语音识别)。部门起了个新项目,要用到语音识别(准备基于Kaldi来做)。我们之前做的传统音频已基本成熟 ...

Wed Apr 03 03:09:00 CST 2019 0 1794
基于WFST的语音识别解码器

学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统,在设备上通过MIC讲话,连着设备的PC的console上就能基本实时显示出讲话的内容。由于我们都是小白,刚开始可以要求低些,就用传 ...

Mon Jun 24 06:53:00 CST 2019 0 1374
深度学习中神经网络模型的量化

深度学习神经网络模型中的量化是指浮点数用定点数来表示,也就是在DSP技术中常说的Q格式。我在以前的文章(Android手机上Audio DSP频率低 memory小的应对措施 )中简单讲过Q格式,网上 ...

Mon Feb 22 15:59:00 CST 2021 0 890
麦克风阵列波束形成之DSB原理与实现

语音识别有近场和远场之分,且很多场景下都会用到麦克风阵列(micphone array)。所谓麦克风阵列是一组位于空间不同位置的麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的 ...

Mon Feb 21 16:19:00 CST 2022 0 2201

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM