花费 8 ms
AI大语音(八)——GMM-HMM声学模型

基于GMM的0-9孤立词识别系统以词为训练单位,添加新词汇需要重新进行训练,若要涵盖所以词,差不多6万个词,训练量极大,预测时也要计算6万个模型的似然,哪个大预测出哪个,在实际应 ...

Thu Sep 24 22:36:00 CST 2020 0 871
AI大语音(四)——MFCC特征提取

点击上方“AI大道理”,选择“置顶”公众号 —————— 1 特征提取流程 在语音识别和话者识别方面,最常用到的语音特 ...

Thu Aug 13 06:47:00 CST 2020 0 849
AI大语音(二)——语音预处理

1 预滤波 CODEC(所谓Codec,就是编码-解码器“Coder-Decoder”的缩写。说得通俗一点,对于音频就是A/D和D/A转换。)前端带宽为300-34 ...

Wed Aug 12 05:44:00 CST 2020 1 774
AI大语音(九)——基于GMM-HMM的连续语音识别系统

上一专题GMM-HMM声学模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。 本系统是单音素,未涉及后面三音子的训练以及决策树的内容。 ...

Mon Oct 05 00:54:00 CST 2020 0 686
AI大语音(十)——N-gram语言模型(深度解析)

扫描下方“AI大道理”,选择“关注”公众号 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复 ...

Thu Oct 15 00:21:00 CST 2020 0 635
AI大语音(六)——混合高斯模型(GMM)

点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 GMM基础 高斯混合模型(GMM)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型 ...

Wed Aug 26 01:40:00 CST 2020 0 690
AI大语音(七)——基于GMM的0-9语音识别系统

点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 系统概要 孤立词识别:语音中只包含一个单词的英文识别 识别对象:0-9以及o的英文语音 训练数 ...

Fri Aug 28 00:15:00 CST 2020 0 639
AI大语音(三)—傅里叶变换家族

1 特征提取流程 在语音识别和话者识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简 ...

Thu Aug 13 01:15:00 CST 2020 0 633
AI大语音(一)——语音识别基础

1 语音识别基础 1.1 声音特性 声音是由物体振动产生的声波。是通过介质传播并能被人或动物听觉器官所感知的波动现象。最初发出振动的物体叫声源。声音以波的形式振动传播。声音是声波通过任何介质传播形 ...

Mon Aug 10 05:44:00 CST 2020 0 630
AI大语音(十一)——WFST解码器(上)(深度解析)

点击上方“AI大道理”,选择“置顶”公众号 为了让识别出来的语音符合常规语言表达,引入了语言模型作为约束。 为了加速解码识别效率又引入了WFST解码机制。 解码本质:解码就是在网络中寻找 ...

Wed Nov 18 07:35:00 CST 2020 0 479

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM