【文章推荐】DTW算法（语音识别）

原文：DTW算法（语音识别）

DTW主要是应用在孤立词识别的算法，用来识别一些特定的指令比较好用，这个算法是基于DP 动态规划的算法基础上发展而来的。这里介绍语音识别就先介绍下语音识别的框架，首先我们要有一个比对的模版声音，然后需要去截取其里面包含真正属于语音的部分，这个要采用一个叫做vad voice activedetection 语音活动检测的算法，而在vad中间我们最常使用双门限端点检测这种方法，如图所示，我们采用v ...

2017-07-23 17:37 0 2287 推荐指数：

查看详情

基于动态时间规整（DTW）的孤立字语音识别

注意！这个博客里给出的文件是在matlab2012版本里使用的，而我学习时使用的时matlab2018b，因此发现了很多新版本不兼容的问题，但我没有给出修改后能直接在新版本中用的代码。另外，ma ...

语音识别算法阅读之LAS

LAS: 　　listen, attented and spell,Google 思想: 　　sequence to sequence的思想，模型分为encoder和dec ...

语音识别算法阅读之DFSMN

论文： Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想：　　对于大词汇量语音识别，往往需要更深的网络结构，但是当FSMN[1]或cFSMN[2]的结构很深时容易引发剃度消失和爆炸问题 ...

语音识别算法阅读之speechTransformer

论文：　　SPEECH-TRANSFORMER: A NO-RECURRENCE SEQUENCE-TO-SEQUENCE MODELFOR SPEECH RECOGNITION ...

语音识别算法阅读之EESEN

论文：　　EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING ...

语音识别算法阅读之CTC

论文：　　CTC：Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想：　　语音识别中，一般包含语音 ...

语音识别-TDNN

近来在了解卷积神经网络（CNN），后来查到CNN是受语音信号处理中时延神经网络（TDNN）影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年，在识别"B", "D", "G"三个浊音中得到98.5%的准确率，高于HMM的93.7%。是CNN的先驱 ...

Python 语音识别

调用科大讯飞语音听写，使用Python实现语音识别，将实时语音转换为文字。参考这篇博客实现的录音，首先在官网下载了关于语音听写的SDK，然后在文件夹内新建了两个.py文件，分别是get_audio.py和iat_demo.py，并且新建了一个存放录音的文件夹 ...

原文：DTW算法（语音识别）

相关推荐

相关标签