原文:DTW算法(语音识别)

DTW主要是应用在孤立词识别的算法,用来识别一些特定的指令比较好用,这个算法是基于DP 动态规划 的算法基础上发展而来的。这里介绍语音识别就先介绍下语音识别的框架,首先我们要有一个比对的模版声音,然后需要去截取其里面包含真正属于语音的部分,这个要采用一个叫做vad voice activedetection 语音活动检测的算法,而在vad中间我们最常使用双门限端点检测这种方法,如图所示,我们采用v ...

2017-07-23 17:37 0 2287 推荐指数:

查看详情

基于动态时间规整(DTW)的孤立字语音识别

注意!这个博客里给出的文件是 在matlab2012版本里使用的,而我学习时使用的时matlab2018b,因此发现了很多新版本不兼容的问题,但我没有给出修改后能直接在新版本中用的代码。 另外,ma ...

Wed Jun 10 19:04:00 CST 2020 0 522
语音识别算法阅读之LAS

LAS:   listen, attented and spell,Google 思想:   sequence to sequence的思想,模型分为encoder和dec ...

Mon Sep 14 00:00:00 CST 2020 0 883
语音识别算法阅读之DFSMN

论文: Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想:   对于大词汇量语音识别,往往需要更深的网络结构,但是当FSMN[1]或cFSMN[2]的结构很深时容易引发剃度消失和爆炸问题 ...

Thu Sep 17 05:51:00 CST 2020 0 863
语音识别算法阅读之EESEN

论文:   EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING ...

Wed Sep 16 07:06:00 CST 2020 0 770
语音识别算法阅读之CTC

论文:   CTC:Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想:   语音识别中,一般包含语音 ...

Sun Sep 13 23:36:00 CST 2020 0 752
语音识别-TDNN

近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理中时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。是CNN的先驱 ...

Mon Jan 14 01:11:00 CST 2019 0 1274
Python 语音识别

调用科大讯飞语音听写,使用Python实现语音识别,将实时语音转换为文字。 参考这篇博客实现的录音,首先在官网下载了关于语音听写的SDK,然后在文件夹内新建了两个.py文件,分别是get_audio.py和iat_demo.py,并且新建了一个存放录音的文件夹 ...

Wed Aug 07 22:15:00 CST 2019 0 706
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM