原文:语音识别端到端模型解读:FSMN及其变体模型

摘要:在很长一段时间内,语音识别领域最常用的模型是GMM HMM。但近年来随着深度学习的发展,出现了越来越多基于神经网络的语音识别模型。 一 概述 在很长一段时间内,语音识别领域最常用的模型是GMM HMM。但近年来随着深度学习的发展,出现了越来越多基于神经网络的语音识别模型。在各种神经网络类型中,RNN因其能捕捉序列数据的前后依赖信息而在声学模型中被广泛采用。用得最多的RNN模型包括LSTM ...

2020-12-03 11:26 0 629 推荐指数:

查看详情

语音识别模型阅读之CLDNN

论文:   CLDNN: CONVOLUTIONAL, LONG SHORT-TERM MEMORY,FULLY CONNECTED DEEP NEURAL NETWORKS,Google ...

Sun Sep 13 04:18:00 CST 2020 0 622
Kaldi语音识别CVTE模型实战

一.下载训练好的模型   下载路径:http://kaldi-asr.org/models/m2    二.上传&配置   1.上传到kaldi/egs/目录下      2.解压,tar -zxvf 0002_cvte_chain_model_v2.tar.gz ...

Wed Jan 15 17:48:00 CST 2020 0 1459
【AI模型测试】语音识别ASR的结果校对

转自连接:https://www.cnblogs.com/findyou/p/10646312.html 语音转文字(ASR)识别完毕后,目前对于各家的结果都是纯手工的计算,标注错别字和漏识字,感觉到很费时费力,少量的还可以,大量的就有点太费劲了。 所以,为了解放自己的劳动力,让代码帮忙做更多 ...

Fri Dec 04 00:44:00 CST 2020 1 530
Torch:从特征提取到模型语音识别

作者|Ayisha D 编译|VK 来源|Towards Data Science 这篇文章中,我们探讨从语音数据中提取的特征,以及基于这些特征构建模型的不同方法。 语音数字(Spoken digits)数据集是Tensorflow语音数据集的一个子集,它包括数字0-9之外的其他录音 ...

Mon Aug 24 07:02:00 CST 2020 0 561
kaldi使用cvte模型进行语音识别

操作系统 : Unbutu18.04_x64 gcc版本 :7.4.0 该模型在thch30数据集上测试的错误率只有8.25%,效果还是不错的。 模型下载地址: http://www.kaldi-asr.org/models/m2 选择模型:CVTE Mandarin Model V2 ...

Sun Oct 27 05:30:00 CST 2019 1 2043
牛叉的无监督语音识别模型

今年五月份facebook推出了语音识别wav2vec的无监督版本,感觉很厉害的样子。想起多年前,实验室里,研究语音识别的师兄师姐到处收集语音样本,甚至自己录音,然后花很多时间处理样本。那无监督的语音识别是不是就不用那么麻烦了。虽然没有研究过语音识别,不过这个无监督还是蛮诱人的,于是就阅读 ...

Sat Sep 18 13:12:00 CST 2021 0 282
基于RNN和CTC的语音识别模型,探索语境偏移解决之道

摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型. 本文分享自华为云社区《语境偏移如何解决?专有领域ASR之路(三)》,原文作者:xiaoye0829 。 这篇文章我们介绍一个结合CTC与WFST ...

Tue Jul 20 18:02:00 CST 2021 0 202
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM