阿里巴巴语音识别模型 DFSMN 的使用指南



阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。

本场 Chat 的主要内容包括:

    1. 语音识别流程简介;
    2. Kaldi 的部署使用;
    3. 如何训练基于中文的 DFSMN 声学模型;
    4. 语音特征提取 MFCC 算法源码解读;
    5. 语音识别工具对比。


https://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM