語音識別一：開源框架篇

本文轉載自查看原文 2021-09-16 08:23 325 語音識別

MASR:
https://github.com/nobody132/masr
pytorch框架實現,
提供了AISHELL-1數據集上的中文預訓練模型

ASRT
https://asrt.ailemon.net/
Tensorflow框架實現
比較全面的文檔和維護,提供了中文預訓練模型

DeepSpeech
https://github.com/mozilla/DeepSpeech/releases/tag/v0.9.3
tensorflow框架實現
文檔全面,官方維護,提供了中文預訓練模型,提供python包和java包
we're releasing experimental Mandarin Chinese acoustic models trained on an internal corpus composed of 2000h of read speech

DeepSpeech2
https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech
paddle實現
提供了預訓練模型,文檔較全

WeNet
https://github.com/wenet-e2e/wenet/
pytorch框架實現
文檔全面,官方維護,提供了各個中文數據集的預訓練模型,沒找到推理接口

Wav2Letter++
https://github.com/flashlight/wav2letter
C++實現
官方實現,沒有提供預訓練模型

Kaldi
C++實現
老牌的語音識別框架，業界使用廣泛，網上有豐富的文檔，使用多個數據集一起訓練的中文預訓練模型

Speechbrain
https://github.com/speechbrain/speechbrain
pytorch實現，最新的框架
文檔全面，官方維護。提供了aishell數據集上的預訓練模型，

kaldi的一些學習教程
基於Kaldi的中文在線識別系統：https://zhuanlan.zhihu.com/p/366901009
中小公司要不要自研ASR？：https://zhuanlan.zhihu.com/p/352452501
學習Kaldi：中文Aishell項目（上）：https://zhuanlan.zhihu.com/p/143947930
智能語音識別技術入門系列（上）：https://zhuanlan.zhihu.com/p/141180863

中文數據集：

數據集	總時長	下載地址
aishell 1	178h	http://www.aishelltech.com/kysjcp
primewords set 1	100h	http://www.openslr.org/47/
thchs-30	30h	http://www.openslr.org/18/
st-cmd	122h	https://openslr.org/38/
magicdata	755h	http://openslr.magicdatatech.com/resources/68/
aidatatang	200h	http://www.openslr.org/62/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 1-GMM-HMMs語音識別系統-框架篇（深入篇）漫游語音識別技術—帶你走進語音識別技術的世界語音識別概述 JavaScript的語音識別語音識別語音識別-TDNN Python 語音識別語音識別 -- 概述語音識別基礎基於android的語音識別