MASR:
https://github.com/nobody132/masr
pytorch框架實現,
提供了AISHELL-1數據集上的中文預訓練模型
ASRT
https://asrt.ailemon.net/
Tensorflow框架實現
比較全面的文檔和維護,提供了中文預訓練模型
DeepSpeech
https://github.com/mozilla/DeepSpeech/releases/tag/v0.9.3
tensorflow框架實現
文檔全面,官方維護,提供了中文預訓練模型,提供python包和java包
we're releasing experimental Mandarin Chinese acoustic models trained on an internal corpus composed of 2000h of read speech
DeepSpeech2
https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech
paddle實現
提供了預訓練模型,文檔較全
WeNet
https://github.com/wenet-e2e/wenet/
pytorch框架實現
文檔全面,官方維護,提供了各個中文數據集的預訓練模型,沒找到推理接口
Wav2Letter++
https://github.com/flashlight/wav2letter
C++實現
官方實現,沒有提供預訓練模型
Kaldi
C++實現
老牌的語音識別框架,業界使用廣泛,網上有豐富的文檔,使用多個數據集一起訓練的中文預訓練模型
Speechbrain
https://github.com/speechbrain/speechbrain
pytorch實現,最新的框架
文檔全面,官方維護。提供了aishell數據集上的預訓練模型,
kaldi的一些學習教程
基於Kaldi的中文在線識別系統:https://zhuanlan.zhihu.com/p/366901009
中小公司要不要自研ASR?:https://zhuanlan.zhihu.com/p/352452501
學習Kaldi:中文Aishell項目(上):https://zhuanlan.zhihu.com/p/143947930
智能語音識別技術入門系列(上):https://zhuanlan.zhihu.com/p/141180863
中文數據集:
數據集 | 總時長 | 下載地址 |
---|---|---|
aishell 1 | 178h | http://www.aishelltech.com/kysjcp |
primewords set 1 | 100h | http://www.openslr.org/47/ |
thchs-30 | 30h | http://www.openslr.org/18/ |
st-cmd | 122h | https://openslr.org/38/ |
magicdata | 755h | http://openslr.magicdatatech.com/resources/68/ |
aidatatang | 200h | http://www.openslr.org/62/ |