最近一個項目需要用到語音識別,將長語音轉換成文字,由於騰訊,阿里,訊飛的長語音識別都收費,因此選擇了百度。
由於不知道是自己太渣還是百度的文檔寫的太奇怪,一開始看到這東西的時候弄得我焦頭爛額,在網上找人家踩過的坑,居然一個也沒找到,是沒人用么= =
[百度linux c++ sdk 文檔](http://ai.baidu.com/docs/#/ASR-Linux-SDK/top)
[百度linux c++ sdk 下載](http://ai.baidu.com/sdk#asr)
[我的修改過的github地址](https://github.com/formattor/asr-linux-cpp-change)
官方文檔的目錄結構是這樣的
BDSpeechSDK中包含extern, include, lib, sample, resources五個目錄。 如果您需要測試SDK,請至sample目錄。
-
extern包含需要的第三方庫和頭文件
-
include包含需要引入的頭文件
- BDSpeechSDK.hpp包含sdk可用接口
- BDSSDKMessage.hpp 包含給sdk發送的消息的結構定義
- ASR/bds_ASRDefines.hpp 包含sdk相關參數取值的定義,錯誤分類,對應錯誤碼
- ASR/bds_asr_key_definitions.hpp 包含sdk相關參數的定義
-
lib 包含需要引入的SDK庫文件
-
resources 包含sdk VAD 算法需要的模型文件
-
sample 目錄下有3個示例
本人修該的僅僅是sample/asrDemo2
(未完待續。。。)