使用百度語音識別(linux c++ SDK)的踩坑


最近一個項目需要用到語音識別,將長語音轉換成文字,由於騰訊,阿里,訊飛的長語音識別都收費,因此選擇了百度。

由於不知道是自己太渣還是百度的文檔寫的太奇怪,一開始看到這東西的時候弄得我焦頭爛額,在網上找人家踩過的坑,居然一個也沒找到,是沒人用么= =

[百度linux c++ sdk 文檔](http://ai.baidu.com/docs/#/ASR-Linux-SDK/top)

[百度linux c++ sdk 下載](http://ai.baidu.com/sdk#asr)

[我的修改過的github地址](https://github.com/formattor/asr-linux-cpp-change)

官方文檔的目錄結構是這樣的

BDSpeechSDK中包含extern, include, lib, sample, resources五個目錄。 如果您需要測試SDK,請至sample目錄。

  • extern包含需要的第三方庫和頭文件

  • include包含需要引入的頭文件

    • BDSpeechSDK.hpp包含sdk可用接口
    • BDSSDKMessage.hpp 包含給sdk發送的消息的結構定義
    • ASR/bds_ASRDefines.hpp 包含sdk相關參數取值的定義,錯誤分類,對應錯誤碼
    • ASR/bds_asr_key_definitions.hpp 包含sdk相關參數的定義
  • lib 包含需要引入的SDK庫文件

  • resources 包含sdk VAD 算法需要的模型文件

  • sample 目錄下有3個示例

本人修該的僅僅是sample/asrDemo2

(未完待續。。。)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM