最近一个项目需要用到语音识别,将长语音转换成文字,由于腾讯,阿里,讯飞的长语音识别都收费,因此选择了百度。
由于不知道是自己太渣还是百度的文档写的太奇怪,一开始看到这东西的时候弄得我焦头烂额,在网上找人家踩过的坑,居然一个也没找到,是没人用么= =
[百度linux c++ sdk 文档](http://ai.baidu.com/docs/#/ASR-Linux-SDK/top)
[百度linux c++ sdk 下载](http://ai.baidu.com/sdk#asr)
[我的修改过的github地址](https://github.com/formattor/asr-linux-cpp-change)
官方文档的目录结构是这样的
BDSpeechSDK中包含extern, include, lib, sample, resources五个目录。 如果您需要测试SDK,请至sample目录。
-
extern包含需要的第三方库和头文件
-
include包含需要引入的头文件
- BDSpeechSDK.hpp包含sdk可用接口
- BDSSDKMessage.hpp 包含给sdk发送的消息的结构定义
- ASR/bds_ASRDefines.hpp 包含sdk相关参数取值的定义,错误分类,对应错误码
- ASR/bds_asr_key_definitions.hpp 包含sdk相关参数的定义
-
lib 包含需要引入的SDK库文件
-
resources 包含sdk VAD 算法需要的模型文件
-
sample 目录下有3个示例
本人修该的仅仅是sample/asrDemo2
(未完待续。。。)