语音识别哪家强 讯飞 搜狗 百度 阿里还是腾讯


识别结果对比: http://download.csdn.net/download/elesos/10138377

 

 

百度

REST API
格式:推荐pcm
推荐16K
编码:16bit 位深的 声道
最长支持60s的录音文件
http://ai.baidu.com/docs#/Auth/top AipSpeech.php的使用方法
tts:语音合成
如果不使用raw方式,而是使用json方式:
(speech, len) 及 (url, callback) 这两组参数必须二选一
异步的返回值
{"err_msg":"success. ","err_no":0,"sn":"396863495271511838506"}
异步的结果会返回到一个回调地址里,需要将数据存储才能看到
这个很慢,且不稳定

搜狗的
SDK适用于Android和iOS平台

讯飞的,可以在线测试

腾讯 的
还在申请中
阿里的
提供如下三种服务:
「 一句话识别 」对一分钟内的短语音实时识别,适用于对话聊天,控制口令等较短的语音识别场景。
「 实时语音识别 」:对长时间的语音数据流实时识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
「 录音文件识别 」:对录音文件中的语音做识别,需要存放到oss上,并 设置数据为私有, 非实时
oss为 私有的情况下oss地址还要包含Signature,Expires,OSSAccessKeyId三个参数
阿里云大数据平台,简称数加
采样率要求是8或16K
阿里内部进行了切分,返回的结果也是分段的,后面一段重复识别了前面一段的后15ms

总结:
百度的要求格式是16K,单声道的pcm,而且时长不超过60s, 免费,但是有 50000次/日  的在线识别调用配额,可以申请提高配额。
测试demo(支持各种格式音频输入,内部会进行转换):有需要的私信
搜狗的目前 只有 Android和iOS平台适用,未测试
讯飞的,可以在线测试
每小时9.9元
腾讯 的
还在申请中
阿里的
提供如下三种服务:
「 一句话识别 」对一分钟内的短语音实时识别,适用于对话聊天,控制口令等较短的语音识别场景。
「 实时语音识别 」:对长时间的语音数据流实时识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
「 录音文件识别 」:对录音文件中的语音做识别,需要存放到oss上,并 设置数据为私有, 非实时
测试demo地址:有需要的私信


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM