語音識別哪家強訊飛搜狗百度阿里還是騰訊

本文轉載自查看原文 2017-11-29 21:33 1161

            識別結果對比： http://download.csdn.net/download/elesos/10138377 
          

百度

 
         http://yuyin.baidu.com/asr 
        

 
         REST API 
        

 
         http://yuyin.baidu.com/docs/asr/54 
        

 
         格式：推薦pcm 
        

 
         推薦16K 
        

 
         編碼：16bit 位深的 
         單 
         聲道 
        

 
         最長支持60s的錄音文件 
        

 
         轉碼：  
         http://yuyin.baidu.com/docs/asr/58

 
         調用流程 
        

 
         http://yuyin.baidu.com/docs/asr/55 
        

 
         http://ai.baidu.com/docs#/Auth/top 
          有 
         AipSpeech.php的使用方法 
        

 
         概念： 
        

 
         asr:語音識別 
        

 
         tts:語音合成 
        

 
         如果不使用raw方式，而是使用json方式： 
        

 
         (speech, len) 及 (url, callback) 這兩組參數必須二選一 
        

 
         異步的返回值 
        

 
         {"err_msg":"success. ","err_no":0,"sn":"396863495271511838506"} 
        

 
         異步的結果會返回到一個回調地址里，需要將數據存儲才能看到 
        

 
         這個很慢，且不穩定 
        

 
         搜狗的 
        

 
         http://openspeech.sogou.com/Sogou/php/index.php 
        

 
         SDK適用於Android和iOS平台 
        

 
         http://www.xfyun.cn/services/lfasr 
        

 
         訊飛的，可以在線測試 
        

 
         http://www.iflyrec.com/ 
        

 
         騰訊 的 
        

 
         https://cloud.tencent.com/product/asr 
        

 
         還在申請中 
        

 
         阿里的 
        

 
         https://help.aliyun.com/document_detail/30416.html 
        

 
         提供如下三種服務： 
        

 
         「 一句話識別 」對一分鍾內的短語音實時識別，適用於對話聊天，控制口令等較短的語音識別場景。 
        

 
         「 實時語音識別 」：對長時間的語音數據流實時識別，適用於會議演講、視頻直播等長時間不間斷識別的場景。 
        

 
         「 錄音文件識別 」：對錄音文件中的語音做識別，需要存放到oss上，並 
         設置數據為私有， 非實時

 
         oss為 
         私有的情況下oss地址還要包含Signature，Expires，OSSAccessKeyId三個參數

 
         阿里雲大數據平台，簡稱數加 
        

 
         采樣率要求是8或16K 
        

 
         阿里內部進行了切分，返回的結果也是分段的，后面一段重復識別了前面一段的后15ms 
        

 
         總結： 
        

 
         百度的要求格式是16K,單聲道的pcm,而且時長不超過60s， 免費，但是有 
         50000次/日 
          的在線識別調用配額，可以申請提高配額。 
        

 
         測試demo(支持各種格式音頻輸入，內部會進行轉換):有需要的私信 
        

 
         搜狗的目前 只有 
         Android和iOS平台適用，未測試

 
         訊飛的，可以在線測試 
        

 
         http://www.iflyrec.com/ 
        

 
         每小時9.9元 
        

 
         騰訊 的 
        

 
         https://cloud.tencent.com/product/asr 
        

 
         還在申請中 
        

 
         阿里的 
        

 
         https://help.aliyun.com/document_detail/30416.html 
        

 
         提供如下三種服務： 
        

 
         「 一句話識別 」對一分鍾內的短語音實時識別，適用於對話聊天，控制口令等較短的語音識別場景。 
        

 
         「 實時語音識別 」：對長時間的語音數據流實時識別，適用於會議演講、視頻直播等長時間不間斷識別的場景。 
        

 
         「 錄音文件識別 」：對錄音文件中的語音做識別，需要存放到oss上，並 
         設置數據為私有， 非實時

 
         測試demo地址:有需要的私信 
        

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 一段訊飛、百度等語音識別API無法識別的語音最終解決辦法什么？小程序實時語音識別你還在痛苦的對接科大訊飛？百度Ai識別？百度語音識別vs科大訊飛語音識別中國開源項目哪家強？看看阿里，百度，騰訊，360等都開... 百度語音識別入門百度AI的語音合成,語音識別利用百度語音API進行語音識別。百度AI---語音識別玩轉百度語音識別，就是這么簡單百度語音識別引擎使用