花费 6 ms
CTC (Connectionist Temporal Classification) 算法原理

(原创文章,转载请注明出处哦~) 简单介绍CTC算法 CTC是序列标注问题中的一种损失函数。 传统序列标注算法需要每一时刻输入与输出符号完全对齐。而CTC扩展了标签集合,添加空元素。 在使用扩 ...

Fri Mar 08 07:28:00 CST 2019 3 3209
利用Google Speech API实现Speech To Text

很久很久以前, 网上流传着一个免费的,识别率暴高的,稳定的 Speech To Text API, 那就是Google Speech API. 但是最近再使用的时候,总是返回500 Error. ...

Sat Mar 29 18:07:00 CST 2014 1 14494
呼叫中心MRCP Server的负载均衡解决方案,看这篇就够了

  虎年开工第一周,放眼望去,到处都是虎虎生威的好景象,咱也不能闲着,本想吟诗一首助助兴,奈何俺没那文化底蕴!   思来想去,还是写个关于ASR的技术文档吧,即可以总结过去的经 ...

Sun Feb 13 22:57:00 CST 2022 0 3678
探索专有领域的端到端ASR解决之道

摘要:本文从《Shallow-Fusion End-to-End Contextual Biasing》入手,探索解决专有领域的端到端ASR。 本文分享自华为云社区《语境偏移如何解决?专有 ...

Wed May 26 22:46:00 CST 2021 2 399
关于ASR6601芯片的介绍

ASR6601是完整意义的LPWAN SOC无线通信芯片,该芯片集成了LORA射频收发器、调制解调器和32位RISC MCU。MUC采用cortex M4,频率48mhz。LORA射频收发器从150 ...

Thu May 20 17:22:00 CST 2021 0 2259
解析WeNet云端推理部署代码

摘要:WeNet是一款开源端到端ASR工具包,它与ESPnet等开源语音项目相比,最大的优势在于提供了从训练到部署的一整套工具链,使ASR服务的工业落地更加简单。 本文分享自华为云社区《WeN ...

Tue Dec 14 23:01:00 CST 2021 0 184
MRCP接口MRCPRecog 简介

功能:开始一个语音识别,一边讲话,一边识别,需要ASR服务器。 原型:MRCPRecog (grammar, options) grammar ---- 语法文件,可以是一个xml文件 opti ...

Fri Sep 15 22:27:00 CST 2017 2 1783
基于RNN和CTC的语音识别模型,探索语境偏移解决之道

摘要:在本文介绍的工作中,我们展示了一个基于RNN和CTC的语音识别模型,在这个模型中,基于WFST的解码能够有效地融合词典和语言模型. 本文分享自华为云社区《语境偏移如何解决?专有领域端到端 ...

Tue Jul 20 18:02:00 CST 2021 0 202
【AI模型测试】语音识别ASR的结果校对

转自连接:https://www.cnblogs.com/findyou/p/10646312.html 语音转文字(ASR)识别完毕后,目前对于各家的结果都是纯手工的计算,标注错别字和漏识字,感觉 ...

Fri Dec 04 00:44:00 CST 2020 1 530

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM