标签【ASR】 - 码上欢乐

简介之前参与过114对话系统的项目，中间搁置很久，现在把之前做过的内容整理一下，一是为自己回顾，二 ...

(原创文章，转载请注明出处哦~) 简单介绍CTC算法 CTC是序列标注问题中的一种损失函数。传统序列标注算法需要每一时刻输入与输出符号完全对齐。而CTC扩展了标签集合，添加空元素。在使用扩 ...

利用Google Speech API实现Speech To Text

很久很久以前, 网上流传着一个免费的,识别率暴高的,稳定的 Speech To Text API, 那就是Google Speech API. 但是最近再使用的时候,总是返回500 Error. ...

　　虎年开工第一周，放眼望去，到处都是虎虎生威的好景象，咱也不能闲着，本想吟诗一首助助兴，奈何俺没那文化底蕴！　　思来想去，还是写个关于ASR的技术文档吧，即可以总结过去的经 ...

摘要：本文从《Shallow-Fusion End-to-End Contextual Biasing》入手，探索解决专有领域的端到端ASR。本文分享自华为云社区《语境偏移如何解决？专有 ...

关于ASR6601芯片的介绍

ASR6601是完整意义的LPWAN SOC无线通信芯片，该芯片集成了LORA射频收发器、调制解调器和32位RISC MCU。MUC采用cortex M4，频率48mhz。LORA射频收发器从150 ...

解析WeNet云端推理部署代码

摘要：WeNet是一款开源端到端ASR工具包，它与ESPnet等开源语音项目相比，最大的优势在于提供了从训练到部署的一整套工具链，使ASR服务的工业落地更加简单。本文分享自华为云社区《WeN ...

MRCP接口MRCPRecog 简介

功能：开始一个语音识别，一边讲话，一边识别，需要ASR服务器。原型：MRCPRecog (grammar, options) grammar ---- 语法文件，可以是一个xml文件 opti ...

摘要：在本文介绍的工作中，我们展示了一个基于RNN和CTC的语音识别模型，在这个模型中，基于WFST的解码能够有效地融合词典和语言模型. 本文分享自华为云社区《语境偏移如何解决？专有领域端到端 ...

转自连接：https://www.cnblogs.com/findyou/p/10646312.html 语音转文字（ASR）识别完毕后，目前对于各家的结果都是纯手工的计算，标注错别字和漏识字，感觉 ...