原文:语音识别一:开源框架篇

MASR: https: github.com nobody masr pytorch框架实现, 提供了AISHELL 数据集上的中文预训练模型 ASRT https: asrt.ailemon.net Tensorflow框架实现 比较全面的文档和维护,提供了中文预训练模型 DeepSpeech https: github.com mozilla DeepSpeech releases tag ...

2021-09-16 08:23 0 325 推荐指数:

查看详情

1-GMM-HMMs语音识别系统-框架

本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。 Outline: 识别原理 统计学模型 系统框架 首先需要说明本文讨论的对象是连续语音识别(Continuous Speech Recognition, CSR),意味着基于DTW(动态时间规整)的孤立词识别 ...

Sun May 07 04:26:00 CST 2017 0 2480
(深入)漫游语音识别技术—带你走进语音识别技术的世界

前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天咱们继续漫游语音识别技术哈,今天内容稍微专业一些,大家可以结合上一漫游语音识别技术一起学习。 上篇我们简单了解了语音识别技术的概念、前世今生以及基本识别原理,一会学长带着大家漫游到语音识别技术更深(更专业)的世界里 ...

Fri Sep 03 05:59:00 CST 2021 0 255
语音识别概述

后验概率最大,即为判别结果 HTK Hvite解码器 Sphinx解码器 TODE解码器,生硬,修改繁琐。 WFST 扩充,简单高效。 有限状态机模型被用于大词汇量连续中文语音识别系统中。 其操作思路是将传统语音识别系统中的数学模型,分别转换成有限状态机模型,再将转换后的模型 ...

Thu Sep 07 23:40:00 CST 2017 0 2021
JavaScript的语音识别

有没有想过给您的网站增添语音识别的功能?比如您的用户不用点鼠标,仅仅通过电脑或者手机的麦克风发布命令,比如"下拉到页面底部”,或者“跳转到下一页”,您的网站就会执行对应命令。听起来很酷对么?然而为了实现这个功能,必须得让您网站的JavaScript脚本能够识别到这些语音输入。 这里介绍一个 ...

Fri Oct 19 20:58:00 CST 2018 2 2331
语音识别

语音识别,可以分为在线识别,离线命令词,及唤醒词 在线识别: 即联网使用的识别功能,支持自定义词库及自训练平台。目前在线识别支持普通话、英文、粤语和四川话,通过在请求时配置不同的pid参数,选择对应模型。默认为麦克风输入,可以设置参数为pcm格式16k采样率,16bit,小端序,单声道的音频流 ...

Tue Mar 29 17:54:00 CST 2022 0 887
语音识别-TDNN

近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理中时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。是CNN的先驱 ...

Mon Jan 14 01:11:00 CST 2019 0 1274
Python 语音识别

调用科大讯飞语音听写,使用Python实现语音识别,将实时语音转换为文字。 参考这篇博客实现的录音,首先在官网下载了关于语音听写的SDK,然后在文件夹内新建了两个.py文件,分别是get_audio.py和iat_demo.py,并且新建了一个存放录音的文件夹 ...

Wed Aug 07 22:15:00 CST 2019 0 706
语音识别 -- 概述

1. 语音合成zhrtvc:https://github.com/KuangDD/zhrtvc 2.离线语音识别 vosk+kaldi:https://alphacephei.com/vosk/ tacotron:https://github.com/keithito/tacotron ...

Fri Nov 20 19:18:00 CST 2020 0 607
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM