原文:使用TensorFlow训练自己的语音识别AI

这次来训练一个基于CNN的语音识别模型。训练完成后,我们将尝试将此模型用于Hotword detection。 人类是怎样听懂一句话的呢 以汉语为例,当听到 wo shi 的录音时,我们会想,有哪两个字是读作 wo shi 的,有人想到的是 我是 ,也有人觉得是 我市 。我们可以通过 wo shi 的频率的特征,匹配到一些结果,我们这次要训练的模型,也是基于频率特征的CNN模型。单纯的基于频率特 ...

2020-02-04 11:35 0 935 推荐指数:

查看详情

AI语音(一)——语音识别基础

1 语音识别基础 1.1 声音特性 声音是由物体振动产生的声波。是通过介质传播并能被人或动物听觉器官所感知的波动现象。最初发出振动的物体叫声源。声音以波的形式振动传播。声音是声波通过任何介质传播形成的运动。 频率:是每秒经过一给定点的声波数量,它的测量单位为赫兹,1千赫或1000赫表示每秒 ...

Mon Aug 10 05:44:00 CST 2020 0 630
Azure AI 服务之语音识别

笔者在前文《Azure AI 服务之文本翻译》中简单介绍了 Azure 认知服务中的文本翻译 API,通过这些简单的 REST API 调用就可以轻松地进行机器翻译。如果能在程序中简单的集成语音转文本的功能会不会非常赞!本文我们就介绍如何使用必应的语音识别 API(Bing Speech API ...

Wed May 02 16:22:00 CST 2018 16 13509
AI语音(七)——基于GMM的0-9语音识别系统

点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 系统概要 孤立词识别语音中只包含一个单词的英文识别 识别对象:0-9以及o的英文语音 训练数据:330句话,每个字符30句话,11个字符 测试数据:110句话,每个字符10句话,11个字符 ...

Fri Aug 28 00:15:00 CST 2020 0 639
AI模型测试】语音识别ASR的结果校对

转自连接:https://www.cnblogs.com/findyou/p/10646312.html 语音转文字(ASR)识别完毕后,目前对于各家的结果都是纯手工的计算,标注错别字和漏识字,感觉到很费时费力,少量的还可以,大量的就有点太费劲了。 所以,为了解放自己的劳动力,让代码帮忙做更多 ...

Fri Dec 04 00:44:00 CST 2020 1 530
百度AI---语音识别

题记:娱乐性的玩玩百度接口。 说实话,其接口个人觉得有点烂,重试了好几个音频文件才成功。 1、重新申请AppID、SecretKey 、API Key。 链接:https://console.bce.baidu.com/ai/?fromai=1#/ai/speech/overview ...

Tue Dec 11 06:07:00 CST 2018 0 633
2-GMM-HMMs语音识别系统-训练

本文记录在传统的语音识别中,训练GMM-HMMs声学模型过程中的公式推导过程。 Outline GMM - 混合高斯模型 HMM – 隐马尔科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假设这里的训练数据,都做 ...

Mon Apr 24 04:04:00 CST 2017 0 1649
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM