基于各种分类算法的语音分类(年龄段识别) 概述 实习期间作为帮手打杂进行了一段时间的语音识别研究,内容是基于各种分类算法的语音的年龄段识别,总结一下大致框架,基本思想是: 获取语料库 TIMIT 提取数据特征,进行处理 MFCC/i-vector LDA/PLDA/PCA ...
ALIZE是法国Avignon大学提供的一个开源的说话人识别工具包,利用它可以搭建目前最新水平 state of the art 的说话人识别系统 官方网站:http: alize.univ avignon.fr download en.html 编译的时候中间可能会遇到许多意想不到的问题,下面是我的一些总结: 首先在官网下载ALIZE . 和LIA RAL . ,然后再去这里下载特征提取工具包S ...
2014-04-17 18:01 2 2567 推荐指数:
基于各种分类算法的语音分类(年龄段识别) 概述 实习期间作为帮手打杂进行了一段时间的语音识别研究,内容是基于各种分类算法的语音的年龄段识别,总结一下大致框架,基本思想是: 获取语料库 TIMIT 提取数据特征,进行处理 MFCC/i-vector LDA/PLDA/PCA ...
说话人识别(Speaker Recognition,SR),又称声纹识别(Voiceprint Recognition,VPR),顾名思义,即通过声音来识别出来“谁在说话”。语音识别(Automatic Speech Recognition,ASR)是通过声音识别出来“在说什么”。为了简便,后文 ...
说话人识别领域的研究所面临的挑战 背景噪声问题,跨信道问题,多说话人分割聚类,多模态识别,短语音问题,语音的长时变换问题,耳语音以及其他各种实际应用环境下的鲁棒性问题等。 说话人识别技术研究的核心是解决训练与测试之间的失配问题,这种失配也称作会话变异(Session Variability)导致 ...
翻译: https://arxiv.org/pdf/1811.07453.pdf ABSTRACT 开源软件的可用性在语音识别和深度学习的普及中发挥了重要作用。例如,Kaldi 现在是用于开发最先进的语音识别器的既定框架。 PyTorch 用于使用 Python 语言构建神经网络 ...
的把这个文档汉化了,所以大家一起享受吧。 这里有很多非常不错的R包和工具. 该想法来自于awesom ...
Hutool工具包 集常用的java工具类为一体的工具包,你值得拥有 Hutool https://www.hutool.cn/docs/#/ 一:包含组件 二:最喜欢用的时间 DateUtil , 更详细的请进入文档查看 https ...
链接:https://pan.baidu.com/s/1Pe8K2pyUlpZQBFqMkrXlOw 提取码:wjiu ...
guava这个工具包里有好多有用的工具类 <dependency> <groupId>com.google.guava</groupId> <artifactId>guava</artifactId> < ...