原文:unimrcp-voice-activity语音检测

研究 unimrcp有一段时间了,其中unimrcp voice acitve的算法,是遭到大家频繁吐槽。今天我们简单的介绍一下unimrcp voice activity 的这个简单粗暴的算法: unimrcp 语音活动检测是通过能量来控制的,设定几个常量: 来看一下这几个参数的初始化的值,根据实际的测试,我们后期做过改动: 看一下重要的函数,能量的计算: 根据frame的信息,对能量进行粗暴的 ...

2019-08-06 12:56 1 600 推荐指数:

查看详情

语音端点检测Voice Activity Detection,VAD)

本文内容均翻译自这篇博文:(该博主的相关文章都比较好,感兴趣的可以自行学习) Voice Activity Detection(VAD) Tutorial 语音端点检测一般用于鉴别音频信号当中的语音出现(speech presence)和语音消失(speech absence)。这里将提供一个 ...

Wed Apr 10 23:51:00 CST 2019 0 5121
HoloLens开发手记 - 语音输入 Voice input

语音是HoloLens三大重要输入形式之一。它允许你直接通过语言控制全息图像,而不用借助手势。你只要凝视全息图像然后说出语音命令即可。语音输入是自然的交互方式,它能够很好的改善复杂的交互,因为通过一条语音命令即可以减少很多复杂的UI菜单。 HoloLens语音输入是由同UWP应用一样的语音 ...

Fri May 06 19:10:00 CST 2016 0 1962
百度语音识别(Baidu Voice) Android studio版本

已同步更新至个人blog:http://dxjia.cn/2016/02/29/baidu-voice-helper/ 最近在一个练手小项目里要用到语音识别,搜索了一下,比较容易集成的就算Baidu voice跟讯飞语音了,baidu提供了直接可以使用的显示控件,而讯飞 ...

Fri Jul 03 17:48:00 CST 2015 3 7741
WireShark定位QQ语音通话IP检测

WireShark定位QQ语音通话IP检测报告 一、背景资料 通过文章“使用Wireshark抓取QQ好友IP 实施精准定位”,发现可以通过wireshark获取QQ好友的登录终端IP地址,从而实现IP定位功能。 二、测试过程 选择当前QQ登录所使用网卡设备,捕获数据包,查找带有 ...

Fri Jul 12 17:55:00 CST 2019 0 1904
替换unimrcp的VAD模块

摘要: unimrcp vad 模块voice activity dector一直认为比较粗暴,而且unimrcp的社区也很久没有更新了。使用原始unimrcp如果只是用来做Demo演示,通过手动调整参数,还是可以的。但是距离生产环境,还是有很远的一段路。 这篇文章介绍如何使用 ...

Fri Aug 09 03:48:00 CST 2019 3 942
语音信号端点检测

语音信号的端点检测方法有很多种,简单的方法可以直接通过计算出声音的音量大小,找到音量大于某个阈值的部分,认为该部分为需要的语音信号,该部分与阈值的交点即为端点,其余部分认为非语音帧。 计算音量 计算音量的方法有两种,一种是以帧为单位(每一帧包含多个采样点),将该帧内的所有采样点的幅值的绝对值 ...

Sun May 19 23:58:00 CST 2019 0 1412
unimrcp plugin 分析

摘要: unimrcp 访问媒体资源是通过插件实现,社区的代码给出了demo plugin,但是距离一个生产插件还是有一段的距离。这边文章介绍插件的整个逻辑过程,以及如何实现我们自己的插件。 ...

Sat Aug 10 17:26:00 CST 2019 0 435
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM