语音处理的分帧，帧移，加窗

本文转载自查看原文 2021-05-31 09:58 1874

一、分帧

语音数据和视频数据不同，本没有帧的概念，但是为了传输与存储，我们采集的音频数据都是一段一段的。为了程序能够进行批量处理，会根据指定的长度（时间段或者采样数）进行分段，结构化为我们编程的数据结构，这就是分帧。语音信号在宏观上是不平稳的，在微观上是平稳的，具有短时平稳性（10---30ms内可以认为语音信号近似不变），这个就可以把语音信号分为一些短段来进行处理，每一个短段称为一帧（CHUNK）。

二、帧移

由于我们常用的信号处理方法都要求信号是连续的，也就说必须是信号开始到结束，中间不能有断开。然而我们进行采样或者分帧后数据都断开了，所以要在帧与帧之间保留重叠部分数据，以满足连续的要求，这部分重叠数据就是帧移。

三、加窗

介绍帧移的时候我们说了，我们处理信号的方法都要求信号是连续条件，但是分帧处理的时候中间断开了，为了满足条件我们就将分好的帧数据乘一段同长度的数据，这段数据就是窗函数整个周期内的数据，从最小变化到最大，然后最小。

加窗即与一个窗函数相乘,加窗之后是为了进行傅里叶展开.
1.使全局更加连续，避免出现吉布斯效应
2.加窗时候，原本没有周期性的语音信号呈现出周期函数的部分特征。
加窗的代价是一帧信号的两端部分被削弱了，所以在分帧的时候，帧与帧之间需要有重叠。

四、傅里叶变换
对一帧信号做傅里叶变换得到的结果叫做频谱

对语音信号处理主要的数学工具是傅里叶变换，而傅里叶变换是研究整个时间域和频率域的关系。不过，当运用计算机实现工程测试信号处理时，不可能对无限长的信号进行测量和运算，而是取其有限的时间片段进行分析。

————————————————
版权声明：本文为CSDN博主「phymat.nico」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/shixin_0125/article/details/99844048

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 【转】语音处理的分帧，帧移，加窗，滤波，降噪，合成概念理解 python语音信号处理-加窗、分帧、STFT 语音处理基础知识 python视频分帧 Python学习笔记--语音处理初步 Laya 分帧加载优化 Matlab中添加语音处理（voicebox）工具箱 VoIP语音处理流程和知识点梳理基于MATLAB的多功能语音处理器使用python读取视频中的指定数字（一）：视频分帧处理