音頻編碼格式


https://wenzongliang.iteye.com/blog/2272308

 

聲音是由物體振動而產生的

聲波的三要素
聲波的三要素是頻率、振幅和波形,頻率代表音階的高低,振幅代表響度(音量),波形代表音色。
 
PCM脈沖編碼調制
PCM(Pulse Code Modulation),脈沖編碼調制。人耳聽到的是模擬信號,PCM是把聲音從模擬信號轉化為數字信號的技術。原理是用一個固定的頻率對模擬信號進行采樣,采樣后的信號在波形上看就像一串連續的幅值不一的脈沖(脈搏似的短暫起伏的電沖擊),把這些脈沖的幅值按一定精度進行量化,這些量化后的數值被連續的輸出、傳輸、處理或記錄到存儲介質中,所有這些組成了數字音頻的產生過程(抽樣、量化、編碼三個過程)。
描述一段PCM數據一般需要以下幾個概念:量化格式(sampleFormat)、采樣率(sampleRate)、聲道數(channel)
量化是指在幅度軸上對信號進行數字化
采樣就是在時間軸上對信號進行數字化
編碼就是按照一定的格式記錄采樣和量化后的數字數據,比如順序存儲或壓縮存儲
采樣頻率:每秒采集數據的次數
采樣精度:每次采集數據的位數
聲道數:存在幾路音頻
比特率:針對編碼格式,表示壓縮編碼后每秒的音頻數據量大小
音頻壓縮編碼
壓縮編碼的原理實際上是壓縮掉冗余信號,冗余信號是指不能被人耳感知到的信號
幾種常用的壓縮編碼格式
(1)WAV
WAV為微軟公司(Microsoft)開發的一種聲音文件格式,WAV是最接近無損的音樂格式,所以文件大小相對也比較大。
WAV編碼的一種實現(有多種實現方式,但是都不會進行壓縮操作)就是在PCM數據格式的前面加上44字節,分別用來描述PCM的采樣率、聲道數、數據格式等信息。
特點:音質非常好,大量軟件都支持
適用場合:多媒體開發的中間文件、保存音樂和音效素材。
(2)MP3編碼
MP3具有不錯的壓縮比,使用LAME編碼(MP3編碼格式的一種實現)的中高碼率的MP3文件,聽感上非常接近源WAV文件,當然在不同的應用場景下,應該調整合適的參數以達到最好的效果。
特點:音質在128Kbit/s以上表現還不錯,壓縮比比較高,大量軟件和硬件都支持,兼容性好。
適用場合:高比特率下對兼容性有要求的音樂欣賞。
(3)AAC編碼
AAC是新一代的音頻有損壓縮技術,全稱Advanced Audio Coding,是一種專為聲音數據設計的文件壓縮格式。與MP3不同,它采用了全新的算法進行編碼,更加高效,具有更高的“性價比”。優點:相對於mp3,AAC格式的音質更佳,文件更小。
適用場合:128Kbit/s以下的音頻編碼,多用於視頻中音頻軌的編碼。
(4)Ogg編碼
Ogg是一種非常有潛力的編碼,Ogg除了音質好之外,還是完全免費的,Ogg有着非常出色的算法,可以用更小的碼率達到更好的音質,但目前因為還沒有媒體服務軟件的支持
特點:可以用比MP3更小的碼率實現比MP3更好的音質,高中低碼率下均有良好的表現,兼容性不夠好,流媒體特性不支持。
適用場合:語音聊天的音頻消息場景。
--------------------- 
作者:漫步語林 
來源:CSDN 
原文:https://blog.csdn.net/sinat_14826983/article/details/82634401 
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM