文章目錄
前言
數字音頻
音頻編碼
WAV編碼
MP3編碼
AAC編碼
Ogg編碼
前言
近一兩年直播、短視頻等可謂是異常火爆,隨着5G技術的逐漸普及,音視頻領域估計會迎來新一輪的爆發。對於移動開發者,音視頻開發技術也將是一個不可或缺的技能。正所謂“好記性不如爛筆頭”,做一些學習筆記還是很有必要的。
數字音頻
模擬信號要轉化為數字信號通常要經過采樣、量化、編碼。
采樣
所謂采樣就是在時間軸上對信號進行數字化。根據奈奎斯特定理(也稱為采樣定理):當采樣頻率大於信號中最高頻率的2倍時,采樣之后的數字信號可以完整地保留原始信號中的信息。對於高質量的音頻信號,其頻率范圍(人耳能夠聽到的頻率范圍)是20Hz~20kHz,所以采樣頻率一般為44.1kHz,這樣就可以保證采樣聲音達到20kHz也能被數字化,從而使得經過數字化處理之后,人耳聽到的聲音質量不會被降低。
量化
量化是指在幅度軸上對信號進行數字化。每一個量化都是一個采樣。
編碼
所謂編碼,就是按照一定的格式記錄采樣和量化后的數字數據,比如順序存儲或壓縮存儲等。編碼涉及到很多種格式,通常所說的音頻的裸數據格式就是脈沖編碼調制(Pulse Code Modulation,PCM)數據。描述一段PCM數據一般需要以下幾個概念:量化格式(sampleFormat)、采樣率(sampleRate)、聲道數(channel)。而對於聲音格式,還有一個概念用來描述它的大小,稱為數據比特率,即1秒時間內的比特數目,它用於衡量音頻數據單位時間內的容量大小。
計算經過壓縮的視頻輸出文件大小公式:
(音頻編碼率(kbps)/8 + 視頻編碼率(kbps)/8)× 影片總長度(秒)/1024 = 文件大小(MB為單位)
計算不經過壓縮的聲音文件大小公式公式:
采樣頻率(Hz)*采樣位數(bit)*聲道數=數據量(位/秒)
圖象應該是,
畫面尺寸(分辨率)*彩色位數(bit)*幀數 = 數據量(位/秒)
音頻編碼
壓縮編碼的基本指標之一就是壓縮比,壓縮比通常小於1。壓縮算法包括有損壓縮和無損壓縮。壓縮編碼原理實際上是壓縮掉冗余信號,冗余信號是指不能被人耳感知到的信號,包含人耳聽覺范圍之外的音頻信號以及被掩蔽掉的音頻信號等。而被掩蔽掉的音頻信號則主要是因為人耳的掩蔽效應,主要表現為頻域掩蔽效應與時域掩蔽效應。
常見的壓縮算法有PCM、WAV、AAC、MP3、Ogg等。
WAV編碼
WAV編碼不會進行壓縮操作。其有多種實現方式,其中一種就是在PCM數據格式的前面加上44字節,分別用來描述PCM的采樣率、聲道數、數據格式等信息。
特點: 音質非常好,大量軟件都支持。
適用場合 : 多媒體開發的中間文件、保存音樂和音效素材。
MP3編碼
MP3具有不錯的壓縮比,聽感上比較接近源WAV文件。
特點: 音質在128Kbit/s以上表現還不錯,壓縮比比較高,大量軟件和硬件都支持,兼容性好。
適用場合: 高比特率下對兼容性有要求的音樂欣賞。
AAC編碼
AAC是新一代的音頻有損壓縮技術,它通過一些附加的編碼技術(比如PS、SBR等),衍生出了LC-AAC、HE-AAC、HE-AAC v2三種主要的編碼格式。
特點:在小於128Kbit/s的碼率下表現優異,並且多用於視頻中的音頻編碼。
適用場合:128Kbit/s以下的音頻編碼,多用於視頻中音頻軌的編碼。
Ogg編碼
Ogg是一種非常有潛力的編碼,在各種碼率下都有比較優秀的表現,尤其是在中低碼率場景下。Ogg除了音質好之外,還是完全免費的。Ogg有着非常出色的算法,可以用更小的碼率達到更好的音質,128Kbit/s的Ogg比192Kbit/s甚至更高碼率的MP3還要出色。但目前因為還沒有媒體服務軟件的支持,Ogg目前受支持的情況還不夠好,無論是軟件上的還是硬件上的支持,都無法和MP3相提並論。
特點:可以用比MP3更小的碼率實現比MP3更好的音質,高中低碼率下均有良好的表現,兼容性不夠好,流媒體特性不支持。
適用場合:語音聊天的音頻消息場景。
音頻基礎概念的簡單學習就到這里。
---------------------
作者:鐵掌碼上飄
來源:CSDN
原文:https://blog.csdn.net/langlitaojin/article/details/88413979
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!