iOS音頻學習筆記一:常見音頻封裝格式及編碼格式


(1) pcm格式
   pcm是經過話筒錄音后直接得到的未經壓縮的數據流
   數據大小=采樣頻率*采樣位數*聲道*秒數/8
    采樣頻率一般是22k或者44k,位數一般是8位或者16位,聲道一般是單聲道或者雙聲道
    pcm屬於編碼格式,就是一串由多個樣本值組成的數據流, 本身沒有任何頭信息或者幀的概念,。如果不是音頻的錄制者,光憑一段PCM數據,是沒有辦法知道它的采樣率等信息的。(網上有說法指2048個采樣算一幀PCM,http://www.360doc.com/content/11/1230/19/2226925_176139396.shtml,不知道這種說法是否正確)
 
   參見:
    PCM數據格式 
 
 (2)WAV格式
   WAV格式是封裝格式,里面本身可以存放多種編碼格式的數據,不過一般都是存放的PCM數據,存放其他編碼意義不是很大。
   wav文件由wav文件頭部分和wav文件數據體部分組成,0-43字節存放采樣率、通道數、數據部分的標識符等頭信息,44字節以后的就是數據部分。 很顯然,wav的頭信息很重要,一旦頭信息損壞了,播放估計會有問題。
   參見:
   wav文件格式分析    
   WAV格式  
 
 (3)MP3格式
   MP3是封裝格式,里面存放的數據使用的編碼方式稱為MPEG1 Layer-3 
   MP3文件由TAG_V2(ID3V2)結構體,一組Frame, TAG_V1(ID3V1)結構體組成,頭部的TAG結構體不一定存在,需要進行判斷,尾部的TAG長度為128個字節,也需要進行判斷。
   中間的一組Frame,Frame長度可以定長也可以邊長,每一個Frame都由幀頭和數據實體組成,幀頭記錄了mp3的位率,采樣率,版本等信息,每個幀之間相互獨立,各幀相互獨立。也就是說即使前面的幀損壞了,后面的也是可以播放的。
    參見:
     Mp3幀分析(數據幀)  
     MP3 File Structure   
     MP3文件格式解析  
     MP3格式分析
 
  (4)AMR格式
    AMR文件包含一個文件頭,后面就是一幀一幀的AMR幀。文件頭里面的值是固定值,用於標識該文件為AMR文件。每個幀分為幀頭和數據部分,幀頭里面包含編碼方式以及輔助信息。AMR的采樣率根據編碼方式不同而不同,因此不像MP3一樣,在每個幀里面存放采樣率。
  參見:
   AMR format  
 
(5)AAC格式
   初步了解,AAC文件可以沒有文件頭,全部由幀序列組成,每個幀由幀頭和數據部分組成。幀頭包含采樣率、聲道數、幀長度等,有點類似MP3格式。
   關於AAC格式的文章網上非常少,只看到以下幾篇:
    AAC 格式分析     
 
  (6)CAF文件
   CAF是蘋果的一種音頻封裝格式,與WAV差不多,里面可以存放LPCM、MP3等多種編碼數據。
   參見:
 
---------------------------------------------------------------------------------------- 

  本人博客內容系個人學習與研究的筆記,如存在謬誤或缺失,請見諒並指出,謝謝。
  本文地址:http://www.cnblogs.com/gugupluto/p/3584320.html

  轉載請注明來自:http://www.cnblogs.com/gugupluto/

---------------------------------------------------------------------------------------- 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM