音視頻開發-全網最全常用音視頻編碼和格式匯總


現在網上很多技術想學點東西太難了,要收錢才能看!技術是無界限的!惱火了我自己整理,全網最全、最厚道的技術開發者:

編碼格式匯總:

音頻編碼:AAC、AC-3、Revision A、ALAC、AMR、ATRAC 、APE、DTS、FLAC、MP3、Ogg、PCM、RealAudio、WMA

MPEG Audio Layer 1/2

MPEG Audio Layer 3(MP3)

MPEG2 AAC

MPEG4 AAC

Windows Media audeo v1/v2/v3/7/8/9M

RealAudio cook/sipro(real media series)

Real Audio AAC/AACPlus(real media series)

QDesign Music 2(apple series)( QDesign公司開發的用於高保真高壓縮率的編碼方式,類似於MP3,不過比MP3要先進。支持流式播放)

Apple MPEG-4 AAC(apple series)

ogg( ogg vorbis音頻)

AC3(DVD專用音頻編碼)

DTS(DVD專用音頻編碼)

APE( monkey's音頻)

AU(sun格式)

FLAC( fress lossless音頻)

M4A(mpeg-4音頻)(蘋果改用的名字,可以改成mp4)MP2( mpeg audio layer2音頻)

AWMA

音頻容器格式:很多,列舉常用和主流的:wav、aiff、mp3、m4a、amr、wma、ogg

.wav無壓縮無損:WAV文件以最高質量捕獲並重新創建原始音頻波形,而不會以任何方式影響或改變聲音的聲音特征。WAV使用PCM(脈沖編碼調制)對數據進行編碼,方法是將數據切成小塊以提供最高質量。這是一種無損文件格式,意味着沒有任何數據丟失。因此,捕獲和記錄的是原始音頻波形的最接近的數學/數字表示形式,在此過程中不會發生明顯的音頻質量損失。WAV文件也未壓縮,這意味着數據以完全原始格式原樣存儲,不需要解碼。這提供了巨大的多功能性,可以進行出色的編輯和操作。

.aif無壓縮無損:AIFF(音頻交換文件格式)是在WAV之后不久創建的,其工作原理相同:它提供錄音棚級的音頻記錄和播放。AIFF提供與WAV文件一樣的采樣率和位深選項,AIFF使用PCM將音頻波形注冊為准確的采樣(切片),以提供盡可能高的音頻錄制質量和聲音復制。就像WAV一樣,AIFF也以未壓縮的無損格式存儲數據,這意味着您不會損失任何質量,而只會獲得純凈的音質。。

.mp3有損壓縮:未壓縮的音頻格式(例如WAV和AIFF)可提供出色的音質,但要付出高文件大小的代價。隨着90年代中期互聯網文件共享的興起,人們很快意識到通過撥號連接發送未壓縮的文件是不切實際的,而且常常是不可能的。這就是MP3(MPEG-2音頻第III層)誕生的原因。一首三分鍾的歌曲以WAV或AIFF格式平均需要30MB,而轉換為MP3的那首歌曲則占用了十分之一的空間-僅約3MB。借助能夠實現令人驚訝的小文件大小的壓縮算法,MP3成為互聯網時代的主要內容,並一直保持着強大的地位。

.m4a有損壓縮:M4A(MPEG-4第14部分)文件是Apple對MP3的回應。這種以Mac為中心的壓縮音頻格式通常被視為MP3的繼任者,隨着iTunes Store的誕生,它找到了真正的位置,在iTunes Store中,它成為通過在線音樂商店購買的所有音樂的主要格式。對於Mac和iOS App Store以及Nintendo和PlayStation產品中發布的應用程序中包含的所有音頻,它仍然是首選格式。隨着越來越多的開發人員(包括對M4A的支持),它已迅速成為壓縮音頻文件的首選音頻格式。M4A文件使用有損高級音頻編碼(AAC)編解碼器進行編碼,該編解碼器能夠提供與MP3相同的比特率,但壓縮效果更嚴格。這樣可以減小文件大小,同時提供更高的音頻質量。就像金色的獨角獸一樣,這就是為什么它成為輕量級音頻交付的如此流行的格式的原因。

查看更多資料

主流視頻編碼:H.264、H.265、MPEG4、FLV

MPEGI(VCD)

MPEG2(DVD)

MPEG4(divx, xvid)

MPEG4 AVC/h.264

H.261

H.262

H.263

H.263+

H.263++

MPEG4 v1/v2/v3(微軟 windows media系列)

Windows Media Video 7/8/9/10

Sorenson Video3(用於QT5,成標准了)( apple series)

Real Video G2(real media series)

RealVideo 8/9/10(real media series)

Apple MPEG-4(apple series)

Apple H.264(apple series)

flash video

視頻容器格式:淘汰的就不說了、當前主流的有:mp4、wmv、avi、rvmb、wkv、flv、webm、mov、m4v

視頻格式mkv、mp4、avi、flv、mov、wmv、webm特點和區別

m4v和mp4兩種格式的區別
M4V 是一個標准視頻文件格式,由蘋果公司創造。此種格式為 iPod 、 iPhone 和 PlayStation Portable 所使用,同時此格式基於 MPEG-4 編碼第二版。其視頻編碼采用H264或H264/AVC,音頻編碼采用AAC。采用H264高清編碼,相比於傳統On2 VP6、H263、Divx等,能夠以更小的體積實現更高的清晰度。 M4V格式也稱作蘋果的視頻Podcast 格式。是MP4的特殊類型,M4V是MP4格式高清的代表應用

MP4是一套用於音頻、視頻信息的壓縮編碼標准,由國際標准化組織(ISO)和國際電工委員會(IEC)下屬的“動態圖像專家組”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流、光盤、語音發送(視頻電話),以及電視廣播

 

如果我們不是專業搞影視類的,不用考慮太多容器格式,從后端、移動端、前端開發角度來說,考慮多端兼容和通用,優先選擇多端能夠兼容的通用編碼和容器格式,HTML5目前只支持:MP4、WebM、Ogg

對於前端來說、還要考慮瀏覽器兼容性問題,請看html5 video標簽詳解,現在很多主流音視頻相關企業用的都是mp4, m4v,m4a

蘋果公司iPhone、iPad等,目前用的是 m4a、m4v、mp4、mov、wav格式, 蘋果官方多媒體開發文檔

安卓也支持

音樂和音效等場景一般使用wav、mp3編碼,音質好、大量軟件支持, 目前m4a更優秀,MP3的替代者,點擊查看

在視頻應用場景中,一般用mpeg4 和 H.264標准來做編碼,如果要支持4k等超高清之類的就用H.265編碼。在視頻中的音軌編碼一般用AAC編碼更適合;

在語音聊天場景中一般是用ogg編碼;

所以我們當下選擇的通用支持跨平台、應用更廣泛的標准:音頻使用m4a,ogg, 視頻使用mp4 , m4v

 

音頻編碼格式詳解:

AACAdvanced Audio Coding)

高級音頻編碼是一種非常常見音頻編碼格式,出現於1997年,基於MPEG2的音頻編碼技術。由 Fraunhofer IIS、杜比實驗室、AT&T、Sony(索尼)等公司共同開發,目的是取代MP3格式2000年,MPEG-4標准出現后,AAC重新集成了其特性,加入了SBR技術和PS技術,為了區別於傳統的MPEG-2 AAC又稱為MPEG-4 AAC。相關的規范標准分別是 ISO/IEC13818-7, ISO/IEC14496-3作為一種高壓縮比的音頻壓縮算法,AAC壓縮比通常為18:1,也有數據說為20:1,遠勝mp3;

 

在音質方面,由於采用多聲道,和使用低復雜性的描述方式,使其比幾乎所有的傳統編碼方式在同規格的情況下更勝一籌。AAC可以支持多達48個音軌,15個低頻(LFE)音軌,51多聲道支持,更高的采樣率(最高可達96kH,音頻CD為441kH)和更高的采樣精度(支持8it、16it、24bit、3bi,音頻CD為16t)以及有多種語言的兼容能力,更高的解碼效率,一般來說,AC可以在對比MP3文件縮小30%的前提下提供更好的音質AAC包含了如下9種規格:

1.MPEG2 AAC LC低復雜度規格( Low Complexity)

2.MPEG2 AAC Main主規格

3.MPEG2 AAC SSR可變采樣率規格( Scaleable Sample Rate)

4.MPEG-4 AAC LC低復雜度規格( Low Complexity),現在的手機比較常見的MP4文件中的音頻部份就包括了該規格音頻文件

5.MPEG4 AAC Main主規格

6.MPEG4 AAC SSR可變采樣率規格( Scaleable Sample Rate)

7.MPEG4 AAC LTP長時期預測規格( Long Term Predicition)

8.MPEG-4 AAC LD低延遲規格( Low Delay)

9.MPEG4 AAC HE高效率規格( High Efficiency)

 

AC-3Digital Audio Compression StandardRevision AATSC Doc. A/52A

音頻編碼格式,傳說中的杜比實驗室的傑作,著名的有損數據壓縮的多媒體儲存格式。可以包括多達6個獨立的聲道。最知名的是5.1聲道技術。在5.1聲道技術中,5代表着5個基本聲道,獨立連接至五個不同的喇叭(20至2000Hz),分別是右前(RF),中(C),左前(LF),右后(RR),左后(LR);而1則代表1個低頻聲效,連接至低音輔助喇叭(20至120Hz)每個AC-3的音頻幀都是以0x0B77為同步頭。開源庫解碼庫liba52。

 

ALACApple Lossless Audio Codec

蘋果的無損音頻壓縮編碼格式,ALAC與MP3的主要分別在於編碼過程中,MP3會取消小部分高頻及低頻部分的音頻數據,而ALAC則會如實記錄,不會刪除音頻中任何細節數據。由於資料無損,ALAC音頻文件大小會比MP3大,通常每片音樂CD(約70至80分鍾)經ALAC編碼后,音頻文件大小約300MB。

 

AMRAdaptive Multi-Rate)自適應多速率音頻壓縮

音頻編碼格式,是一個使語音編碼最優化的專利。AMR被標准語音編碼3GP在1998年10月選用,現在廣泛在GSM和UMTS中使用。它使用1-8個不同的位速編碼。之前的手機里有很多amr的音頻文件,可分成:

1.AMR-NB

2.AMR-WB, Adaptive Multi-Rate -Wideband Speech Codec

3.AMR-WB+, Extended Adaptive Multi-Rate -Wideband Speech Codec

 

ATRAC Adaptive Transform Acoustic Coding

Sony公司開發的一種相對老的音頻編碼格式,又細分成 ATRACI、 ATRAC2、ATRAC3、 ATRAC3plus,這些都是獨立的技術,后來Sony把這些技術統稱為ATRAC。在rmvb的封裝格式中也能看到這種音頻編碼格式。

 

APE

APE是 Monkey's Audio提供的一種無損壓縮格式APE可以無損失高音質地壓縮和還原。APE的壓縮率相當高,並且音質保持得很好獲得了不少發燒用戶的青睞

 

DTS(Digital Theater Systems)

大名鼎鼎的DTS(數碼影院系統)是由DTS公司開發,一種多通道的音頻技術,低損,環繞立體聲,被廣泛的應用在DVD等高清片源上。同樣也需要授權,與杜比公司是競爭對手。最常見的是DTS5.1:保存5條音頻通道的數據用於環繞立體聲分別是 center, left-front, right-front left-rear, and right-rear除此之外DTS公司還開發了DTS70mm、DTS70ES、 DTS NEO:6、DTS9624、 DTS-HD MasterAudio、 DTS-HD High Resolution Audio、 DTS Connect、 DTS Surround Sensation等技術。由於版權比較嚴格,而且文檔很難從網上找到。

 

FLACFree Lossless Audio Codec

是一款開源的無損壓縮的音頻編碼格式,它不會破壞任何原有的音頻資訊,所以可以還原音樂光碟音質。現在它已被很多軟件及硬件音頻產品所支持,FLAC計划首頁http://flac.sourceforge.net/

 

MP3MPEG-1 or MPEG-2 Audio Layer III)

MPEG1 or MPEG2 Audio LayerⅢ經常被稱作MP3,是目前最流行的音頻編碼格式,有損壓縮,相關的規范標准在 ISO/EC11723, ISOAIEC13818-3。它是在1991年,由位於德國埃爾朗根的研究組織 Fraunhofer-Gesellschaft的一組工程師發明和標准化的,它設計用來大幅度地降低音頻數據量,將音樂以1:10甚至1:12的壓縮率,壓縮成容量較小的文件。

bit rates對MP3來說是可變的,原則是 bit rates越高聲音文件中包含的原始聲音信息越多,這樣回放時聲音品質也越高。

 

bit rates來說MP3可以分為2種

MP3CBR Constant Bit Rate在MP3編碼的早期,整個文件使用一個固定的位元率

MP3VBR Variable Bit Rate可以讓MP3文件的每一段甚至每一幀都可以有單獨的 bitrate,這樣做的好處就是在保證音質的前提下最大程度的限制了文件的大小。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。

 

Ogg 

Ogg是一個自由且開放標准的容器格式,由 Xiph. org基金會所維護,“ogg意指種文件格式,可以納入各式各樣自由和開放源代碼的編解碼器,包含音效、視頻、文字(像字幕)與元數據的處理。

1 Ogg_vorbis:這就是咱們常見的ogg結尾的音頻文件, Vorbis是一種有損音訊壓縮格式,由 Xiph。 Org基金會所領導並開放源代碼。 Vorbis通常以ogg作為容器格式,所以常合稱為 Ogg Vorbis

 

PCM Pulse Code Modulated Audio

目前計算機應用中,最高保真水平的音頻編碼格式。PCM約定俗成了無損編碼能做到最大程度的無限接近絕對保真。被廣泛用於素材保存及音樂欣賞,CD、DVD以及我們常見的WAV文件中均有應用,優點是音質好,缺點是體積大。做嵌入式音視頻產品時,一般情況的音視頻都是芯片負責解碼。如果遇到版權問題,例如AC3DTS,有些時候芯片廠商要求很嚴格,用戶會采取軟解的方法,軟解也就是把AC3 DTS等音頻解成PCM,然后在送給芯片。

 

RealAudio

網絡中非常常見,在rmvbrm封裝格式中,或者是 .ra .ram音頻文件,由RealNetworks發展的一種多媒體音頻文件格式,目前已有很多版本:

1、lpc14-4IS-54 VSELPRealAudio 1

2、28-8G728 LD-CELP RealAudio 2

3、dnetDolby AC3RealAudio 3

4、siprSipro Lab Telecom ACELP-NETRealAudio 4/5

5、cookG2/Cook CodecRealAudio 6

6、atrcSony ATRAC3RealAudio 8

7、raacMPEG-4 LC-AAC RealAudio 9

8、racpMPEG-4 HE-AAC RealAudio 10

9、ralfRealAudio Lossless FormatRealAudio 10

 

WMA Windows Media Audio

是微軟公司開發的一種數字音頻壓縮格式,WMA7之后的WMA支持證書加密,未經許可(即未獲得許可證書),即使是非法拷貝到本地,也是無法收聽的。目前比較流行的是WMA9

WMA9Windows Media 9 Audio Codec

WMA9 PROWindows Media 9 Professional Audio Codec

WMA9_ LLWindows Media 9 Lossless Audio Codec


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM