音視頻學習路線


視音頻基礎知識——視音頻解碼——視音頻編碼——視音頻轉碼——視音頻播放——具體應用——其他高階內容

其實就對應於你在通信原理里學過的基本通信模型,下面以流媒體傳輸系統為例畫個對應項示意圖,基本上除了中間信道的部分,都是編解碼生涯中要研究的東西。

image

下面我針對學習路線中的各部分單獨做一下介紹

視音頻基礎知識:

  1. 視頻、圖像、音頻的格式。這里的“格式”是一個廣義的概念,既包括MP4,FLV這樣的封裝格式,也包括H264,MPEG2這樣的編碼格式,還包括420 422 444這樣的取樣格式,甚至RGB,HSV,YUV這樣的彩色空間也可以算作一種格式,將來在應用時還可能會遇到RTMP,HLS這樣的流媒體傳輸協議或者其他的協議,都可以算作格式。這些紛繁復雜的格式就好比學英語時要背的單詞,初學的時候可能覺得看不見摸不着,將來落實到代碼上卻是一目了然的,但是這個“背單詞”的過程一定不能省。在一些論壇里經常能看到很多寫代碼的高手受困於不懂這些基本的概念,大概就是基礎沒打好。
  2. 信息論以及壓縮編碼入門。在你學習前面的各種格式時不可避免地會涉及到一些壓縮編碼的知識,隨便拿一本講視頻編碼的書,前面的緒論也都會簡單講講信息論知識。簡單來說,你需要知道視音頻為什么要壓縮編碼,為什么可以實現壓縮編碼,怎樣評價壓縮編碼的質量,以及具體編碼過程中的一些概念,比如型(profile)和級(level),GOP,IPB幀,NAL單元,宏塊,運動矢量、量化參數,幀內編碼(當然你首先要知道幀率、場頻這類的概念),幀間預測,這一大堆的概念,在不同的編碼標准中還會有各種專屬的概念。覺得前途黑暗想要放棄嗎?不要怕,下面我會給你推薦一些參考書,看上一兩本就差不多入門了。

如果說前面的各種格式相當於英語中的單詞的話,這部分很顯然就是語法了。

  1. 其他。相信你已經感覺到了,視音頻基礎知識確實是非常雜的,除了前面提到的“單詞”和“語法”之外,還會有“視音頻質量評價”這樣的概念,我也不知道要怎么歸類,差不多可以算是應用吧。說到視音頻技術的應用,流媒體應用是很大的一塊,那么這其中又涉及到很多的計算機網絡知識。再比如高階應用中的“硬件加速”,就又涉及到更多高端內容了。這些東西在你以后的工作中慢慢積累就好,還是那句話,不要怕。

  2. 扯蛋。閑着沒事的時候玩玩單反、攝像機、非編軟件,學校或者自己有條件的話去參觀一下電視台,關注一下索尼佳能尼康松下等廠家的產品彩頁及說明書,實踐對於加深理解基礎知識非常有用。

視音頻編碼、解碼、轉碼:

在你學過前面的基礎知識后,是時候上手實踐了。編解轉碼方面有很多開源工程在業內外都得到了廣泛的應用,最著名的是ffmpeg。你的編解碼生涯有一半可能都要耗在ffmpeg身上了,這個項目是如此龐大,如此牛逼,我都不知道該怎么介紹了,而且你在學習這個項目的過程中也可以接觸到包括x264在內的一大票其他開源項目。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM