Flv是網絡上流行的非常廣的一種媒體格式,很多大型媒體網站都在使用這種格式承載音視頻信息,比如優酷等網站。
Flv文件格式相對而言還是比較簡單的,主要是由兩部分組成
FLV header
FLV body
FLV header
前9個字節
46 4c 56 01 05 00 00 00 00 09
第一到第三字節(46 4c 56) 的ascii的代碼為"FLV"(注意大小寫)
第四個字節為版本信息,一般都為(01)
第五個字節為流的信息,表示是否有視頻信息,是否有音頻信息。0000 0001(0x01)為有視頻,0000 0100(0x04)為有音頻,既有有視頻又有音頻為(0x05)
第六到第九字節存放的是整個頭部長度,一般為(3+1+1+4)=9。
FLV body
Flv body是由很多tag組成,tag又分成三種類型
- script(腳本流)
- video(視頻流)
- audio(音頻流)
tag的結構舉例如下:
每個tag包含
- tag header
-
tag data
tag header
tag header 的第一個字節表示為記錄的數據類型,(0x12)為腳本類型;(0x08)為音頻類型;(0x09)為視頻類型
tag header的第二到第四個字節表示為數據區長度
(0x00 01 74)表示 為372,表示tag data 長度
tag header 的第五到第七個字節表示為時間戳,類型為(0x12)的tag時間戳一直為0,(0xFFFFFF)可以表示長度為4小時,單位為毫秒。
tag header 的第八個字節為擴展時間戳,一般都為0,長度為4小時的flv一般很少見了。
tag header 的第九到第十一個字節為streamID,總為0.
tag data
tag data三種類型的結構表示如下:
script(腳本流)
包含兩個AMF(Action Message Format)包,第一個AMF包封裝了" onMetaData ",第二個AMF包封裝了諸如視頻圖像長寬,文件長度,視頻幀率,音頻比特率,位深等等。
第一個字節表示AMF包類型,都是(0x02),表示字符串。
第二到第三個字節表示字符串長度,一般是(0x0a),表示10個字符串,就是第四到第十三個字節包含的" onMetaData "字符串的長度。
第十四個字節是第二個AMF包類型,一般是(0x08),表示數組,第十五到第十八個字節是AMF包長度,表示數組元素個數。(0x10)表示包含16個數組元素長度。
后面即為各數組元素的封裝,數組元素為元素名稱和值組成的對。表示方法如下:
第1-2個字節表示元素名稱的長度,假設為L。
后面跟着為長度為L的字符串。
第L+3個字節表示元素值的類型。
后面跟着為對應值,占用字節數取決於值的類型。
video(視頻流)
視頻流如下:
前4bits表示類型:
·1-- keyframe
·2 -- inner frame
·3 -- disposable inner frame (h.263 only)
·4 -- generated keyframe
(0x17)前4bit表示為0001,表示為keyframe
后4bits表示解碼器ID:
·2 -- seronson h.263
·3 -- screen video
·4 -- On2 VP6
·5 -- On2 VP6 with alpha channel
·6 -- Screen video version 2
·7 -- AVC (h.264)
(0x17)后4bits表示為0111,表示為avc(h.264)
第二個字節固定為0x01。
之后是視頻數據。
audio(音頻流)
前4bits表示音頻格式:
·0 -- 未壓縮
·1 -- ADPCM
·2 -- MP3
·4 -- Nellymoser 16-kHz mono
·5 -- Nellymoser 8-kHz mono
·10 – AAC
(0x2b)前4bits為2,表示為mp3
下面兩個bits表示samplerate:
·0 -- 5.5KHz
·1 -- 11kHz
·2 -- 22kHz
·3 -- 44kHz
(0x2b)中b表示為 1011,10為2,表示22kHz
下面1bit表示采樣長度:
·0 -- snd8Bit
·1 -- snd16Bit
下面1bit表示類型:
·0 -- sndMomo
·1 – sndStereo
之后是數據。
tag size
在每個tag前面都有四個字節,表示前面tag的長度大小,因為script(腳本流)前面沒有tag,所以script tag前面的四個字節都為(0x00 00 00 00).
相應的入門代碼 傳送門: