很多人知道利用.png的字符串結尾可以判斷前端傳入的圖片是否為png格式,但是這只是潛意識的判斷!那么如何利用png讀寫的特殊內容來深意識地判斷圖片格式呢?最近在做東西的時候遇到了點問題,在加載圖片的時候,加載失敗,后綴都是jpg格式,但換個圖片就可以了,為此,懷疑圖片格式有問題,遂拖到UE里面查看 它的16進制,果然,兩個圖片的文件頭根本就不一樣,這不是欺負人嘛,害我白白浪費了半天的時間,差點要重新編譯內核。
然后到網上找了一些資料,查看不同格式圖片的文件頭是怎樣的。下面是不同圖片的文件頭標志:
圖片的格式很多,一個圖片文件的后綴名並不能說明這個圖片的真正格式什么,那么如何獲取圖片的格式呢?我想到了幾個簡單但有效的方法,那就是讀取圖片文件的文件頭標識。我們知道各種格式的圖片的文件頭標識識不同的,因此我們可以通過判斷文件頭的標識來識別圖片格式。
我對各種格式的圖片文件頭標識進行了分析,不僅查找資料,也用十六進制編輯器察看過圖片的文件頭,以下是我收集、分析的結果,供大家參考。
1.JPEG/JPG
- 文件頭標識 (2 bytes): $ff, $d8 (SOI) (JPEG 文件標識)
- 文件結束標識 (2 bytes): $ff, $d9 (EOI)
2.TGA
- 未壓縮的前5字節 00 00 02 00 00
- RLE壓縮的前5字節 00 00 10 00 00
3.PNG
- 文件頭標識 (8 bytes) 89 50 4E 47 0D 0A 1A 0A
4.GIF
- 文件頭標識 (6 bytes) 47 49 46 38 39(37) 61
G I F 8 9 (7) a
5.BMP
- 文件頭標識 (2 bytes) 42 4D
B M
6.PCX
- 文件頭標識 (1 bytes) 0A
7.TIFF
- 文件頭標識 (2 bytes) 4D 4D 或 49 49
8.ICO
- 文件頭標識 (8 bytes) 00 00 01 00 01 00 20 20
9.CUR
- 文件頭標識 (8 bytes) 00 00 02 00 01 00 20 20
10.IFF
- 文件頭標識 (4 bytes) 46 4F 52 4D
F O R M
11.ANI
- 文件頭標識 (4 bytes) 52 49 46 46
R I F F
1 import java.io.BufferedInputStream; 2 import java.io.FileInputStream; 3 import java.io.IOException; 4 5 /** 6 * 圖片轉成十六進制 7 */ 8 public class img{ 9 public static void main(String[] args) throws Exception { 10 try{ 11 FileInputStream fis = new FileInputStream("png1.png"); 12 java.io.ByteArrayOutputStream bos=new java.io.ByteArrayOutputStream(); 13 byte[] buff=new byte[1024]; 14 int len=0; 15 while((len=fis.read(buff))!=-1){ 16 bos.write(buff,0,len); 17 } 18 //得到圖片的字節數組 19 byte[] result=bos.toByteArray(); 20 System.out.println("++++"+byte2HexStr(result)); 21 //字節數組轉成十六進制 22 String str=byte2HexStr(result); 23 }catch(IOException e){ 24 } 25 26 } 27 /* 28 * 實現字節數組向十六進制的轉換方法一 29 */ 30 public static String byte2HexStr(byte[] b) { 31 String hs=""; 32 String stmp=""; 33 for (int n=0;n<9;n++) { 34 stmp=(Integer.toHexString(b[n] & 0XFF)); 35 if (stmp.length()==1) hs=hs+"0"+stmp; 36 else hs=hs+stmp; 37 } 38 return hs.toUpperCase(); 39 } 40 }
根據這些文件頭標識的收集,我可以寫一個識別圖像格式的模塊了。但是在寫這個模塊之前可以對收集到的文件頭標識進行優化,使得程序中字符串比對次數盡量的少。
1.JPEG我們知需要比對文件頭的$ff, $d8這兩個字符,而不用讀取最后的兩個結束標識了。
2.TGA,ICO,CUR只需比對第三個與第五個字符即可。
3.PNG比對[89][50]這兩個字符。
4.GIF比對[47][49][46]與第五個字符。
廢話不多說了,利用內存流來判斷文件的格式,其實判斷文件的前幾個字節就可以簡單的判斷這個文件是什么類型的文件,例如
jpg文件 是 FFD8 (從低位到高位就要反過來 D8FF 下面都是一樣)
BMP文件 是 424D ---4D42
其他的我就不一一列舉了,想知道跟多文件類型分別是用什么字符作為文件的開頭的話,下載個C32asm或者UE等這類16進制編輯器就可以看到了。