二維碼容錯等級
錯誤校正
損壞,但仍然解碼的二維碼
水平使用的Reed-Solomon糾錯算法。越高誤差校正水平,較少的存儲容量。下表列出了在每一個的四個層次的近似誤差校正能力:
電平L(低) 7%的碼字可以被恢復。
M級(中) 的碼字的15%可以被恢復。
級Q(四分)[ 28 ] 的碼字的25%可以被恢復。
H級(高) 的碼字的30%可以被恢復。
由於到Reed-Solomon碼的設計和使用的8位碼字,一個單獨的代碼塊可以不超過255個碼字的長度。由於較大的QR碼元包含比這更多的數據,所以它必要的打破消息成多個塊。雖然QR說明書中不使用的最大可能的塊大小,相反,它定義了不超過30,這樣的糾錯符號出現在每個塊的塊大小。這意味着一個至多15的每塊的錯誤可以被校正,從而限制的某些步驟中的解碼算法的復雜性。的代碼塊,然后交錯在一起,使得不那么容易局部損壞的QR符號將壓倒任何單塊的能力。
由於糾錯,有可能創造出藝術的QR碼,掃描正確的,但含有故意的錯誤,使他們更可讀的或有吸引力的人的眼睛,以及包括顏色,標志,以及其他功能的QR碼塊。[ 29 ] [ 30 ]
一、什么是二維碼
二維碼 (2-dimensional bar code),是用某種特定的幾何圖形按一定規律在平面(二維方向上)分布的黑白相間的圖形記錄數據符號信息的。在許多種類的二維條碼中,常用的碼制有:Data Matrix, Maxi Code, Aztec, QR Code, Vericode, PDF417, Ultracode, Code 49, Code 16K等。二維碼的名稱是相對與一維碼來說的,比如以前的條形碼就是一個“一維碼”,它的優點有:二維碼存儲的數據量更大;可以包含數字、字符,及中文文本等混合內容;有一定的容錯性(在部分損壞以后可以正常讀取);空間利用率高等。
1.堆疊式/行排式二維條碼,如,Code 16K、Code 49、PDF417(如下圖)等
2.矩陣式二維碼,最流行莫過於QR CODE。
二、QR CODE 介紹
QR(Quick-Response) code是被廣泛使用的一種二維碼,解碼速度快。它可以存儲多用類型:
如上圖時一個qrcode的基本結構,其中:
1.位置探測圖形、位置探測圖形分隔符、定位圖形:用於對二維碼的定位,對每個QR碼來說,位置都是固定存在的,只是大小規格會有所差異;
2.校正圖形:規格確定,校正圖形的數量和位置也就確定了;
3.格式信息:表示改二維碼的糾錯級別,分為L、M、Q、H;
4.版本信息:即二維碼的規格,QR碼符號共有40種規格的矩陣(一般為黑白色),從21x21(版本1),到177x177(版本40),每一版本符號比前一版本每邊增加4個模塊。
5.數據和糾錯碼字:實際保存的二維碼信息,和糾錯碼字(用於修正二維碼損壞帶來的錯誤)。
三、簡要的編碼過程
1. 數據分析:確定編碼的字符類型,按相應的字符集轉換成符號字符; 選擇糾錯等級,在規格一定的條件下,糾錯等級越高其真實數據的容量越小。
2. 數據編碼:將數據字符轉換為位流,每8位一個碼字,整體構成一個數據的碼字序列。其實知道這個數據碼字序列就知道了二維碼的數據內容。
數據可以按照一種模式進行編碼,以便進行更高效的解碼,例如:對數據:01234567編碼(版本1-H),
1)分組:012 345 67
2)轉成二進制:012→0000001100
345→0101011001
67 →1000011
3)轉成序列:0000001100 0101011001 1000011
4)字符數 轉成二進制:8→0000001000
5)加入模式指示符(上圖數字)0001:0001 0000001000 0000001100 0101011001 1000011
對於字母、中文、日文等只是分組的方式、模式等內容有所區別。基本方法是一致的
3. 糾錯編碼:按需要將上面的碼字序列分塊,並根據糾錯等級和分塊的碼字,產生糾錯碼字,並把糾錯碼字加入到數據碼字序列后面,成為一個新的序列。
在二維碼規格和糾錯等級確定的情況下,其實它所能容納的碼字總數和糾錯碼字數也就確定了,比如:版本10,糾錯等級時H時,總共能容納346個碼字,其中224個糾錯碼字。 就是說二維碼區域中大約1/3的碼字時冗余的。對於這224個糾錯碼字,它能夠糾正112個替代錯誤(如黑白顛倒)或者224個據讀錯誤(無法讀到或者無法譯碼), 這樣糾錯容量為:112/346=32.4%
4. 構造最終數據信息:在規格確定的條件下,將上面產生的序列按次序放如分塊中,按規定把數據分塊,然后對每一塊進行計算,得出相應的糾錯碼字區塊,把糾錯碼字區塊 按順序構成一個序列,添加到原先的數據碼字序列后面。 如:D1, D12, D23, D35, D2, D13, D24, D36, ... D11, D22, D33, D45, D34, D46, E1, E23,E45, E67, E2, E24, E46, E68,...
5.構造矩陣:將探測圖形、分隔符、定位圖形、校正圖形和碼字模塊放入矩陣中。
把上面的完整序列填充到相應規格的二維碼矩陣的區域中
6. 掩摸:將掩摸圖形用於符號的編碼區域,使得二維碼圖形中的深色和淺色(黑色和白色)區域能夠比率最優的分布。
7. 格式和版本信息:生成格式和版本信息放入相應區域內。
版本7-40都包含了版本信息,沒有版本信息的全為0。二維碼上兩個位置包含了版本信息,它們是冗余的。
版本信息共18位,6X3的矩陣,其中6位時數據為,如版本號8,數據位的信息時 001000,后面的12位是糾錯位。
四、使用三方包zxing完成編碼和解碼過程
1.編碼:
- public static void encode(String content, String format, String filePath) {
- try {
- Hashtable hints = new Hashtable();//設置編碼類型
- hints.put(EncodeHintType.CHARACTER_SET, DEFAULT_ENCODING);
- //編碼
- BitMatrix bitMatrix = new QRCodeWriter().encode(content,
- BarcodeFormat.QR_CODE, DEFAULT_IMAGE_WIDTH,
- DEFAULT_IMAGE_HEIGHT,hints);
- //輸出到文件,也可以輸出到流
- File file = new File(filePath);
- MatrixToImageWriter.writeToFile(bitMatrix, format, file);
- } catch (IOException e) {
- e.printStackTrace();
- } catch (WriterException e1) {
- e1.printStackTrace();
- }
2.解碼:
- BufferedImage image = ImageIO.read(file);//讀取文件
- LuminanceSource source = new BufferedImageLuminanceSource(image);
- BinaryBitmap bitmap = new BinaryBitmap(new HybridBinarizer(
- source));
- //解碼
- Result result = new MultiFormatReader().decode(bitmap);
- String resultStr = result.getText();
- System.out.println(resultStr);