ZigZag编码
在网络传输和数据存储场景中,需要对数据进行压缩。数据压缩的算法非常多,但大部分的数据压缩算法的原理是通过某种编码方式不存储数据中的0比特位,因此0比特位越多,数据压缩的效果越好。ZigZag编码就是一种增加0比例位的编码方式。下面使用Java语言来描述ZigZag编码。
一、编码
正数
假设数据类型为byte的正数11,其二进制表示为:00001011
- 数据左移一位:
00010110
- 符号位(正数的符号为0)放到最后一位:
00010110
负数
假设数据类型为byte的负数-11,其二进制在计算机中是用补码表示的,计算过程如下。
正数原码:00001011
。
反码:11110100
补码(反码加1):11110101
处理过程:
- 左移一位:
11101010
- 符号位放到最后一位:
11101011
- 除最后一位外全部取反:
00010101
结论
正数经过处理后,前导0和后置0的个数不变。但是负数经过处理后,增加了三个前导0,可以用于压缩。
结合两种情况得出byte类型数据的编码公式:
ZigZag(n) = n>>7 ^ n<<1
-11的处理过程如下:
-
11110101 >> 7 = 11111111
-
11110101 << 1 = 11101010
-
11111111^11101010 = 00010101
二、解码
ZigZag的逆函数:
\(ZigZag^{-1}(n)\)=(n>>>1)^ -(n&1)
负数00010101
的解码过程:
-
n>>>1:
00001010
-
n&1:
00000001
-
-(n&1):
11111111
-
1111111^0000101=11110101