RGB彩色圖像中,一種彩色由R(紅色),G(綠色),B(藍色)三原色按比例混合而成。
圖像的基本單元是一個像素,一個像素需要3塊表示,分別代表R,G,B,如果8為表示一個顏色,就由0-255區分不同亮度的某種原色。
灰度圖像是用不同飽和度的黑色來表示每個圖像點,比如用8位 0-255數字表示“灰色”程度,每個像素點只需要一個灰度值,8位即可,這樣一個3X3的灰度圖,只需要9個byte就能保存
RGB值和灰度的轉換,實際上是人眼對於彩色的感覺到亮度感覺的轉換,這是一個心理學問題,有一個公式:
Grey = 0.299*R + 0.587*G + 0.114*B
根據這個公式,依次讀取每個像素點的R,G,B值,進行計算灰度值(轉換為整型數),將灰度值賦值給新圖像的相應位置,所有像素點遍歷一遍后完成轉換
def rgb2gray(img): # Y' = 0.299 R + 0.587 G + 0.114 B # https://en.wikipedia.org/wiki/Grayscale#Converting_color_to_grayscale return np.dot(img[...,:3], [0.299, 0.587, 0.114])
方法一:
對於彩色轉灰度,有一個很著名的心理學公式:
Gray = R*0.299 + G*0.587 + B*0.114
方法二:
而實際應用時,希望避免低速的浮點運算,所以需要整數算法。
注意到系數都是3位精度的沒有,我們可以將它們縮放1000倍來實現整數運算算法:
Gray = (R*299 + G*587 + B*114 + 500) / 1000
RGB一般是8位精度,現在縮放1000倍,所以上面的運算是32位整型的運算。注意后面那個除法是整數 除法,所以需要加上500來實現四舍五入。
就是由於該算法需要32位運算,所以該公式的另一個變種很流行:
Gray = (R*30 + G*59 + B*11 + 50) / 100
方法三:
上面的整數算法已經很快了,但是有一點仍制約速度,就是最后的那個除法。移位比除法快多了,所以可以將系數縮放成 2的整數冪。
習慣上使用16位精度,2的16次冪是65536,所以這樣計算系數:
0.299 * 65536 = 19595.264 ≈ 19595
0.587 * 65536 + (0.264) = 38469.632 + 0.264 = 38469.896 ≈ 38469
0.114 * 65536 + (0.896) = 7471.104 + 0.896 = 7472
可能很多人看見了,我所使用的舍入方式不是四舍五入。四舍五入會有較大的誤差,應該將以前的計算結果的誤差一起計算進去,舍入方式是去尾法:
寫成表達式是:
Gray = (R*19595 + G*38469 + B*7472) >> 16
2至20位精度的系數:
Gray = (R*1 + G*2 + B*1) >> 2
Gray = (R*2 + G*5 + B*1) >> 3
Gray = (R*4 + G*10 + B*2) >> 4
Gray = (R*9 + G*19 + B*4) >> 5
Gray = (R*19 + G*37 + B*8) >> 6
Gray = (R*38 + G*75 + B*15) >> 7
Gray = (R*76 + G*150 + B*30) >> 8
Gray = (R*153 + G*300 + B*59) >> 9
Gray = (R*306 + G*601 + B*117) >> 10
Gray = (R*612 + G*1202 + B*234) >> 11
Gray = (R*1224 + G*2405 + B*467) >> 12
Gray = (R*2449 + G*4809 + B*934) >> 13
Gray = (R*4898 + G*9618 + B*1868) >> 14
Gray = (R*9797 + G*19235 + B*3736) >> 15
Gray = (R*19595 + G*38469 + B*7472) >> 16
Gray = (R*39190 + G*76939 + B*14943) >> 17
Gray = (R*78381 + G*153878 + B*29885) >> 18
Gray = (R*156762 + G*307757 + B*59769) >> 19
Gray = (R*313524 + G*615514 + B*119538) >> 20
仔細觀察上面的表格,這些精度實際上是一樣的:3與4、7與8、10與11、13與14、19與20
所以16位運算下最好的計算公式是使用7位精度,比先前那個系數縮放100倍的精度高,而且速度快:
Gray = (R*38 + G*75 + B*15) >> 7
其實最有意思的還是那個2位精度的,完全可以移位優化:
Gray = (R + (WORD)G<<1 + B) >> 2
另一種是 Adobe Photoshop 里的公式
Adobe RGB (1998) [gamma=2.20]
Gray = (R^2.2 * 0.2973 + G^2.2 * 0.6274 + B^2.2 * 0.0753)^(1/2.2)
該方法運行速度稍慢,但是效果很好。
還有就是 平均值方法
GRAY = (RED+BLUE+GREEN)/3
(GRAY,GRAY,GRAY ) 替代 (RED,GREEN,BLUE)