對於芯片或者其它表達數據來說,最常見的莫過於quantile normalization啦。
那么它到底對我們的表達數據做了什么呢?首先要么要清楚一個概念,表達矩陣的每一列都是一個樣本,每一行都是一個基因或者探針,值就是表達量咯。quantile normalization 就是對每列單獨進行排序,排好序的矩陣求平均值,得到平均值向量,然后根據原矩陣的排序情況替換對應的平均值,所以normalization之后的值只有平均值了。
具體看下面的圖:
轉載:http://www.bio-info-trainee.com/2043.html