GTEx database:該數據庫是健康人貢獻的組織的RNASeq的數據。還有snp信息。將snp信息與gene的表達水平結合起來。
donor:
donor貢獻的tissue。
gene表達水平(用FPKM表示gene的表達水平)受其周圍snp的影響,這樣的gene叫做egene。這樣的snp叫做eQTL。即:snp會影響gene的表達。
按照正常情況,可以得出結論:不同人的相同組織的gene表達水平應該都一樣。比如,都是肝臟組織,那么在肝臟組織中表達的gene的表達量,在所有人中應該是相同的。
但是,發現很多人的相同組織的gene表達水平不同。為什么呢?gene表達水平與snp有關。
為什么gene表達水平(轉錄組水平上的),與DNA水平上的snp有關呢?因為:gene表達水平,與啟動子有關。啟動子增強,gene 表達水平升高。如果snp位於啟動子區域,那么這個snp可能會影響收該啟動子調控的gene的表達水平。
如何衡量snp對gene表達水平的影響呢?
提出了eQTL(expression quality trait loci)的概念。eQTL:影響表達水平的特征位點。它指的是一個loci,即影響gene表達水平的那些snp。
如何衡量eQTL?
1. eQTL有本身的特性。比如是:missence、nonsynonymous等類型。用LoF(loss of function)來衡量eQTL這個snp的嚴重程度;
對gene來說,
根據gene長度,與snp位點的數目,可以得到:這個gene屬於突變多的,還是突變少的gene。
提出PLI的概念。如果某個eQTL的LoF值很大(即該snp很嚴重),那么它對這個gene的影響就越大。(PLI > 0.9)
(此處,我也沒太弄明白。)
從另一個角度,不同組織的gene表達水平是不同的。snp影響這個組織的gene表達水平,不一定會影響其它組織的gene表達水平。
知識點:
1. gene啟動子與gene表達水平的關系。
gene表達與gene轉錄過程有關。在DNA轉錄成RNA的過程中,如果轉錄得到的RNA越多,則這個基因的表達水平越高。
在DNA轉水平錄成RNA的過程中,首先需要轉錄因子先結合到DNA上,然后,再開始轉錄。
轉錄因子結合到DNA的這段序列,叫做啟動子。如果啟動子(啟動子就是一段DNA序列)上存在snp,可能會影響轉錄因子與啟動子的結合,進而,影響轉錄,影響gene表達量。