http://blog.sina.com.cn/s/blog_4c1f21000100utyx.html
GO是Gene Ontology的簡稱,是生物學家為了衡量基因的功能而而發起的一個項目,從分子功能(molecular function)、生物學過程(biological process)和細胞定位(cellular component)三個面對基因功能進行全面定義。
基因本體論,用於蛋白的功能分類!
Gene Ontology可分為分子功能(Molecular Function),生物過程(biological process)和細胞組成(cellular component)三個部分。蛋白質或者基因可以通過ID對應或者序列注釋的方法找到與之對應的GO號,而GO號可對於到Term,即功能類別或者細胞定位。
功能富集分析: 功能富集需要有一個參考數據集,通過該項分析可以找出在統計上顯著富集的GO Term。該功能或者定位有可能與研究的目前有關。
GO功能分類是在某一功能層次上統計蛋白或者基因的數目或組成,往往是在GO的第二層次。此外也有研究都挑選一些Term,而后統計直接對應到該Term的基因或蛋白數。結果一般以柱狀圖或者餅圖表示。
1.GO分析
根據挑選出的差異基因,計算這些差異基因同GO 分類中某(幾)個特定的分支的超幾何分布關系,GO 分析會對每個有差異基因存在的GO 返回一個p-value,小的p 值表示差異基因在該GO 中出現了富集。
GO 分析對實驗結果有提示的作用,通過差異基因的GO 分析,可以找到富集差異基因的GO分類條目,尋找不同樣品的差異基因可能和哪些基因功能的改變有關。
2.Pathway分析
根據挑選出的差異基因,計算這些差異基因同Pathway 的超幾何分布關系,Pathway 分析會對每個有差異基因存在的pathway 返回一個p-value,小的p 值表示差異基因在該pathway 中出現了富集。
Pathway 分析對實驗結果有提示的作用,通過差異基因的Pathway 分析,可以找到富集差異基因的Pathway 條目,尋找不同樣品的差異基因可能和哪些細胞通路的改變有關。與GO 分析不同,pathway 分析的結果更顯得間接,這是因為,pathway 是蛋白質之間的相互作用,pathway 的變化可以由參與這條pathway 途徑的蛋白的表達量或者蛋白的活性改變而引起。而通過芯片結果得到的是編碼這些蛋白質的mRNA 表達量的變化。從mRNA 到蛋白表達還要經過microRNA 調控,翻譯調控,翻譯后修飾(如糖基化,磷酸化),蛋白運輸等一系列的調控過程,mRNA 表達量和蛋白表達量之間往往不具有線性關系,因此mRNA 的改變不一定意味着蛋白表達量的改變。同時也應注意到,在某些pathway 中,如EGF/EGFR 通路,細胞可以在維持蛋白量不變的情況下,通過蛋白磷酸化程度的改變(調節蛋白的活性)來調節這條通路。所以芯片數據pathway 分析的結果需要有后期蛋白質功能實驗的支持,如Western blot/ELISA,IHC(免疫組化),over expression(過表達),RNAi(RNA 干擾),knockout(基因敲除),trans gene(轉基因)等。
3.基因網絡分析
目的:根據文獻,數據庫和已知的pathway 尋找基因編碼的蛋白之間的相互關系(不超過1000 個基因)。