轉錄組測序中生物學重復如何來設
1.區分生物學重復與技術重復
生物學重復:指樣本重復,比如3只小鼠,同時做一種處理,就是三個生物學重復。
技術重復:一般是三次實驗,比如對一塊組織,提了三次RNA,做三次real time。
2.設置生物學重復的意義
由於新一代測序技術的優越性以及高成本,曾一度忽略了“生物學重復”的重要性。但生物學重復對於測序實驗的設計以及實驗數據的解讀和分析都非常重要。
設置生物學重復:
能夠消除組內誤差:生物學重復可以測量變異程度
增強結果的可靠性:測序的樣本數越多,越能夠降低背景差異
檢測離群樣本:異常樣本的存在,會嚴重影響測序結果的准確性,通過計算樣本間的相關性可以發現異常樣本,將其排除。
案例一:
注:COX4NB和RASGRP1基因在生物學重復樣本中表達值的散點圖:
左邊紅色,COX4NB基因表達值的散點圖
右邊藍色,RASGRP1基因達值的散點圖
上面一行,測序數據的散點圖
下面一行:芯片數據的散點圖
COX4NB在生物學重復樣本中表達差異非常小;但在同樣情況下,RASGRP1的生物學差異很大。結果意味着:不同實驗組間 COX4NB的表達水平的變化存在研究意義;而同樣情況下RASGRP1的檢測數據可能不能說明問題。
由此可知,設計的實驗如果沒有生物學重復,或者生物學重復的數量不夠,就不能得到有統計意義的實驗結果;獲得的差異表達的基因很可能僅僅是少數個體差異的表現,並不能反映疾病或者某種特定生理狀態的群體本質特征。
3.生物學重復設置幾個合適?
您是不是有同樣的問題:轉錄組測序是否必須進行生物學重復啊,是否要3個重復,是否可以用3個樣品的RNA等量混合代替生物學重復,如果不重復能否發文章…..?一方面是有限的經費,一方面是編輯的質疑;實在很難抉擇呀~~~
目前沒有生物學重復的實驗發文章比較困難,尤其是IF≥5的雜志。如果確實受限於研究經費,無法設置生物學重復。文章投出之后,遭編輯質疑。那就得結合強有力的實驗數據做支撐,比如定量實驗,FISH熒光原位雜交,或者是northern 雜交等,用實驗數據說服編輯。重復設置原則上越多越好,然而考慮到現實條件,重復設置≥3。一般不建議設置兩個重復,因為如果兩者結果不一致,我們無法確定以哪個數據為參考。
注:3個生物學重復,不等同於將3個樣品的RNA等量混合后測序。3個樣品等量混合測序,相當於將3個樣本的基因表達量取了平均值,其實就是相當於取了一個樣本,由此得到的差異基因同樣不可信,不能反應群體生物學現象。
4.生物學重復分析結果展示
以公司做項目的經驗來看,原核生物以及真菌生物學重復的效果>植物>動物,這是由於動植物個體差異較大所導致。所以動植物在選取生物學重復時,應按照嚴格的篩選條件進行取樣,方可得到理想結果。
案例二:真菌的轉錄組測序
實驗設計:處理組與對照組(n=3)實驗結果:如下圖所示,重復樣本間的相關系數r>0.9
案例三:植物轉錄組測序
實驗設計:處理組與對照組(n=3)
實驗結果:分析發現有一組樣品明顯偏離其余兩組樣品,確定是樣品問題后,將其去除,得到兩重復樣本間的相關系數r>0.95
5.生物學重復取樣要求:
不是任意選取幾組樣品都能做為生物學重復樣本,尤其是動植物個體,由於個體差異大, 在選取生物學重復樣本時,應嚴格控制變量。
植物取樣:同一片試驗田,同一長勢,外部形態特征相同
動物取樣:同一遺傳背景,同一飼養條件,同一年齡,性別相同,外部形態特征相同
混合取樣:保證混合樣品處理方式相同,處於同一發育階段,個體外部形態特征相同
參考文獻:
1. Sequencing technology does not eliminate biological variability. Kasper D Hansen,Zhijin Wu, Rafael A Irizarry & Jeffrey T Leek. Nat Biotechnol., 2011. 29(7):572–573.
2. The Power of Replicates-Illumina
3. Statistical Design and Analysis of RNA Sequencing Data.Paul L.Auer and R.W. Doerge. Genetics.