擴增子圖表解讀3熱圖:差異菌、OTU及功能


熱圖是使用顏色來展示數值矩陣的圖形。通常還會結合行、列的聚類分析,以表達實驗數據多方面的結果。 
熱圖在生物學領域應用廣泛,尤其在高通量測序的結果展示中很流行,如樣品-基因表達,樣品-OTU相對豐度矩陣非常適合采用熱圖呈現。
 
熱圖優點
 
因為人讀數字需要思考和比較,而對顏色識別能力非常強,采用顏色的深淺代替數據表是非常高效的呈現方式,也便於從中挖掘規律。 
熱圖在非常小的區域展示了大量的基因表達/細菌豐度數據,即可以快速比較組間的變化,同時還可以顯示組內每個樣品的的豐度,以及組內各樣品間的重復情況。
 
熱圖數據的轉換
 
如果使用原始相對豐度或表達值,范圍通常為0-100或 0-1000000,而大部分的OTU或基因較低,做出的圖會使絕大數據的數量顏色處於低豐度區,很難發現規律;因此需要數據變換,常用的方法有兩類: 
1. log2(x+1) x為豐度或表達值 
為什么要原始值+1,是為了保證結果仍為正值,因為2的0次方為1; 
為什么要使用log變換,以log2為例, 0-1000的表達范圍,經變化為0-10的范圍,顏色梯度范圍更容易使人與數值建立對應關系。 
為什么常用log2對數變化,因為篩選差異的標准通常為兩倍,log2對數變化后,每相差1的兩個值都有兩倍差異,選擇目標很方便;有時也會根據具體情況,選擇ln, log10等轉換方式; 
2.  Z-score標准化: 
標准分數(standard score)也叫z分數(z-score),是一個分數與平均數的差再除以標准差的過程。用公式表示為:z=(x-μ)/σ。其中x為某一具體分數,μ為平均數,σ為標准差。此種方法可以使有差異且穩定變化的兩組明顯區分為不同的顏色,但卻丟失了原始相對豐度、差異倍數的信息。但由於結果比較美觀,規律明顯,使用較多。
 
常用熱圖繪制工具
 
最常用的是R語言的包,如heatmap和pheatmap等。
此外Excel, matlab也可以。
不想學語言的可以使用一些專門繪制工具,如 HEMI,個人用過,繪圖和聚類都很方便,但偶爾會崩潰,不知現在作者更新沒有
 
用R繪制熱圖的教程
 
網上教程很多,因為這個太常用。我推薦”生信寶典”最新發布的教程三步曲,從入門到精通。
 
看圖實戰(Result)
 
示例1. OTU相對豐度 - 樣品
2017新出爐的Nature文章,Jeffery Dangl組作品。這篇文章分析擬南芥細菌組在低磷條件下參與磷吸收,有規律發現,有實驗驗證,絕對前沿的微生物組研究,正文每一個組圖都相當於10分文章的工作量,專業而細致,推薦閱讀
圖2有7個子圖,信息量非常大,我只說其中的e圖
圖2.e 重組菌體系在不同樣品中各菌的相對豐度。
1. 圖中元素解釋
- X軸標簽isolate上面的名稱為實驗用菌的編號;本實驗為人工重組微生物組體系,標簽為作者定義的菌編號。自然微生物組鑒定體系一般會聚類為OTU-1/2/3…樣式編號;
- 右側Y軸標簽為實驗組的名稱,共分兩列:第一列為材料基因型名稱,如Col-0, phf1等;第二列為條件,本實驗中為磷濃度;兩者組合為一個實驗組,每個實驗組每組均為6次生物學重復,其中接種起始混合液Inoculum有4次重復;
- 左側顏色圖例Abundance(%),來表示圖中顏色的深淺所對應的數值范圍,即白色為0,由淺到深連續變化范圍,其中刻度對應的顏色豐度為0.01%, 0.14%和2.71%,至最深紅棕色;
- 主圖區中深淺的色塊,代表每組樣品每個菌相對豐度的值。
2. 圖表結果:展示人工重組菌(起始接種Inoculum濃度相近)在不同實驗組中發展成細菌群落后的相對豐度,發現突變體中一些菌的相對豐度發生變化;
3. 經驗和技巧:一般OTU或菌的豐度間重復不是很好,尤其是自然樣品豐度差異大,需要經過對數變換或做Z-score標准化;而本實驗是重組體系,起始菌濃度相當,比較適合原始值直接繪制熱圖;此外,在擴增子研究中,實驗個體間波動很大,一般熱圖呈現規律不明顯,如上圖,所以低水平文章很少用,一般只有頂級雜志敢用,尊重事實,尊重個體差異,相信統計上的差異。下面一篇文章也是如此
 
示例2. 熱圖+樣品聚類展示菌相對豐度(log2%)
 
這篇文章也是Dangl組的,是最早植物人工重組菌群的文章,研究了植物水楊酸對微生物組的影響,開山之作值得閱讀
圖2C. 熱圖展示豐度顯著差異的菌在所有樣品中的相對豐度(相對豐度百分數%經log2對數變換)
1. 圖中元素解讀
- 左側聚類圖為所有樣品聚類的結果,左上角的圖例代表三大類樣品,紫、灰和綠它們分別代表接種菌、土壤和根樣品,顏色標簽在熱圖中第一列,用以區分樣品組; 
- 右側為圖的主圖區,展示左側樣品中對應篩選的14個差異豐度菌的相對豐度值,豐度值百分比采用log2轉換來縮小數據范圍,並按從小到大對應的顏色梯度為藍、白、紅,即越紅越高,越藍越低。對應的圖例為下方左上角的Color Key;
- 右側正文區上方紅上或藍下箭頭,代表這些菌的表達樣式,為上調或下調,對應的圖例為下方圖例區的左下方(EC-enriched/depleted);
- 右側正文區下方菌的標簽上還有顏色,對應最下面圖例區的菌門信息;同時菌還繼續分為兩類,穩定定殖者(Robust Colonizers)和偶然或非定殖者(Sporadic or Non-Colonizers)。
2. 圖表結果:圖中展示了人工重組的菌在接種后,也可以形成豐度各異的微生物群體,並與自然條件下很多樣式保持一致。
4. 圖表結論或規律:受水楊酸調控差異表達的菌,可以在人工重組實驗中得到驗證。
5. 圖片優點:配色采用紅白藍,比較嚴肅;圖中添加了聚類信息、分組信息和菌分類為信息,極大的增加了圖片的信息和可讀性。有些熱圖信息量大,標簽太小或根本無標簽導致理解困難,此圖的做法值得學習。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM