擴增子圖片解讀7三元圖


三元圖/三元相圖 Ternary Plot
三元圖有6種英文叫法,其中ternary plot最為常用。三元圖是重心圖的一種,它有三個變量,但需要三者總和為恆定值。在一個等邊三角形坐標系中,圖中某一點的位置代表三個變量間的比例關系。常用於物理化學、 岩石學、礦物學、冶金學和其它物理科學,用於表示在同一個系統中三組分間的比例。在群體遺傳學中,它被稱做Finetti圖;在博弈論中,常被稱為simplex圖。 
 
在高通量測序分析領域中,最常用的是兩組間的比較,展示的方式有火山圖、曼哈頓圖等,而三組互相兩兩比較需要展示三個圖嗎?就沒有更好的展示方式了嗎?三元圖的引入解決了這一問題。近年來,常用於展示三組間的相對基因表達或OTU豐度,即美觀,又有意義。
 
三元圖的傳統應用
 
上圖示例是化學領域中傳統應用,展示在空氣中(氧21%,氮79%)中混入甲烷(可燃氣體)時可燃的范圍。圖中藍色線上的任意點,代表其中氧和氮始終保持21:79的比例關系,正是空氣的基本性質,即使有甲烷混入氧氮的比例始終恆定;深黃色區域為甲烷在此區域范圍內的含量條件下才可燃;而藍線與深黃區域重合部分,表示只有在空氣中混入這一濃度范圍內的甲烷才是可燃的。
這部分是科普下背景,看不懂沒關系,本文下面重點細講在生物學擴增子分析中的應用。
 
三元圖點位置的讀法
快速看誰多誰少
 
快速理解位置意義:重心圖,你看目標點離那個角近,就是它在相應的組中相對比例高;反之離某個角遠,其相對比例也低。
 
精確讀三組比例
 
1. 雙平行線/小等邊三角形法:由點向底邊做兩條平行線建立小正三角形,將底邊分成三段,中間為頂部組所占比例,左段為右側組比例,右段為左側組比例。
2. 垂線法:點向三條邊做垂線,穿越的格數,即對角組中所占比例;
3. 向各邊零坐標方向作平行線法:按坐標系組的顏色和數值直接讀各組比例;(圖中所示方法,A和B均略大於0.3,而C接近0.4)
 
三元圖規律
 
三角形邊平等線上的點,在平行線對應的頂點組所占比例是恆定的。
頂點到底邊直線上的點,上面任意點中兩底角組相對比例恆定。
 
三元圖點大小的意義
 
通常代表基因/OTU的相對表達/豐度,而且為了防止點過大或過小,數據通常還需要經過log2變換,將表達范圍從0-1百萬,轉換為0-20的區間;如果是OTU的千分比,則轉換為0-10的區間。
 
三元圖優點
 
打破了普通兩兩比較火山圖展示方式,可將三組兩兩比較和三組的相對關系展示在同張圖中;
兩組只能比較一次,三組可以比較三次,可説的結果非常多;
三是個非常好的數字,2組比較太常見且單調,4組及以上信息量大讓人暈,三組正好高端大氣上檔次,而且還有內涵。
 
三元圖繪制工具
 
我用過Sigmaplot可以輕松繪制,引文有origin的繪制教程。其實喜歡用R語言的朋友,有很多包可以選擇,如grid、ggplot2、ggtern,其中以ggtern最為簡便。
 
看圖實戰(Result)
 
示例1. 三元圖展示底角兩組共有和特有顯著富集OTU
這篇文章分析大麥不同生態位和不同品種間細菌組間的差異。文中正文使用了3個三元圖
圖3.A 展示大麥根部土壤、根際和根三種分態位間差異的OTU,並結合餅形圖展示這些顯著差異OTU的分類學門/綱水平信息。
1. 圖中元素解釋
- 圖中三個頂點上、右、左,分別代表三個實驗組,分別是土壤(Soil)、根際(Rhizosphere)、根(Root)
- 圖中的點代表每個OTU,作者只篩選了相對豐度高於0.5%的數百個OTU在圖中展示(此圖點超過300點重疊起來實在看不清);
- 點的大小代表OTU的相對豐度,是三組所有樣品的平均豐度,通常是千分比,再經log2變換,轉換數值范圍為0-10之間;
- 圖中點的顏色用於標出顯著差異的OTU的類型;本實驗以Soil為對照,分兩次比較篩選到了Root和Rhizosphere中顯著富集的OTU,再將這兩組富含OTU中的共有部分標為青色(RR OTUS,即根和根際均富集的OTU);而只在Root中特異顯著富含的標為藍色(Root OUTs);只有Rhizosphere中特異富集的OTU標為粉色;
- 圖中的虛線和數字是各組的坐標系刻度,方便讀出每個點在三者中的比例;
- 圖中點的位置代表該豐度在三個組中的相對比例;以圖中唯一的粉色點為例,它偏向於右角的根際組,在此組中豐度最高,采用等邊三角形法可讀出Rhizosphere在三組間的比例為50%左右,相當於其它兩者之和,因此為根際組中特異顯著富集的OTU;
- 三元圖中用顏色標出了三組顯著集的OTU,下面用餅形圖進一步補充了這三組的物種分類門水平組成,便於觀察變化的是那一類菌;
2. 圖表結果:與土壤相比,根中有許多特異富集的OTU,它們主要是beta或gama變形菌門;根際中富集的OTU大部分與根中相同,且主要來自於擬桿菌門(bacteroidetes);根際中特異富集的OTU只有1個,來自放線菌門(Actinobacteria)。
3. 經驗和技巧:本圖實際上是用三元圖代替了Root和Rhizosphere顯著富集OTU比較的Venn圖,圖中青色為兩組共有的部分,藍和粉為特有的部分。同時將每個OTU在三組間的相對關系和平均豐度展示出來,信息量大,感覺上比Venn圖更直觀和可靠。結合餅形圖可進一步顯示差異OTU的分類情況,如門、綱、目、科或屬等級別,使發現的規律一目了然。
 
常見問題
 
1、為什么有些點更接近各組的頂點,卻不是顯著富集的OTU? 
因為計算是否顯著富集的OTU,不僅與OTU相比對照組富集倍數有關,還有測序量、組內樣品間的重復情況等有關,只有綜合多方面因素統計,並通過人為設計的顯著性P-value值(常用0.05, 0.01或0.001)時才被記為顯著富集的OTU。
2、物種分類學名稱不認識 
我也認識的不多,見的越多,認識的越多。起碼常見的幾個高豐度的門要認識,如Proteobacteria變形菌門、Actinobacteria放線菌門、Bacteroidetes 擬桿菌門和Firmicutes厚壁菌門一定要認識。
3、上圖中物種注釋中有門、有綱,是怎么回事? 
除Proteobacteria以外都是門水平注釋,由於Proteobacteria豐度極高,因此作者將變形菌門中高豐度的alpha, beta, gamma綱單拿出來進一步說明發現的規律,這種方法在分析結果中較常用
 
示例2. 雙三無圖展示不同區域特異OTU,同對比較基因型間變化
這篇文章分析了百脈根根瘤的微生物組成,同時在根瘤缺失突變體條件下發現根和根際微生物均有較大差異的變化。
文中正文兩個組圖中使用了3個三元圖,附錄中5個圖使用了10個三元圖。純分析發的PNAS。可見三元圖很有市場
圖4.A/B 三元圖展示同一基因型百脈根不同取樣區域/生態位(Compartment)中特異OTU。
C/D 用箱線圖進一步展示上面發現的每類顯著富集OTU的總體相對豐度
1. 圖中元素解釋,以A圖為例
- 最上方的黑體加粗Wild-type表示此圖的材料類型為野生型,與B圖中的Mutant突變體對應;
- 圖中三角頂點分別為三種compartment,括號中數量為此組中顯著富集的OTU數量;
- 圖中點的大小代表三組樣品的組內平均值,再求平均值的相對豐度
- 位置代表在三組中相對比例,離那個頂點近就是其在此頂點組相對於其它組更高;
- 顏色代表OTU在三組中兩兩比較的顯著富集情況,與上圖只比較了兩次不同;此圖比較了6次,以Soil特異富集的棕色OTU為例說明:先進行Soil與Root比較確定Soil中顯著富集的OTU,再將Soil與Rhizosphere比較確定Soil中顯著富集的OTU,再將這兩組顯著富集OTU取交集,並將圖中相應的點標記為棕色;同理另外兩組Root和Rhizosphere中標記顯著富集的OTU,都是需要兩次比較,再取並集得出來的。可見此圖的計算過程有多大的工作量。圖中其它非兩次比較顯著富集共有OTU均標為灰色,作為背景色。
- 下面的箱線圖對應上方的三元圖,展示這些找到的各compartment特異的OTU在不同部分中的相對豐度分布;
2. 圖表結果:圖中顯示了各實驗組中相對於其它兩組特異富集的OTU的數量和相對豐度情況,而且看到了野生型(A)和突變體(B)中明顯的變化,如突變體中根特異的OTU減少,而根際特異增加這種明顯的樣式,以說明該基因對根和根際微生物組的影響。
3. 經驗和技巧:三元圖三組特異富集圖(本圖樣式),本質上是6次兩兩比較和三次韋恩圖比較的結果,信息高度概括,並從多方面展示,非常值得使用;同時兩個三元圖並列,讓讀者去找差異,即讓讀者參與,又讓發現的差異深入人心;本圖結合箱線圖,進一步展示找到的差異,從豐度水平進行對比,結果更直觀


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM