轉自http://www.dxy.cn/bbs/topic/35655953
1、OTU是什么?
OTU(operational taxonomic units),即操作分類單元。通過一定的距離度量方法計算兩兩不同序列之間的距離度量或相似性,繼而設置特定的分類閾值,獲得同一閾值下的距離矩陣,進行聚類操作,形成不同的分類單元。專業解釋太書面不好理解?沒事兒,給你舉個“栗子”就明白了!
2、OTU在16S測序中有何用?
高通量測序得到的16S序列有成千上萬條,如果對每條序列都進行物種注釋的話,工作量大、耗時長,而且16S擴增、測序等過程中出現的錯誤會降低結果的准確性。在16S分析中引入OTU,首先對相似性序列進行聚類,分成數量較少的分類單元,基於分類單元進行物種注釋。這不僅簡化工作量,提高分析效率,而且OTU在聚類過程中會去除一些測序錯誤的序列,提高分析的准確性。
3、OTU如何聚類?
OTU聚類的方法多種多樣,如Uclust、cd-hit、BLAST、mothur、usearch和 prefix/suffix,這些聚類方法均可以在QIIME軟件中實施。不同聚類方法基於不同的算法,得到的聚類結果雖然不同,但是大體的聚類流程都是一致的:

溫馨提示:嵌合體序列是RCR擴增時,兩條不同的序列產生雜交、擴增的序列。
4、OTU跟物種的關系
-
OTU聚類后,挑選出每個OTU中的代表序列,與RDP、Sliva或GreenGene等數據庫進行比對,進行物種注釋。
-
OTU和物種是映射關系,它們一一對應或多對一,如下圖所示。

-
在上圖中,A、B、C分別表示OTU 1、OTU m和OTU n中有A、B、C條reads,假設OTU 1和OTU m比對到物種1,那么物種1的豐度是A+B;同理假設OTU n比對到物種2,物種2的豐度是C。