在微生物分析中,經常使用稀釋性曲線來評估測序量是否足夠;可以使用mothur 這個軟件來完成
rarefaction.single 命令用來做稀釋性曲線,既可以對單個樣本單獨分析,也可以一次對多個樣本進行分析
對多個樣本進行分析:以shannon 指數為例
需要准備一個shared 文件,shared 文件格式可以參考mothur官方文檔
https://www.mothur.org/wiki/Shared_file
示例shared 文件如下:
label Group numOtus OTU1 OTU2 OTU3 OTU4 usearch A0 792 10125 1572 23 4210 usearch A1 792 2949 1759 6268 2368 usearch A2 792 16895 3861 5576 326 usearch A3 792 1114 3895 2945 1180 usearch A4 792 770 1506 108 450 usearch A5 792 4420 4657 109 265 usearch A6 792 3538 3430 3898 643
mothur 運行的命令如下:
mothur "#rarefaction.single(shared = sample.shared,label = userach,calc = shannon, groupmode = f, processors = 20)"
運行完成之后,在sample.shared 所處的目錄下,會生成一系列文件:
1)每個樣本對應的 r_abund 文件
示例如下:
usearch 414 10125 4644 4217 4210 4110 3241
其實這個文件就是從sample.shared 中把每個樣本單獨抽出來
2) 每個樣本對應的 r_shannon 文件
示例文件如下:
numsampled usearch lci hci 1 0.0000 -0.0000 -0.0000 100 3.4685 3.2035 3.6901 200 3.6593 3.4758 3.7967 300 3.7319 3.6156 3.8696 400 3.7684 3.6695 3.8807 500 3.8004 3.6914 3.8794 600 3.8228 3.7240 3.9017
第一列是抽樣的次數,第二列數對應的shannon 指數的值,lci 和 hci 分別代表95%置信區間的左右邊界;
基於抽樣的次數和每次抽樣計算得到的shannon 指數的值就可以畫香濃曲線了: