mothur 計算稀釋性曲線


在微生物分析中,經常使用稀釋性曲線來評估測序量是否足夠;可以使用mothur 這個軟件來完成

rarefaction.single 命令用來做稀釋性曲線,既可以對單個樣本單獨分析,也可以一次對多個樣本進行分析

對多個樣本進行分析:以shannon 指數為例

需要准備一個shared 文件,shared 文件格式可以參考mothur官方文檔

https://www.mothur.org/wiki/Shared_file

示例shared 文件如下:

label   Group   numOtus OTU1    OTU2    OTU3    OTU4
usearch A0      792     10125   1572    23      4210
usearch A1      792     2949    1759    6268    2368
usearch A2      792     16895   3861    5576    326
usearch A3      792     1114    3895    2945    1180
usearch A4      792     770     1506    108     450
usearch A5      792     4420    4657    109     265
usearch A6      792     3538    3430    3898    643

mothur 運行的命令如下:

mothur "#rarefaction.single(shared = sample.shared,label = userach,calc = shannon, groupmode = f, processors = 20)"

運行完成之后,在sample.shared 所處的目錄下,會生成一系列文件:

1)每個樣本對應的 r_abund 文件

示例如下:

usearch 414     10125   4644    4217    4210    4110    3241

其實這個文件就是從sample.shared 中把每個樣本單獨抽出來

2) 每個樣本對應的 r_shannon 文件

示例文件如下:

numsampled      usearch lci     hci
1       0.0000  -0.0000 -0.0000
100     3.4685  3.2035  3.6901
200     3.6593  3.4758  3.7967
300     3.7319  3.6156  3.8696
400     3.7684  3.6695  3.8807
500     3.8004  3.6914  3.8794
600     3.8228  3.7240  3.9017

第一列是抽樣的次數,第二列數對應的shannon 指數的值,lci 和 hci 分別代表95%置信區間的左右邊界;

基於抽樣的次數和每次抽樣計算得到的shannon 指數的值就可以畫香濃曲線了:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM