Qiime安裝
參考資料:http://blog.sina.com.cn/s/blog_83f77c940101h2rp.html
Qiime script官方說明http://qiime.org/scripts/index.html
一般ITS數據簡要分析過程
reference下載:https://github.com/downloads/qiime/its-reference-otus/its_12_11_otus.tar.gz
其中97_* 和99_*分別是相似度97和99的reference
以下過程僅做參考,具體根據詳細項目更改,
1 質控
對數據進行質量控制,去除低質量數據
2 拼接
針對不同平台數據,采用相應的拼接軟件拼接,根據contig長度,方差,N50(主要)等指標使用最佳k-mer值
3 pick_otus.py
官方文檔:http://qiime.org/scripts/pick_otus.html;
從fasta文件中提取OTUs,提取方法可選,具體有cd-hit,blast,Mothur,usearch等等
具體使用方法:
python pick_otus.py -i seqs.fna -o picked_otus_default
-i參數指定輸入序列,-o參數指定輸出文件目錄,輸出文件為seqs_otus.txt和seqs_otus.log,-m可指定提取方法,更多具體參數說明參見官方文檔
4 assign_taxonomy.py
官方文檔:http://qiime.org/scripts/assign_taxonomy.html
使用下載的reference中的rep_set和 taxonomy文件夾中對應的文件,對序列分類,使用方法:
python assign_taxonomy.py –i seqs.fna -r <otus_dir>/rep_set/97_otus.fasta -t <otus_dir>/taxonomy/97_otu_taxonomy.txt
更多具體參數說明參見官方文檔,輸出文件示例:tax_assignments.txt
5 make_otu_table.py
官方文檔:http://qiime.org/scripts/make_otu_table.html
將提取出的seqs_otus.txt和分類文件tax_assignments.txt制作成out_table,即.biom文件
使用方法:
python make_otu_table.py -i otu_map.txt -t tax_assignments.txt -o otu_table.biom
6 pick_open_reference_otus.py
官方文檔:http://qiime.org/scripts/pick_open_reference_otus.html
以上三個步驟可以通過Qiime中自帶的pick_open_reference_otus.py流程完成,將需要使用到的參數寫到文件params.txt中,並通過-p參數調用,param文件說明文檔: http://qiime.org/documentation/qiime_parameters_files.html
7 summarize_taxa_through_plots.py
官方文檔:http://qiime.org/scripts/summarize_taxa_through_plots.html
統計各個樣品中的OUT中物種豐度信息,並從門綱目科屬水平分別繪制物種豐度bar圖
python summarize_taxa_through_plots.py -o taxa_summary -i otu_table.biom 在輸出文件夾中,雙擊html文件即可觀察bar圖
8 alpha_rarefaction.py
官方文檔:http://qiime.org/scripts/alpha_rarefaction.html
對拼接后的reads
使用示例:python alpha_rarefaction.py -i otu_table.biom -o arare/ -m map.txt,對reads進行隨機抽樣,得到的序列數和out數目比較,做出稀釋曲線圖,得到同樣可以通過html文件查看
9 alpha_diversity.py
官方文檔:http://qiime.org/scripts/alpha_diversity.html
使用示例:python alpha_diversity.py -i otu_table.biom -m chao1 -o adiv_chao1.txt,單樣品多樣性分析,繪制Alpha多樣性bar圖
10 統計.biom文件長度,並選取最短長度作為beta多樣性的深度參數
可以借助ipython工具中提供的biom summarize-table方法,選取最短長度n,作為下一步驟中-e 參數(覆蓋深度)
11 beta_diversity_through_plots.py
官方文檔:http://qiime.org/scripts/beta_diversity_through_plots.html
該流程包含beta_diversity.py principal_coordinates.py make_prefs_file.py三個腳本,能夠給出(un)weignted unifrac距離矩陣,並做出2D和3D的PCoA圖形
使用示例:python beta_diversity_through_plots.py -i otu_table.biom -o bdiv_even100/ -m map.txt -e 100,使用-p參數指定距離范式