QIIME2使用方法

本文轉載自查看原文 2019-06-16 22:53 2728 qiime2/ 生信學習

激活qiime2的執行環境：source activate qiime2-2019.4
如何查看conda已有的環境：conda info -e

以下分析流程參考：https://docs.qiime2.org/2019.4/tutorials/qiime2-for-experienced-microbiome-researchers/

1、數據准備

現在我們常用的就是這種格式的數據，每個樣品一對數據文件

數據來源：https://docs.qiime2.org/2019.7/tutorials/importing/

wget \
  -O "casava-18-paired-end-demultiplexed.zip" \
  "https://data.qiime2.org/2019.4/tutorials/importing/casava-18-paired-end-demultiplexed.zip"

下載解壓后，文件夾中文件如下：

2、將數據轉換為qza格式（qiime新定義的自己的格式類型，有點編程中對象的含義）

qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \ --input-path casava-18-paired-end-demultiplexed \ --input-format CasavaOneEightSingleLanePerSampleDirFmt \ --output-path demux-paired-end.qza

3、查看數據質量
qiime demux summarize --i-data demux-paired-end.qza --o-visualization demux-summary-1.qzv
用以下命令查看結果：
qiime tools view demux-summary-1.qzv

4、雙端序列合並成單端

qiime vsearch join-pairs --i-demultiplexed-seqs demux-paired-end.qza --o-joined-sequences demux-joinded.qza

5、查看對merge后的數據質量情況

qiime demux summarize --i-data demux-joinded.qza --o-visualization demux-summary-merged.qzv

qiime tools view demux-summary-merged.qzv

##### 以下是使用dada2進行數據去噪，本教程先跳過該步，之后有專門教程介紹dada2使用

4、對數據進行剪切

雙端：
qiime dada2 denoise-paired \
  --i-demultiplexed-seqs demux-paired-end.qza \ --p-trim-left-f 13 \ --p-trim-left-r 13 \ --p-trunc-len-f 150 \ --p-trunc-len-r 150 \ --o-table table.qza \ --o-representative-sequences rep-seqs.qza \ --o-denoising-stats denoising-stats.qza

單端：

qiime dada2 denoise-single \
  --i-demultiplexed-seqs demux-joinded.qza \ #輸入應該也是序列，不能是joined對象 --p-trim-left 13 \ --p-trunc-len 150 \ --o-table table.qza \ --o-representative-sequences rep-seqs-merged.qza \ --o-denoising-stats denoising-stats-merged.qza

https://forum.qiime2.org/t/demultiplexing-and-trimming-adapters-from-reads-with-q2-cutadapt/2313

以下參考：

https://blog.csdn.net/woodcorpse/article/details/86685524

https://mp.weixin.qq.com/s/6cLzyJjWQmHm82_U6euJ1g

5、序列質控

qiime quality-filter q-score-joined \
--i-demux demux-joinded.qza \
--o-filtered-sequences demux-joined-filtered.qza \
--o-filter-stats demux-joined-filter-stats.qza

輸出結果:

demux-joined-filter-stats.qza: 統計結果
demux-joined-filtered.qza: 數據過濾后結果

6、用deblur去冗余，並生成特征表（相當於QIIME1的OTU Table）

qiime deblur denoise-16S \
--i-demultiplexed-seqs demux-joined-filtered.qza \
--p-trim-length 250 \
--p-sample-stats \
--o-representative-sequences rep-seqs.qza \
--o-table table.qza \
--o-stats deblur-stats.qza

輸出結果:

rep-seqs.qza: 代表序列
deblur-stats.qza: 統計過程
table.qza: 特征表

備注：

由於DADA2和Deblur產生的“OTU”是通過對唯一序列進行分組而創建的，因此這些OTU相當於來自QIIME 1的100%相似度的OTU，通常稱為序列變體。在QIIME 2中，這些OTU比QIIME 1默認的97%相似度聚類的OTU具有更高的分辨率，並且它們具有更高的質量，因為這些質量控制步驟比QIIME 1中實現更好。因此，與QIIME 1相比，可以對樣本的多樣性和分類組成進行更准確的估計。

7、查看deblur去冗余后的特征表

qiime feature-table summarize \
--i-table table.qza \
--o-visualization table.qzv
--m-sample-metadata-file sample-metadata.tsv

qiime feature-table tabulate-seqs \
--i-data rep-seqs.qza \
--o-visualization rep-seqs.qzv

qiime tools view table.qzv

8、統計每個樣品包含的序列數

qiime deblur visualize-stats \
--i-deblur-stats deblur-stats.qza \
--o-visualization deblur-stats.qzv

qiime tools view deblur-stats.qzv

9、構建進化樹用於多樣性分析

qiime phylogeny align-to-tree-mafft-fasttree \
--i-sequences rep-seqs.qza \
--o-alignment aligned-rep-seqs.qza \
--o-masked-alignment masked-aligned-rep-seqs.qza \
--o-tree unrooted-tree.qza \
--o-rooted-tree rooted-tree.qza

10、需要先准備一個metadata文件，文件說明參考：https://docs.qiime2.org/2019.7/tutorials/metadata/

11、計算核心多樣性

qiime diversity core-metrics-phylogenetic \
--i-phylogeny rooted-tree.qza \
--i-table table.qza \
--p-sampling-depth 500 \
--m-metadata-file sample-metadata.tsv \
--output-dir core-metrics-results

分析結果包含：

α多樣性

香農(Shannon’s)多樣性指數（群落豐富度的定量度量，即包括豐富度richness和均勻度evenness兩個層面）
Observed OTUs（群落豐富度的定性度量，只包括豐富度）
Faith’s系統發育多樣性（包含特征之間的系統發育關系的群落豐富度的定性度量）
均勻度（或 Pielou’s均勻度；群落均勻度的度量）

β多樣性

Jaccard距離（群落差異的定性度量，即只考慮種類，不考慮豐度）
Bray-Curtis距離（群落差異的定量度量）
非加權UniFrac距離（包含特征之間的系統發育關系的群落差異定性度量）
加權UniFrac距離（包含特征之間的系統發育關系的群落差異定量度量）

β多樣性分析結果-PCoA：

12、Alpha多樣性組間顯著性分析和可視化

qiime diversity alpha-group-significance \
--i-alpha-diversity core-metrics-results/faith_pd_vector.qza \
--m-metadata-file sample-metadata.tsv \
--o-visualization core-metrics-results/faith-pd-group-significance.qzv

qiime diversity alpha-group-significance \
--i-alpha-diversity core-metrics-results/evenness_vector.qza \
--m-metadata-file sample-metadata.tsv \
--o-visualization core-metrics-results/evenness-group-significance.qzv

13、繪制稀疏曲線

qiime diversity alpha-rarefaction \
--i-table table.qza \
--i-phylogeny rooted-tree.qza \
--p-max-depth 1000 \
--m-metadata-file sample-metadata.tsv \
--o-visualization alpha-rarefaction.qzv

--p-max-depth參數的值應該通過查看上面創建的table.qzv文件中呈現的“每個樣本的測序量”信息來確定。一般來說，選擇一個在中位數附近的值似乎很好用。

14、物種組成分析

下載物種注釋數據庫制作的分類器：

wget \
-O "gg-13-8-99-515-806-nb-classifier.qza" \
"https://data.qiime2.org/2018.11/common/gg-13-8-99-515-806-nb-classifier.qza"

物種注釋和可視化

qiime feature-classifier classify-sklearn \
--i-classifier gg-13-8-99-515-806-nb-classifier.qza \
--i-reads rep-seqs.qza \
--o-classification taxonomy.qza

qiime metadata tabulate \
--m-input-file taxonomy.qza \
--o-visualization taxonomy.qzv

生成物種組成柱狀圖：

qiime taxa barplot \
--i-table table.qza \
--i-taxonomy taxonomy.qza \
--m-metadata-file sample-metadata.tsv \
--o-visualization taxa-bar-plots.qzv

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 RESTful使用方法 Iperf使用方法 ossutil使用方法 Bitbucket使用方法 idhttpserver的使用方法 ScrollMagic使用方法 jhat使用方法 quickreport 使用方法 emacs的使用方法 Swiper使用方法