擴增子分析QIIME2-2數據導入Importing data


# 激活工作環境
source activate qiime2-2017.8

# 建立工作目錄
mkdir -p qiime2-importing-tutorial
cd qiime2-importing-tutorial
導入帶質量值的測序數據
地球微生物組標准混樣單端數據 “EMP protocol” multiplexed single-end fastq
此類數據標准包括兩個文件,擴展名均為fastq.gz,一個是barcode文件,一個是樣品混樣測序文件。
# 建樣品目錄
mkdir -p emp-single-end-sequences

# 下載 barcode文件
wget -O emp-single-end-sequences/barcodes.fastq.gz https://data.qiime2.org/2017.8/tutorials/moving-pictures/emp-single-end-sequences/barcodes.fastq.gz

# 下載序列文件
wget -O emp-single-end-sequences/sequences.fastq.gz https://data.qiime2.org/2017.8/tutorials/moving-pictures/emp-single-end-sequences/sequences.fastq.gz

# 導入QIIME2格式
qiime tools import \
  --type EMPSingleEndSequences \
  --input-path emp-single-end-sequences \
  --output-path emp-single-end-sequences.qza
地球微生物組標准混樣雙端數據 “EMP protocol” multiplexed paired-end fastq
此類數據標准包括三個文件,擴展名均為fastq.gz,一個是barcode文件,兩個是樣品混樣測序文件。
# 建樣品目錄
mkdir -p emp-paired-end-sequences

# 下載序列正向和反向文件
wget -O emp-paired-end-sequences/forward.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/forward.fastq.gz
wget -O "emp-paired-end-sequences/reverse.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/reverse.fastq.gz
 
# 下載barcode文件
wget -O emp-paired-end-sequences/barcodes.fastq.gz https://data.qiime2.org/2017.8/tutorials/atacama-soils/1p/barcodes.fastq.gz
 
# 導入QIIME2格式
qiime tools import \
  --type EMPPairedEndSequences \
  --input-path emp-paired-end-sequences \
  --output-path emp-paired-end-sequences.qza
樣品文件清單格式 “Fastq manifest” formats
# 下載fastq壓縮包zip文件,其中的樣品文件和清單文件mainfest
wget -O se-33.zip https://data.qiime2.org/2017.8/tutorials/importing/se-33.zip
wget -O se-33-manifest https://data.qiime2.org/2017.8/tutorials/importing/se-33-manifest
wget -O pe-64.zip https://data.qiime2.org/2017.8/tutorials/importing/pe-64.zip
wget -O pe-64-manifest https://data.qiime2.org/2017.8/tutorials/importing/pe-64-manifest
# 解壓fastq樣品文件
unzip -q se-33.zip
unzip -q pe-64.zip
樣品清單是包括樣品名、文件位置、文件方向三列的csv文件,以pe-64-manifest為例,內容如下:
# 樣品名、文件位置、文件
sample-id,absolute-filepath,direction
sample1,$PWD/pe-64/s1-phred64-r1.fastq.gz,forward
sample1,$PWD/pe-64/s1-phred64-r2.fastq.gz,reverse
sample2,$PWD/pe-64/s2-phred64-r1.fastq.gz,forward
sample2,$PWD/pe-64/s2-phred64-r2.fastq.gz,reverse
導入質量值不同編碼的兩類文件Phred33/64 (一般 Phred33比較常見,只有非常老的數據才有Phred64格式)
# 導入Phred33格式測序結果
qiime tools import \
  --type 'SampleData[SequencesWithQuality]' \
  --input-path se-33-manifest \
  --output-path single-end-demux.qza \
  --source-format SingleEndFastqManifestPhred33
# 導入Phred64格式測序結果
qiime tools import \
  --type 'SampleData[PairedEndSequencesWithQuality]' \
  --input-path pe-64-manifest \
  --output-path paired-end-demux.qza \
  --source-format PairedEndFastqManifestPhred64
導入OTU表Biom文件
BIOM v1.0.0
# 下載數據並導入為QIIME2的qza格式
wget -O feature-table-v100.biom https://data.qiime2.org/2017.8/tutorials/importing/feature-table-v100.biom
qiime tools import \
  --input-path feature-table-v100.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV100Format \
  --output-path feature-table-1.qza
BIOM v2.1.0
wget -O feature-table-v210.biom https://data.qiime2.org/2017.7/tutorials/importing/feature-table-v210.biom
qiime tools import \
  --input-path feature-table-v210.biom \
  --type 'FeatureTable[Frequency]' \
  --source-format BIOMV210Format \
  --output-path feature-table-2.qza
代表性序列 Per-feature unaligned sequence data
wget -O sequences.fna https://data.qiime2.org/2017.8/tutorials/importing/sequences.fna
qiime tools import \
  --input-path sequences.fna \
  --output-path sequences.qza \
  --type 'FeatureData[Sequence]'
多序列比對后的代表性序列導入(多序列比對后的序列中包括減號,表示比對的gap) Per-feature unaligned sequence data
wget -O aligned-sequences.fna https://data.qiime2.org/2017.8/tutorials/importing/aligned-sequences.fna
qiime tools import \
  --input-path aligned-sequences.fna \
  --output-path aligned-sequences.qza \
  --type 'FeatureData[AlignedSequence]'
無根進化樹導入 Phylogenetic trees (unrooted)
wget -O unrooted-tree.tre https://data.qiime2.org/2017.8/tutorials/importing/unrooted-tree.tre
qiime tools import \
  --input-path unrooted-tree.tre \
  --output-path unrooted-tree.qza \
  --type 'Phylogeny[Unrooted]'


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM