Illumina Sequence Identifiers 序列標識符 index詳解


大家基本都知道什么是 FASTA 和 FastQ 格式了,但這是不夠的。

我們還需要了解世界上最大的測序公司自己定制的 FastQ 格式,因為你可能會經常用到,有時還會親自去處理它們。

本文主題:Illumina 測序數據中的 Index

Fastq格式詳解

@FCHCGKFBCXY:1:1101:1110:2162#AACAGCACCTAGCA_GTAGTGCG/1
ATGTATACTATTGTATGTGAAATGGATCACCAGTCCAGGTTCAACGCCCGAGACAGGGTGCTCAGGGCTGGTGCACTGGATGACCCTGAGGGACGGGATG
+
cccccggegghgbgggggdfgdegfhggggdgfdgghdgggghfghhhhhghhgggdgdgghhhhghhhgghfhghdPcdgPc_dfghbdgfghhhhhgg
@FCHCGKFBCXY:1:1101:1077:2164#NNNNNNNNNNNNNN_NNNNNNNN/1
TGCTGAGCATCAGATCAACCTGATTAAGGTTGATGACAACAAGAAACTAGGGGAATGGGTAGGCCTCTGTAAAANNGANANNNNNNNNNNNNNNNNNNNN
+
ccccchhhhhhhhghhgfgghhhhhhhghhhhhhhhhhhhghhhgghghhhhgghgd_gggghhgghghhhghhBBBBBBBBBBBBBBBBBBBBBBBBBB

ILLUMINA SEQUENCE IDENTIFIERS

@HWUSI-EAS100R:6:73:941:1973#0/1

HWUSI-EAS100R:the unique instrument name

6:flowcell lane

73:tile number within the flowcell lane

941:‘x’-coordinate of the cluster within the tile

1973:‘y’-coordinate of the cluster within the tile

#0:index number for a multiplexed sample (0 for no indexing)

/1:the member of a pair, /1 or /2 (paired-end or mate-pair reads only)

 

有了index就可以同時在一個lane中測多種數據了,后期可以根據index將數據分開。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM