做完mapping之后,需要知道mapped reads在基因組上的分布,所以嘗試在ubuntu系統中使用IGV軟件,簡單記錄使用過程,如下:
1.下載IGV軟件
去IGV官網: http://www.broadinstitute.org/software/igv/download,下載 binary distribution類型軟件
2.運行IGV軟件
軟件下載后,直接解壓。在命令行運行:sh IGV_2.3.77/igv.sh,打開IGV界面。
注意:IGV 需要java運行環境,另外ubuntu系統需要安裝X11
3.設定基因組
軟件提供了一些基因組供直接選擇,若需要的基因組不在選向范圍內可以自己導入基因組,方法:
1)對基因組建立index:samtools faidx genome.fa,得到名為genome.fai的index文件
2)上傳基因組,軟件不支持壓縮格式:Genomes->Load Genome from File->選擇genome.fa並打開
4.打開mapping得到的BAM文件
1)sort BAM 文件:samtools sort sample.bam -o sample.sort.bam
2)對BAM文件建立index:samtools index sample.sort.bam
3)上傳sort后的BAM文件:File->Load from File->選擇sample.sort.bam並打開
5.查看展示的結果
Integrative Genomics Viewer(IGV) 是一種探索大型綜合基因組數據的高性能交互式可視化工具。它支持各種各樣的數據類型,包括基於芯片測序、二代測序數據和基因組注釋數據等。詳細信息:http://www.broadinstitute.org/software/igv/
1、使用igvtools 將*.bam文件轉換成相應的*.tdf文件(節省空間),*.tdf文件有其對應的可查看的文本*.wig文件。
在大型機上將igvtools壓縮包上傳到個人工作目錄,解壓,然后在.bashrc_programs中加載包的路徑即可使用。格式轉換命令如下:
igvtools count -z 5 -w 25 *.bam *.bam.tdf hg19
igvtools count -z 5 -w 25 *.bam *.bam.wig hg19
(help文件說tdf和wig可以同時轉,中間用逗號隔開即可)
-z 分配最大的zoom level 水平
-w 每個track記錄的鹼基數
…
**提示:使用igvtools命令時要使bam.bai文件(bam的索引文件,可用samtools的index命令建立索引文件)與bam文件在同一個文件夾中
(更多參數參見http://www.broadinstitute.org/software/igv/igvtools_commandline 或者 igvtools help count)
2、本地安裝igv 在igv官網下載界面進行下載
(http://www.broadinstitute.org/software/igv/download)
windows用戶下載 Download Binary Distribution ,下載后解壓,運行igv.jar 文件即可
再用file -> load from file 選項導入*.tdf文件,在導入文件之前要選則自己需要的參考基因組,在此包括人、牛、馬、雞、猩猩、狗、小鼠、線蟲、果蠅、噬菌體等等。
3、導入后查看填寫圖片摘要(選填
1)在選擇感興趣的區域時,應先單擊染色體,當按鈕從灰色變成有紅色時再點擊它,並在染色體區域選擇感興趣的起始位置即可,無需拖拽。
2)選擇想要查看的基因列表,如下圖所示
3)輸入序列集以及參考基因組的各項參數調整。
包括調整每個track的顏色、高度,字體大小,圖形的表現形式(包括熱圖、條形圖、點圖、線圖)以及一些其他圖示參數。參考基因組的展現形式包括collapsed、expanded、squished三種。
4)一些更深入的調節與查看
View –>preference 則出現以下圖框,有多重參數調整,具體的選擇根據個人需要而定。
View ->color legends 調整相應圖標的顏色(這是在包含有這些數據類型的輸入數據可做的顏色調整)
5)一些快捷鍵的使用參見
http://www.broadinstitute.org/software/igv/keyboard_shortcuts
4、圖片下載
File –>save image 選擇存儲路徑即可