illumina SNP 芯片轉基因型矩陣


一、芯片數據

此次拿到的illumina芯片數據並不是原始的數據,已經經過GenomeStudio軟件處理成了finalreport文件,格式如下:

之前沒處理過芯片數據,對於這種編碼模式(Forward,top AB)的基因型數據很疑惑,查了很多資料,收效甚微。看過建明大神對芯片這塊兒的介紹,發現里面的門門道道太多了,也有些R包可以直接處理芯片原始數據的;問題是我沒有最初的原始數據啊OTZ。最后找打一個比較靠譜的工具,直接根據finalreport文件和map文件轉格式。

 

二、工具

工具:SNPchimpRepo,廢話不多說,直接給地址:https://github.com/nicolazzie/SNPchimpRepo ,win,linux,mac三個平台都能用,這里給個贊。map文件要自己構建一個,plink輸出的map文件格式就行,這里注意一點,finalreport文件中的SNP Name 一定要包含在map文件中,否則轉換的時候會報錯。

 

三、格式轉換

我的數據比較少,電腦沒有安裝合適版本的python,直接使用win平台做轉換操作。下載軟件后解壓進入目錄SNPConvertGUI_WinMac,解壓SNPConvert_WIN64bit.zip,這個就是軟件主體,雙擊直接使用。

軟件界面如下:

然后加載我們的finalreport文件:

然后選擇我們自己構建的map文件,操作方法同上。然后后面的allele code 可以不用管,選啥輸出結果都一樣,群體ID可以不填,有默認值,這里我填寫的pop1,輸出文件前綴,隨意填寫即可,最后點擊 轉換按鈕等待結果,數據越大耗時越長,不過通常幾十秒搞定。

我的是50k的SNP芯片,106個個體,當然芯片的個體數不可能這么小的,不然達不到起訂量的,寫這個簡易教程用這點數據做示范啦。最后結果也在日志中給出了。拿到ped和map文件后,就可以進行后面的質控和分析啦。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM