初學生信——Base-calling(鹼基判讀技術)


參考:https://zhuanlan.zhihu.com/p/340449764

Base calling是一種算法(軟件):可以從row images(原始圖像)里通過計算機視覺的方式識別鹼基類型(DNA序列),將結果寫到cal文件里,最后幫助我們生成測序報告和FastQ數據。

 

Base Flourescence:熒光

signal detection:信號檢測

每一次保存圖像后,算法軟件會找到每一個DNB (DNA納米球) ,並將數據記錄在案。因為每一個芯片上都有數以億計的DNB,所以我們也會通過特殊的結構設計,讓算法軟件可以更容易的找到並識別每一個DNB。

一旦找到並識別出DNB,接下來我們就可以提取圖像光強(灰度值)。這里我們采用的是4熒光系統,也就是ATCG四種鹼基會表現出不同的激發反應,會得到不同的灰度值。這里,我們可以看到在第三張表格里,A對應的圖像位置灰度值最高,所以可以判定此處的鹼基是A。

 

上圖是一張簡化示意圖,每一個正方形的區域都是一個視野FOV(Field of View),也就是說每次拍照后,攝像機只能看到這么大的區域,當然通過移動,可以隨后通過多FOV拼接技術,還原整個芯片的大視野。這里,四種熒光物質會被激光激發,如果是A則會產生綠光,如果是C會得到紅光,如果是G會得到藍光,如果是T則會得到黃光。

 

圖像配准和灰度值提取

首先我們會找到一些標記點(crosspoints),然后對每一個小塊的4幅圖像進行配准(registration),最后對每一個DNB位置上的灰度值進行讀取。理想狀態下,相應顏色鹼基的灰度值最大,其他非相應鹼基的顏色最好為0。然而實際上無法做到。會存在crosstalk現象,也就是其他非相應鹼基的熒光物質也會或多或少地被激發,對實際的測量會造成影響。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM