參考:https://zhuanlan.zhihu.com/p/340449764
Base calling是一種算法(軟件):可以從row images(原始圖像)里通過計算機視覺的方式識別鹼基類型(DNA序列),將結果寫到cal文件里,最后幫助我們生成測序報告和FastQ數據。
Base Flourescence:熒光
signal detection:信號檢測
每一次保存圖像后,算法軟件會找到每一個DNB (DNA納米球) ,並將數據記錄在案。因為每一個芯片上都有數以億計的DNB,所以我們也會通過特殊的結構設計,讓算法軟件可以更容易的找到並識別每一個DNB。
一旦找到並識別出DNB,接下來我們就可以提取圖像光強(灰度值)。這里我們采用的是4熒光系統,也就是ATCG四種鹼基會表現出不同的激發反應,會得到不同的灰度值。這里,我們可以看到在第三張表格里,A對應的圖像位置灰度值最高,所以可以判定此處的鹼基是A。
上圖是一張簡化示意圖,每一個正方形的區域都是一個視野FOV(Field of View),也就是說每次拍照后,攝像機只能看到這么大的區域,當然通過移動,可以隨后通過多FOV拼接技術,還原整個芯片的大視野。這里,四種熒光物質會被激光激發,如果是A則會產生綠光,如果是C會得到紅光,如果是G會得到藍光,如果是T則會得到黃光。
圖像配准和灰度值提取
首先我們會找到一些標記點(crosspoints),然后對每一個小塊的4幅圖像進行配准(registration),最后對每一個DNB位置上的灰度值進行讀取。理想狀態下,相應顏色鹼基的灰度值最大,其他非相應鹼基的顏色最好為0。然而實際上無法做到。會存在crosstalk現象,也就是其他非相應鹼基的熒光物質也會或多或少地被激發,對實際的測量會造成影響。