在二代測序儀上測出的數據,通常都會表現出測序深度與GC 含量的相關性,稱為GC bias。
GC bias校正
為了后續生物信息分析更加准確,通常需要做GC bias的校正。
2010 年 steven Quake 在Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood提出將GC content畫出bin,並算出每個GC bin里的tags number的平均值,
然后將同一個GC bin里的其它depth除以這個平均的tags number值,得到一條曲線:
后來進一步改進,現在常用的LOESS回歸的方法進行GC bias校正。
GC bias程度的評估
2013年 A Single Cell Level Based Method for Copy Number Variation Analysis by Low Coverage Massively Parallel Sequencing提到一種GC bias程度的計算: