全基因組選擇育種(GS)簡介


全基因組選擇(Genomic selection, GS)是一種利用覆蓋全基因組的高密度標記進行選擇育種的新方法,可通過早期選擇縮短世代間隔,提高育種值(Genomic Estimated Breeding Value, GEBV)估計准確性等加快遺傳進展,尤其對低遺傳力、難測定的復雜性狀具有較好的預測效果,真正實現了基因組技術指導育種實踐。

原理

常規育種手段主要利用性狀記錄值、基於系譜計算的個體間親緣關系,通過最佳線性無偏估計(best linear unbiased predication,BLUP)來估計各性狀個體育種值(EBVs),通過加權獲得個體綜合選擇指數,根據綜合選擇指數高低進行選留。

標記輔助選擇(marker assisted selection, MAS)育種,利用遺傳標記,將部分功能驗證的候選標記聯合BLUP計算育種值,這樣不僅可以提高育種值估計的准確性,而且可以在能夠獲得DNA時進行早期選擇,縮短世代間隔,加快遺傳進展。

而GS則通過覆蓋全基因組范圍內的高密度標記進行育種值估計,繼而進行排序、選擇,簡單可以理解為全基因組范圍內的標記輔助選擇,主要方法是通過全基因組中大量的遺傳標記估計出不同染色體片段或單個標記效應值,然后將個體全基因組范圍內片段或標記效應值累加,獲得基因組估計育種值(GEBV),其理論假設是在分布於全基因組的高密度SNP標記中,至少有一個SNP能夠與影響該目標性狀的數量遺傳位點(quantitative trait loci, QTL)處於連鎖不平衡(linkage disequilibrium, LD)狀態,這樣使得每個QTL的效應都可以通過SNP得到反映

相比BLUP方法,全基因組選擇可以有效降低計算個體親緣關系時孟德爾抽樣誤差的影響;相比MAS方法,全基因組選擇模型中包括了覆蓋於全基因組的標記,能更好地解釋表型變異。

技術路線

  • 植物GS路線
    image.png
  • 動物GS路線
    image.png

GS預期效果:

  1. 縮短育種周期,實現待選群體的低世代選留
  2. 提高育種值估計准確性
  3. 降低育種成本,減少表型鑒定的數量
  4. 預測親本雜交后代,選擇最佳雜交優勢組合

統計模型

統計模型是GS的核心,極大地影響了基因組預測的准確度和效率。根據統計模型的不同,全基因組選擇的模型大體可分為兩大類:

1. 直接法

此方法把個體作為隨機效應,參考群體和預測群體遺傳信息構建的親緣關系矩陣作為方差協方差矩陣,通過迭代法估計方差組分,進而求解混合模型獲取待預測個體的估計育種值;
image.png

2. 間接法

此方法則首先在參考群中估計標記效應,然后結合預測群的基因型信息將標記效應累加,獲得預測群的個體估計育種值。
image.png

直接法 VS 間接法

性狀遺傳構建復雜多樣,目前還沒有一種模型能廣泛適用於所有性狀。隨着全基因組選擇統計模型的不斷改進優化,模型的穩定性及准確性不斷提高,但是依然面臨兩個重要的挑戰,即計算准確性和計算效率

直接法(GBLUP為代表)計算效率較高,但是計算准確性略差於間接法(BayesB為代表),雖然學者對直接法進行了改進,但是由於改進的策略中人為設定參數較多,因此模型的預測准確性受主觀因素影響較大;

間接法計算准確性較高,但是由於參數求解過程中計算量龐大,且無法實現並行運算,而育種講求時效性,所以難以高效指導育種實踐;

因此,如何優化模型,盡可能減少人為設定參數,與機器學習方法有效結合,並融入高效可並行運算,既能保證較高准確性的同時,大大提升計算效率,是未來全基因組選擇模型優化的方向。

GS的局限

  • 1)GS主要考慮加性效應,對於顯性效應及互作效應等未納入到育種值估計模型中;

  • 2)GS目前主要在品種內進行,品種間由於遺傳背景不同,跨品種預測准確性難以保證;

  • 3)同品種間親緣關系太遠的個體育種值預測效果也不理想,如不同育種公司間由於育種策略不同,選擇方向差異,導致同品種間遺傳背景也不同,難以實現跨公司預測;

  • 4)GS只用到基因組信息,大量的多組學研究結果利用不夠充分,如何將多組學信息進行整合,通過整合組學提高選擇准確度也是目前待解決的問題;

  • 5)GS的分型個體數目越來越大,相比傳統BLUP的稀疏矩陣,利用基因組信息計算的稠密矩陣給混合模型參數估計及模型求解帶來了巨大的挑戰,通過數學或着計算機手段簡化計算復雜度,才能更高效利用龐大的基因組數據甚至其他各組學數據;

  • 6)個體分型主要是芯片技術,芯片分型具有良好的穩定性,但由於密度不足,使得全基因組選擇對LD的依賴性強,通過測序手段可以得到較高密度SNP標記從而減少對LD的依賴,同時測序方法可以捕獲不同品種間所有遺傳變異,可能實現跨品種預測,並且測序能夠得到更豐富的遺傳信息,如CNV等,對於親緣關系較近的群體,可以通過填充技術將芯片個體標記密度填充到測序水平。因此,測序技術的應用將成為全基因組選擇新時代的轉折點。

GS未來發展

盡管測序技術對GS有利,但高質量的測序結果需要更高的測序深度,意味着測序成本更昂貴,並且測序數據龐大,主流的分析軟件處理速度較慢,使用復雜繁瑣,對於計算資源的配置需求較高,因此如何快速、有效地儲存、處理及分析數據是測序技術應用於全基因組育種的重要挑戰,另外,測序只能檢測參考基因組中已知的序列和基因信息,對於未知的基因序列和基因還不能進一步深入研究。

隨着測序方法和芯片技術的不斷成熟,未來個體分型費用將不斷降低,分型准確性不斷提高,GS將逐步替代傳統育種方法。

Ref:http://www.xml-data.org/XMSYXB/html/2019/2/20190201.htm
http://www.lifescience.net.cn/html/201810/20181013.htm
http://blog.sciencenet.cn/blog-2577109-1201959.html
http://www.kangpusen.com/Server/1.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM