【百奧雲GS專欄】全基因組選擇之工具篇



前面我們已經介紹了基因組選擇的各類模型,今天主要來了解一下做GS有哪些可用的軟件和工具。基因組選擇處在熱門研究階段,每年都有不少新工具開發出來,可分析的軟件非常之多,為了便於大家更加清晰地了解,這里我將它們分為免費開源包/庫、成熟軟件、WEB/GUI工具三類,用戶使用難度依次降低。

1. 免費開源包/庫

R和Python語言作為開源軟件的代表,在數據分析領域有着不可替代的優勢。近幾年大部分GS分析軟件都是由這兩種語言開發。免費開源的R包或者Python庫使用起來比較靈活,可根據用戶的具體需求隨時變化參數來獲得最佳性能,但對使用用戶而言需要有一定的數據分析基礎。

1.1 R包

1.2 Python庫

  • SeqBreed
    https://github.com/miguelperezenciso/SeqBreed
    主要能實現常見的BLUP類模型,也可以靈活地評估特定場景中地遺傳結構,如QTN數目、作用及性狀數量等來提升預測性能。

  • 常見機器學習Python工具:經典機器學習模塊如sklearn,深度學習框架如Karas、TensorFlow、PyTorch等。

2. 成熟軟件

動物基因組選擇發展較早,因此成熟的遺傳評估軟件一開始是專門為動物育種而設計開發,只有其中一部分功能適用於植物育種。

早期的軟件一部分是商業軟件,使用需付費。一部分雖然免費,但允許使用的數據量小,商用需授權。它們大多用FORTRAN、C等語言編寫,運行穩定且運算較快。但模型比較單一,基本都是通過混合線性模型來評估遺傳參數,建立的大多是BLUP類模型。

近幾年越來越多的高性能免費軟件趨於成熟,隨着海量數據的積累和實際應用的需求,這類軟件將顯得越來越重要。

3. WEB/GUI工具

基於網頁或圖形界面的工具目前還較少,因此對於普通用戶使用GS技術,仍有一定的門檻。以下幾個工具僅供參考。

以上僅列出了常見的GS分析工具及其簡介,更多的軟件未能一一列出(如數據前期的清洗、指標評價、數據可視化等),具體的用法也可以去查看對應的文檔。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM