多組學分析及可視化R包 - 碼上歡樂

相關內容簡體繁體

多組學分析及可視化R包

本文轉載自查看原文 2020-03-30 13:01 4263 多組學/ R編程

最近打算開始寫一個多組學（包括宏基因組/16S/轉錄組/蛋白組/代謝組）關聯分析的R包，避免重復造輪子，在開始之前隨便在網上調研了下目前已有的R包工具，部分羅列如下：

1. mixOmics

應該是在多組學領域知名度最高的一個R包，有專門的團隊，做了十余年了，引用量也比較高。

官網：http://mixomics.org/
文章：mixOmics: An R package for ‘omics feature selection and multiple data integration
Github：https://github.com/mixOmicsTeam/mixOmics
Bookdown：https://mixomicsteam.github.io/Bookdown/

特點：

組學數據廣，基因/轉錄/蛋白/代謝都有涉及（是我的榜樣）；
獨特的多變量降維分析和可視化方法（我統計沒學好，所以不做太多統計方法，重點在於可視化，包括多種關聯角度的展示方式）。

主要內容：
統計方法：PCA/IPCA/CCA/PLS/PLS-DA/MixMC/MINT/DIABLO
可視化：2D和3D散點圖/相關性網絡/聚類/相關性圈圖/箭頭圖/DIABLO圈圖/載荷圖

此外，這個包還自帶了不少demo數據，具體可看官方文檔。

2. tRanslatome

2014年就發表了，好在一直都有維護。
文章：tRanslatome: an R/Bioconductor package to portray translational control
Bioconductor：https://bioconductor.org/packages/release/bioc/html/tRanslatome.html
作者博客：http://www.mybiosoftware.com/tag/translatome
Github：https://github.com/tomateba/tRanslatome（五年前的源碼）

特點：

組學：主要是針對基因表達量的關聯，包括轉錄組、翻譯組和蛋白組；
統計方法：Rank Product, Translational Efficiency, t-test, Limma, ANOTA, DESeq, edgeR
可視化：scatterplots, histograms, MA plots, standard deviation (SD) plots, coefficient of variation (CV) plots

3. OmicsARules

最近新出的一個R包，創建了一種新的關聯方法。

文章：OmicsARules: a R package for integration of multi-omics datasets via association rules mining
Github：https://github.com/BioinformaticsSTU/OmicsARules

特點：

主要針對基因組和轉錄組數據，包括基因突變位點和非編碼RNA；
發明一種Lamda3的度量方法創建關聯規則，可視化不是重點。

4. iCluster / iClusterPlus

十年前開發的iCluster算法（聯合潛在變量模型），針對癌症數據多組學聚類。去年的時候又開發了一個新的iClusterPlus包，做了一些升級。

文章1：Integrative clustering of multiple genomic data types using a joint latent variable model with application to breast and lung cancer subtype analysis
Github：https://github.com/cran/iCluster
Bioconductor：https://bioconductor.org/packages/release/bioc/html/iClusterPlus.html
文章2：A fully Bayesian latent variable model for integrative clustering analysis of multi-type omics data

這種基於模型算法的工具我只能望洋興嘆，會用就不錯了。

5. integrOmics

十多年的工具，雖然當年發了Bioinformatics，后面沒有維護更新，廢了。

文章：integrOmics: an R package to unravel relationships between two omics datasets
Github：https://github.com/cran/integrOmics

6. moCluster

這也是一種算法，和icluster類似，主要整合數據聚類，用於細胞或疾病分子分型等。應用場景相對比較單一。

7. MCIA

這個包又可稱omicade4: Multiple co-inertia analysis of omics datasets，即多元協慣量分析。一種多元統計分析方法，類似於PCA的展示吧，比較有限。

Bioconductor：http://bioconductor.org/packages/release/bioc/html/omicade4.html
Github：https://github.com/aedin/omicade4

8. 其他

其他還有不少R包做組學數據整合，或是基於新的算法，或是僅針對基因突變和基因表達關系等方面進行關聯，相對而言比較冷門，如：

CNAmet
PLRS
NuChart
MOO
Mergeeomics（這個包主要做GWAS/TWAS/EWAS/eQTL等，有點意思）

除了以上常用的R包，更多的多組學工具和方法可參考這一篇綜述：https://jme.bioscientifica.com/view/journals/jme/62/1/JME-18-0055.xml

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 可視化數學分析軟件：MATLAB R2021a for Mac MetaboAnalyst的多組學分析 R語言的可視化可視化數據包分析工具-CapAnalysis R語言——limma包進行多組差異表達分析 R語言代寫生存分析數據分析可視化案例汽車數據的可視化分析（R） R語言可視化之箱圖 R語言可視化--ggplot函數 R語言可視化--顏色

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM