機器學習在生物信息領域可以做些什么?


用“machine learning genomics”在 biorxiv 中檢索(限定一下Bioinformatics領域),查看最新文章的標題和摘要,看看機器學習都能做些什么實際的項目。

1.Machine-learning annotation of human splicing branchpoints(RNA剪切體位點預測)

使用機器學習來注釋人類剪切體的分支點

需要有 RNA splicing 的知識,首先得搞懂 branchpoint、lariat formation的概念

2.The value of prior knowledge in machine learning of complex network systems(貝葉斯)

生物信息中復雜網絡系統中先驗知識的價值

預測病人在指定葯物或治療方案下的反應

3.Systematic assessment of multi-gene predictors of pan-cancer cell line sensitivity to drugs exploiting gene expression data(隨機森林在葯物學上的預測)

通過基因表達數據系統評估泛癌細胞系的多基因預測器對葯物的敏感性

指定的基因突變通常用於指導腫瘤病人的用葯,大規模的葯物基因組數據被用來發現這些對葯物敏感的單基因標記,最近機器學習的回歸已被用於基於分子譜的預測。基因表達數據對研究泛癌十分重要。但是還沒人研究機器學習在單基因和多基因上的差異。本文,用RF隨機森林做測試。

4.CASTOR: A machine learning platform for reproducible viral genome classification(可復制病毒基因組分類)

測序產生了大量的病毒基因組,基因組變異、分類特征和致病機制的研究非常重要,輸入新菌株的測序結果,就能將其歸於不同的病毒家族。

本軟件應用了限制片段長度多態性(RFLP),

5.Complete fold annotation of the human proteome using a novel structural feature space(蛋白質折疊)

通過新型的結構特征空間完成人類蛋白組的折疊注釋

6.A Deep Boosting Based Approach for Capturing the Sequence Binding Preferences of RNA-Binding Proteins from High-Throughput CLIP-Seq Data(RNA結合蛋白)

分析RNA結合蛋白的結合行為對理解它們在基因表達調控中的功能是非常重要的,

7.netDx: Patient classification using integrated patient similarity networks(綜合相似病人網絡)

病人的分類非常重要

8.Combining transcription factor binding affinities with open-chromatin data for accurate gene expression prediction

轉錄因子結合  開放染色質數據  准確的基因表達預測

9.Identification of new bacterial type III secreted effectors with a recursive Hidden Markov Model profile-alignment strategy(HMM)

10.Assessing Pathogens for Natural versus Laboratory Origins Using Genomic Data and Machine Learning(評估病原菌的來源)


11.Gist: an ensemble approach to the taxonomic classification of metatranscriptomic sequence data.(系統分類)

12.A Machine Learning-based Framework to Identify Type 2 Diabetes through Electronic Health Records

13.Predicting Protein Thermostability Upon Mutation Using Molecular Dynamics Timeseries Data(蛋白質熱穩定性)

14.FIDDLE: An integrative deep learning framework for functional genomic data inference(功能基因組、深度學習)

15.Monitoring the circadian clock in human blood using personalized machine learning(人血液里的生物鍾)

16.The DOE Systems Biology Knowledgebase (KBase)(公開的生物信息系統)

17.Partitioned learning of deep Boltzmann machines for SNP data(深度學習分析SNP)

18.Lowest expressing microRNAs capture indispensable information - identifying cancer types(miRNAs SVM)

miRNA主要是維持細胞內穩態,在癌症組織中,其表達明顯變化,

19.Modelling the transcription factor DNA-binding affinity using genome-wide ChIP-based data(轉錄因子DNA結合蛋白)

20.Connecting tumor genomics with therapeutics through multi-dimensional network modules(多維網絡模塊)



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM