使用GEO數據庫來篩選差異表達基因,KOBAS進行KEGG注釋分析


前言

本文主要演示GEO數據庫的一些工具,使用的數據是2015年在Nature Communications上發表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional network during muscle atrophy.[pubmed:25858807]

作者通過將FoxO1-3-4-floxed小鼠(FoxO1,3,4 f / f)與表達Cre重組酶的轉基因系在MLC1f啟動子的控制下交叉,在肌肉中特異性地產生敲除的FoxO 1,3,4以產生肌肉特異性FoxO1,3,4三重敲除小鼠。這些小鼠要么自由進食,要么飢餓,隨后分別提取4種情況小鼠的RNA,使用Affymetrix提供的試劑盒並根據標准Affymetrix方案制備,標記並與Affymetrix Mouse Genome 430 2.0 Arrays雜交cRNA分析腓腸肌的基因表達。

GEO數據庫篩選差異基因

首先,打開NCBI(https://www.ncbi.nlm.nih.gov/),如下圖所示選擇GEO Datasets,輸入GDS5656,點擊Search。

點擊搜索到的結果

點擊樣品分類號,我們可以看到該研究的詳情,包括文章研究內容、實驗方案設計、樣本詳情等。

點擊Analyze with GEO2R,利用在線工具進行數據分析。將4個樣本分成了兩組,分組完畢后,點擊save all results,獲取兩組之間的差異表達基因。

 

 

 得到如下所示的文本內容,將其粘貼到記事本(例如,保存為result.txt),然后導入到excel中(數據→自文本,選擇result.txt文件導入),准備進行篩選。

下一步,我們需要對差異表達基因的數據進行進一步的篩選。在這里,我們將p.value(p值,象征着差異的顯著性)和logFC(log2處理過的fold change值,象征着差異的倍數)設定為: p.value<0.01, logFC<-2 or logFC>2。即差異表達非常顯著,並且差異表達在4倍或-4倍以上(原文使用的是1.5倍閾值)。具體做法參見下圖。

 

 最后我們可以在EXCEL左下角的狀態欄看到,一共篩選出來738個條目。

使用BioDBnet將geneSybol轉換為Ensembl Gene ID

biodbnet(https://biodbnet-abcc.ncifcrf.gov/db/) db2db工具支持多個數據庫gene id之間轉換

 

 使用BioDBnet將geneSybol轉換為Ensembl Gene ID,下載轉換完的結果

 

 使用KOBAS進行KEGG注釋分析

1. 輸入類型選擇:Ensembl Gene ID

2. 物種選擇:Mus musculus(mouse)

3. 粘貼Ensembl Gene ID列表

4. 數據庫 Clear All取消Pathway、Disease、GO全部選項,只選擇KEGG Patway

點擊RUN

分析結果鏈接:http://kobas.cbi.pku.edu.cn/result_kobas.php?taskid=181104291408457

下載


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM