前言

本文主要演示GEO數據庫的一些工具，使用的數據是2015年在Nature Communications上發表的文章Regulation of autophagy and the ubiquitin-proteasome system by the FoxO transcriptional network during muscle atrophy.[pubmed:25858807]

作者通過將FoxO1-3-4-floxed小鼠（FoxO1,3,4 f / f）與表達Cre重組酶的轉基因系在MLC1f啟動子的控制下交叉，在肌肉中特異性地產生敲除的FoxO 1,3,4以產生肌肉特異性FoxO1,3,4三重敲除小鼠。這些小鼠要么自由進食，要么飢餓，隨后分別提取4種情況小鼠的RNA，使用Affymetrix提供的試劑盒並根據標准Affymetrix方案制備，標記並與Affymetrix Mouse Genome 430 2.0 Arrays雜交cRNA，分析腓腸肌的基因表達。

GEO數據庫篩選差異基因

首先，打開NCBI(https://www.ncbi.nlm.nih.gov/)，如下圖所示選擇GEO Datasets，輸入GDS5656，點擊Search。

點擊搜索到的結果

點擊樣品分類號，我們可以看到該研究的詳情，包括文章研究內容、實驗方案設計、樣本詳情等。

點擊Analyze with GEO2R，利用在線工具進行數據分析。將4個樣本分成了兩組，分組完畢后，點擊save all results，獲取兩組之間的差異表達基因。

得到如下所示的文本內容，將其粘貼到記事本（例如，保存為result.txt），然后導入到excel中（數據→自文本，選擇result.txt文件導入），准備進行篩選。

下一步，我們需要對差異表達基因的數據進行進一步的篩選。在這里，我們將p.value（p值，象征着差異的顯著性）和logFC（log2處理過的fold change值，象征着差異的倍數）設定為： p.value<0.01, logFC<-2 or logFC>2。即差異表達非常顯著，並且差異表達在4倍或-4倍以上（原文使用的是1.5倍閾值）。具體做法參見下圖。