scRNA-seq做完該做的QC、normalization、imputation、clustering、trajectory和integration,就會開始做轉錄調控的分析了。
核心就是圍繞着TF轉錄因子做文章
- 預測TF的靶基因
- 鑒定regulon
大部分都是高通量的預測,准確性有待論證,需要很好的實驗驗證設計。
預測的工具不要太多:
MARINa — Andrea Califano - paper
這是一個高通量測序后發明的詞,其實就是被同一個調控元件(常見的就是TF)調控的一群基因的集合。
In molecular genetics, a regulon is a group of genes that are regulated as a unit, generally controlled by the same regulatory gene that expresses a protein acting as a repressor or activator.
我們可以從轉錄調控中看到造物主的影子。
看似簡單,就一個中心法則,其實非常復雜,有很多細節。
Transcriptional Regulation and Its Misregulation in Disease 這篇綜述必讀,但凡是做轉錄調控的。
基本問題:
分子生物學是如何定義轉錄調控的?
RNA-seq是如何測出我們基因的表達量的?
基因的表達量與蛋白和代謝的產生量同步嗎?
真實的基因表達,半衰期?
我們常規的DEG、GO里到底包含了多少有用的信息?基於不准信息的結果能准確嗎?
我們都陷入困境,我們觀測了太多的細節,卻拼不出一副草圖。人類基因組確實一大突破,但卻是最簡單的突破,天書是有了,怎么解讀才是真正費腦的事。
生命科學是觀測型科學,一切都是基於觀察的,不管是實驗還是生信,都是在觀察,沒有觀察就沒有知識,很難僅僅通過推理產生新的知識。
基因表達調控包括轉錄水平、轉錄后水平和翻譯水平。
轉錄調控是指通過改變轉錄速率從而改變基因表達的水平,其對遺傳信息的傳遞的准確性和多樣性具有重要的作用。真核生物的轉錄調控包括多種形式,例如DNA甲基化、組蛋白修飾、染色質重塑、轉錄因子等。
真核生物基因轉錄在細胞核內進行,而翻譯則在細胞質中進行,因此轉錄后調控是基因表達調控的另一個重要方面,主要包括RNA可變剪接、RNA甲基化以及多種調控RNA(miRNA、lncRNA、circRNA)參與的轉錄后調控等。
盡管在真核生物中,基因調控主要發生在轉錄水平,但有些對細胞生存十分重要的蛋白質的合成,其調控也發生在翻譯水平。這其中最為重要的幾個方面是:mRNA的穩定性,翻譯起始調節,翻譯相關因子中起始因子的作用以及真核mRNA的結構等。
DNA甲基化:DNA甲基化(英語:DNA methylation)為DNA化學修飾的一種形式,能在不改變DNA序列的前提下,改變遺傳表現。DNA甲基化過程會使甲基添加到DNA分子上,例如在胞嘧啶環的5'碳上:這種5'方向的DNA甲基化方式可見於所有脊椎動物。特定胞嘧碇受甲基化的情形,可利用亞硫酸鹽定序(bisulfite sequencing)方式測定。DNA甲基化可能使基因沉默化,進而使其失去功能。
組蛋白修飾:組蛋白是與DNA結合的蛋白,它們會對基因的表達產生影響。組蛋白在相關酶作用下發生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修飾的過程。
染色質重塑:染色質重塑chromatin remodeling :基因表達的復制和重組等過程中,染色質的包裝狀態、核小體中組蛋白以及對應DNA分子會發生改變的分子機理。
轉錄因子:轉錄因子是與DNA特異性結合的一系列蛋白質。結合在DNA上的啟動子以及增強子之類控制轉錄的區域上,促進或者抑制DNA上的遺傳信息向RNA轉錄的過程。轉錄因子的這一機能可以單獨,或者通過與其它蛋白質形成復合體來完成。人類的基因組上已經推定出大約1800個基因控制轉錄因子的編碼。
轉錄調控太復雜了,但它確實真實存在的,單細胞的基因表達就是由轉錄調控綜合決定的。
現在比較好入手的就是研究轉錄因子、可變剪切和lncRNA了。
能不能開發一個工具來挖掘這些調控信息,現在的基因表達數據的利用率太低了。
研究轉錄調控我想知道什么?
1. 在發育過程中,哪些核心的調控因子在調控着發育過程?
2. 在致病過程中,哪些核心的調控因子的失調導致了疾病?
基於pathway or genelist的NN模式識別,或者預測。
lncRNA與single cell的挖掘
到底是哪些因素在控制基因的表達調控
能不能開發出超越聚類的單細胞分析方法?
我的數據到底可以研究什么,不能研究什么?
組織、器官都是由單細胞組成的,單細胞內某一刻的基因表達是轉錄調控的結果,現在我們想知道生物體內的轉錄調控在發育和致病過程中是如何自發進行的!!!
trigger
https://github.com/slowkow/tftargets
human transcription factor download
transcription factor single cell
lncRNA target gene