ORF和CDS的區別
ORF的英文展開是open reading frame(開放閱讀框)。
CDS的英文展開是coding sequences (編碼區)。
CDS:DNA轉錄成mRNA,mRNA經剪接等加工后翻譯出蛋白質,所謂CDS就是與蛋白質序列一 一對應的DNA序列,且該序列中間不含其它非該蛋白質對應的序列,不考慮mRNA加工等過程中的序列變化,總之,就是與蛋白質的密碼子完全對應.
ORF:理論上的氨基酸編碼區,一般是在分析DNA核酸圖譜中(主要是利用電腦程序)得到的。程序會自動在DNA序列中尋找啟動因子(ATG或AUG),然后按每3個核酸一組,一直延伸尋找下去,直到碰到終止因子(TAA或TAG)。程序把這個區域當成ORF區,認為理論上可以編碼一組氨基酸。
但問題是,在一個整體核酸序列中尋找ATG並不靠譜。因為尋找到的ATG很可能是兩個氨基酸編碼片段的尾和頭的混合體。比如AACGCATGCAGC.
看上面這個小序列,如果以T為中心,會有三種編碼組合的可能。即
(1)ATG(T在中心)電腦程序發現的啟動因子的組合
(2)CAT(T在最右側)
(3)TGC(T在最左側)本例中實際核酸編碼的組合。
這就是ORF三種框架的來源。實際上,DNA序列可以按六種框架閱讀和翻譯(每條鏈三種,對應六種不同的三聯密碼子)。
所以,我們說ORF只是理論上的編碼區,與真實的情景可能並不一樣。
而CDS是檢查cDNA后得到的編碼組合序列,和實際情景比較接近。
啟動子與起始密碼子、終止子與終止密碼子有何區別?
啟動子與起始密碼子、終止子與終止密碼子看起來似乎差不多,實際上卻是兩組截然不同的概念,根本就沒有共同點。
簡單地說,啟動子和終止子都是一段特殊的DNA序列,屬於基因的非編碼區,分別位於編碼區的上游和下游,負責調控基因的轉錄。而起始密碼子和終止密碼子都是mRNA上的三聯體鹼基序列,分別決定翻譯的起始和終止。
啟動子——DNA分子上能與RNA聚合酶結合並形成轉錄起始復合體的區域,在許多情況下,還包括促進這一過程的調節蛋白的結合位點。
強啟動子(strong promoter),指對RNA聚合酶有很高親和力的啟動子,它能指導合成大量的mRNA。
起始密碼子——蛋白質翻譯過程中被核糖體識別並與起始tRNA(原核生物為甲酰甲硫氨酸tRNA,真核生物是甲硫氨酸tRNA)結合而作為肽鏈起始合成的信使核糖核酸(mRNA)三聯體鹼基序列。大部分情況下為AUG,原核生物中有時為GUG等。
終止子——轉錄過程中能夠終止RNA聚合酶轉錄的DNA序列。使RNA合成終止。
終止密碼子——蛋白質翻譯過程中終止肽鏈合成的信使核糖核酸(mRNA)的三聯體鹼基序列。一般情況下為UAA、UAG和UGA,它們不編碼氨基酸。
轉錄因子:轉錄因子(transcription factor)是一群能與基因5`端上游特定序列專一性結合,從而保證目的基因以特定的強度在特定的時間與空間表達的蛋白質分子。
轉錄因子的結合位點(transcription factor binding site,TFBS)是轉錄因子調節基因表達時,與基因模板鏈結合的區域。按照常識,轉錄因子(transcription factor,TF)的結合位點一般應該分布在基因的前端,但是,新的研究發現,人21和22號染色體上,只有22%的轉錄因子結合位點分布在蛋白編碼基因的5'端。
UTR(Untranslated Regions)即非翻譯區,是信使RNA(mRNA)分子兩端的非編碼片段。
5'-UTR從mRNA起點的甲基化鳥嘌呤核苷酸帽延伸至AUG起始密碼子,3'-UTR從編碼區末端的終止密碼子延伸至多聚A尾巴(Poly-A)的前端。



參考:
