開放閱讀框架(ORF)
開放閱讀框-開放閱讀框概述
開放閱讀框(英語:Open reading frame;縮寫:ORF;其他譯名:開放閱讀框架、開放式閱讀框架,開放讀架等)是生物個體的基因組中,可能是蛋白質編碼序列的部分。基因中的ORF包含並位於開始編碼與終止編碼之間。由於一段DNA或RNA序列有多種不同讀取方式,因此可能同時存在許多不同的開放閱讀框架。開放閱讀框包含一段可以編碼蛋白的鹼基序列,不能被終止子打斷。 當一個新基因被識別,其DNA序列被解讀,人們仍舊無法搞清相應的蛋白序列是什么。這是因為在沒有其它信息的前提下,DNA序列可以按六種框架閱讀和翻譯(每條鏈三種,對應三種不同的起始密碼子)。ORF識別包括檢測這六個閱讀框架並決定哪一個包含以啟動子和終止子為界限的DNA序列而其內部不包含啟動子或密碼子,符合這些條件的序列有可能對應一個真正的單一的基因產物。ORF的識別是證明一個新的DNA序列為特定的蛋白質編碼基因的部分或全部的先決條件。開放閱讀框-不確定讀框
如果遺傳密碼是不重疊的三聯體,那么會有三種可能的方式將核苷酸翻譯成蛋白質, 這三種可能的讀碼(Reading frame ) 方式稱為讀碼框架。
比如序列:ACGACGACGACGACGACG,可能的讀碼框架就有以下三種:
ACG ACG ACG ACG ACG ACG ACG ACG
CGA CGA CGA CGA CGA CGA CGA CGA
GAC GAC GAC GAC GAC GAC GAC GAC
一段翻譯成蛋白質的序列有一個閱讀框架,它有一個特殊的起始密碼子,從此延伸出一系列代表氨基酸的三聯體,一直到在三種類型的終止密碼子上結束。如果終止密碼子頻繁出現,就會阻止閱讀框被翻譯成蛋白質。一個序列的三個閱讀框全部被阻斷,那么它就會失去翻譯成蛋白質的功能。 當獲得一個未知的DNA 序列后,就可分析其三個讀碼框是被阻斷的還是開放的。在任何一段DNA 中,通常不會超過一個讀碼框是開放的 ,因為替換的讀碼框被頻繁出現的終止密碼子阻斷。一般情況,開放讀框不可能太長。如果它不翻譯成蛋白質,將不存在阻止終止密碼子聚集的選擇壓力。證明序列是開放框是確定該框架能翻譯為蛋白質的首要證據。一個不能表達蛋白質的開放讀框被稱為不確定讀框(URF) 。
開放閱讀框-開放閱讀框
一個DNA順序可能有3種閱讀框,但只有一種具有編碼的作用,稱為開放閱讀框(open reading frame or ORF)。有的閱讀框因終止密碼出現頻繁故不能生成蛋白,這種閱讀框稱為封閉閱讀框(block reading frame)。若一個順序所有的三個閱讀框都是封閉的,則它無編碼蛋白的功能。一個翻譯成蛋白的順序有一個閱讀框,開始於AUG起始密碼子,通過一系列有義密碼子,直到終止密碼子結束。通常3個閱讀框中總有封閉閱讀框的存在。
例如一段5'-UCUAAAGGUCCA-3'序列。此序列共有3種讀取法:
UCU AAA GGU CCA
CUA AAG GUC
UAA AGG UCA
由於UAA為終止編碼,因此第三種讀取法不具編譯出蛋白質的潛力,故只有前兩者為開放閱讀框架。
當獲得了一個未知功能的DNA區域的順序,要通過分析來確定閱讀框是開放的還是封閉的。在任何一個DNA順序中往往只有一個開放閱讀框。ORF似乎並不是隨機存在。如果一個順序不翻譯成蛋白質,那么將無選擇壓力來阻止其中產生無義密碼子(有時無義密碼子這個詞也用於終止密碼子。“無義”是個錯誤的名詞,因為這種密碼即使在突變基因中中斷了蛋白質合成,但仍有含義的),這樣一個長ORF的鑒別乍看起來這個順序好象是可以翻譯的。一個ORF未鑒別出蛋白產物,有時稱其為非鑒定閱讀框(unidentified reading frame,URF)。
開放閱讀框-開讀閱讀框的預測
開讀框架(Open Reading Frame: ORF)的預測常與第一個ATG和終止密碼子的確定相關,但由於EST序列相對較低的測序質量,在測序過程中出現的鹼基刪除或插入錯誤(稱為indel錯誤)將引起讀框移動,甚至出現假終止密碼子,所以,僅憑第一個ATG和終止密碼子是不足以確定ORF的。