前言
這個問題在高中生物中,並不會研究的那么深刻。
所以正式做題時還是應該按照老師的教導,避開這個“雷區”。
1.問題發現
在高中生物-遺傳與進化-基因的本質學習中,有一個十分經典的問題。
即:給定鹼基對數n,不限定每種鹼基(A,C,G,T)的個數,求出最多的DNA種數。
在所有的教材,輔導書,以及老師的授課過程中,對於這個問題的答案,一般都是\(4^{n}\)或者$ \frac {4^n} {2}$。
對於\(4^n\)的思路,即每個位置有\(4\)種鹼基對可能,一共有\(n\)組,根據乘法原理,故為\(4^{n}\)。
對於\(\frac {4^n} {2}\)的思路,即在上一種思路的基礎上,考慮到有重復的情況,便除了個2。
但是,@thorn,@opethrax以及本人的對於這些答案深感懷疑,於是我們便手算了當鹼基對數為\(2\)時的所有情況。
利用計算機程序進行打表,以及查詢有關\(DNA\)的資料后,最終我們確定當n=2時,結果理應為10。
這個答案都不能用上面的公式解答,於是我們繼續思考探索。
2.深入探究
通過@opethrax同學辛苦的打表,觀察,他發現存在一些情況被忽略。
原先我們認為,一個\(DNA\)分子擁有\(3'\)與\(5'\)段,\(3\)代表三號碳,\(5\)代表五號碳。
如下圖,從兩條鏈的\(3'\)端分別掃描,一種序列最多被統計到\(2\)次。
一個是AGCTA,另一種是TAGCT。
但是,存在一種\(DNA\)分子,從其兩條鏈的\(3'\)端分別掃描,結果相同。
如下圖:
都為TCGATCGA。
所以這種情況下,具有這種性質的\(DNA\)會被少統計一次。
且我們不難發現,滿足這種性質當且僅當\(DNA\)鏈的長度為偶數(如圖一,若為奇數,會出現不對稱的情況,即不滿足這種性質)。
那么我們分類討論,之前那個\(\frac {4^n} {2}\)的公式,可以在n為奇數時使用。
對於n為偶數的情況,我們要在原公式的基礎上,加上少統計的個數。
現在的問題,即是尋找擁有這種特殊性質的鏈的個數。
不難發現,一條鏈的\(3'\)端的\(1\)號鹼基到該鏈的第\(\frac n 2\)號鹼基,如果和另一條鏈的\(3'\)端的\(1\)號鹼基到該鏈的第\(\frac n 2\)號鹼基相同,剩下的部分通過鹼基互補配對原則,可以保證相同。
下圖黑的部分是我們自己確定的一條排列,紅色部分是根據鹼基互補配對原則形成的。
我們可以把這個理解為一種中心對稱。
所以我們只需要構造出一條鏈中一半的排列,然后按照中心對稱放到另一條鏈的\(3'\)端,剩下那條按照鹼基互補配對原則填充即可滿足這種性質。
所以我們不難得出,這種情況下,會有\(4^{\frac {n}{2}}\)條鏈會被少統計一次。
至此,我們可以得出公式:
這個式子經過打表以及oeis.org的確認,結果正確。
3.聲明與感謝
其實\(DNA\)的結構遠比人類腦海中想象的要復雜的多,這里我們只是討論了理論下的情況。
感謝您的閱讀。若您存在任何疑問,或覺得我們有些地方存在紕漏,歡迎您聯系我們,我們十分樂意與您探討。
再次感謝兩位同學@thorn,@opethrax深夜的探討與陪伴,若沒有他們的幫助,我們很難單獨進行下去。
thorn有關這篇文章的鏈接:https://www.cnblogs.com/thornblog/p/12381381.html
opethrax有關這篇文章的鏈接:https://home.cnblogs.com/u/opethrax/
他們兩位有關這個內容的博客寫的都非常優秀,建議您去訪問他們的博客以進行更多的了解。
除非另有說明,本網站上的內容均采用知識共享署名-非商業性使用-相同方式共享 4.0 國際許可協議進行許可,請您在轉載時注明來源及博客鏈接。
4.深夜隨想
造物主強大的力量是人們無法想象到的。人類很難走到沒有任何疑惑的那一天。
每一個個體腦中冒出的新奇想法,或提出的一個問題,都有可能成為築起人類從無知到有知的橋梁下的一粒石子。
對科學的探索,不是淺嘗輒止,而是無窮無盡。
獻上一首不錯的音樂:
“生於此處卻不知此處
日光傾城,萬物生長,又是為何
若沒有大地的擁抱,我們早已消失於茫茫宇宙之中
若沒有原子之穩定,我們亦不復存在
無人問天地變換,斗轉星移,是為何故
宇宙又是源於何處
它是否無始無終
時間若願意倒流,我們的認知是否還會有局限
世間最渺小之物又是什么
滾滾長江,卻只留有過去,不知未來
浩淼宇宙,為何我們在此相遇”
——《Moonlight》