【豆科基因組】大豆(Soybean, Glycine max)經典文章梳理2010-2020



大豆又名菽,在我國已有5000多年的大豆種植歷史。大豆起源於中國,由分布於黃淮流域(北緯32-40度)的野生大豆馴化而來。隨后廣泛傳播到世界各地,為人類提供了主要的植物油料和蛋白資源。 
大豆的形態1.野生大豆自然群落2.野生大豆(左)與栽培大豆植株(右)3.田間成熟期栽培大豆4.大豆種皮顏色

據統計, 全世界現有60 000份不同類型的大豆種質資源。毫無疑問,大豆的研究價值是所有豆科作物中最高的。這里對大豆的十年經典研究做一個回顧。

2010年1月:大豆基因組首次發表(Nature)

Genome sequence of the palaeopolyploid soybean

研究者利用全基因組鳥槍法對大豆進行全基因組測序,利用大豆栽培品種Williams 82品種大豆家系的444個重組自交系構建遺傳圖譜用來輔助組裝,最終組裝后的基因組大小為994Mb,ContigN50為189.4 Kb,ScaffoldN50達47.8 Mb,其中有397條Scaffold組裝並錨定到20條染色體水平,組裝基因組中確定了4991個SNP和874個SSR,並預測出46430個蛋白編碼基因,重復序列占到整個基因組的59%。

大豆20條染色體組裝示意圖

此外,該研究后續除了對基因組成、重復DNA鑒定、全基因組復制事件等進化問題進行研究外,還對大豆固氮瘤和油脂的生物合成基因及基因轉錄因子多樣性進行了鑒定,該大豆基因組准確序列的獲得加快改良大豆品種的培育。

不同轉錄因子家族中轉錄因子基因在大豆和擬南芥中的分布

2010年12月:31個大豆基因組重測序(Nature Genetics

Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection

研究人員對17株野生大豆和14株栽培大豆進行了全基因組重測序,與參考基因組比對后,共發現了630多萬個SNP,建立了高密度的分子標記圖譜。此外通過對野生大豆和栽培大豆進行初步組裝,從而在兩種大豆中鑒定出18余萬個PAV,得到了在栽培大豆中獲得以及丟失的基因。此研究還發現大豆基因組存在較高程度的基因連鎖不平衡和較高比例的單核苷酸非同義替換/同義替換比例,這表明大豆分子標記育種比基因圖位克隆可能會擁有更多的優勢。

與栽培大豆相比,野生大豆有着更高水平的遺傳多樣性,這表明人工選擇導致了栽培大豆狹窄的生物多樣性,這可能對可持續種植帶來負面影響。而對野生大豆的分析表明,隨着野生大豆生存環境的減少,野生大豆的有效群體大小在減少,野生種質資源的保存迫在眉睫。

該項研究第一次為大豆基因組學研究提供了全面的重測序數據,對未來的大豆群體遺傳學研究,分子標記育種,新基因的發現奠定了堅實的基礎。

 野生和栽培大豆群體遺傳多樣性分析

2014年10月:野生大豆泛基因組(Nature Biotechnology)

De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits

中國農科院作科所邱麗娟團隊牽頭選擇了7份有代表性的野生大豆進行De novo測序和獨立組裝,構建野生大豆泛基因組,Contig N50為7.7-26.6 Kb,Scaffold N50約16.3-62.7 Kb。通過基因集比較分析發現,48.6%的基因為7個野生大豆所共有,超過51.4%則僅存在於個別樣本中(特有基因),並且特有基因主要富集在生物和非生物逆境相關途徑中,這也反映了野生大豆具有廣泛的適應性。此外,還鑒定到3.6-4.7Mb的SNP和0.50-0.77Mb的InDel。

 不同野生大豆間特有和共有基因統計

進化分析表明,野生大豆與栽培大豆的祖先約在80萬年前即發生了分化;正選擇分析發現栽培大豆受選擇的基因多與抗旱有關,而野生大豆中受選擇基因非常多樣化。同時,鑒定出大量與抗逆、抗病、花期、產油量和高度等重要農藝性狀相關基因和變異,如野生大豆和栽培大豆開花時間的差異與開花時間調控基因SNP和InDel變異有關。

該成果是首例重要作物泛基因組研究成果,為研究大豆的遺傳多樣性及進化歷程提供了新的啟示,奠定了解析重要馴化性狀建成、發掘優異基因/標記的基礎。

大豆開花相關基因鑒定

2015年2月:大豆在馴化和改良過程中遺傳多態性明顯降低(Nature Biotechnology)

Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean

中科院遺傳發育研究所田志喜團隊,對302份代表性大豆種質進行了重測序(>10x),分析表明大豆在馴化和改良過程中遺傳多態性明顯降低,在馴化階段鑒定出121個強選擇信號,在品種改良階段鑒定出109個強選擇信號。

除了SNP變異的分析,同時對能夠解釋更多生物學問題的CNV變異信息也進行了深入的選擇分析和全基因關聯分析。選擇分析發現,CNV也在馴化過程中受到人工選擇,共發現農家品種和馴化品種中162個受選擇區域;通過關聯分析發現,18號染色體與抗胞囊線蟲相關的CNV與前人報道的區間Rhg1有交集,有趣的是,這個區間同樣在馴化種中受到選擇。另外,8號染色體上一個與豆臍顏色表現強關聯的CNV位於一個查爾酮合成相關的區間內,同樣為馴化種中受選擇的位點。本文通過CNV的研究實現了鑒定到更多與大豆優良性狀相關基因的研究目的。

對種子大小、種皮顏色、生長習性、油含量等性狀進行全基因組關聯(GWAS)分析,找出了一系列顯著關聯位點。研究表明大豆產油性狀受人工選擇較多,形成復雜的網絡系統共同調控油的代謝。

302份大豆取樣地理位置分布及大豆群體結構分析

全基因組范圍篩選和注釋大豆在馴化和改良過程中的受選擇位點

2017年8月:GWAS解析大豆重要性狀網絡(Genome Biology)

Genome-wide association studies dissect the genetic networks underlying agronomical traits in soybean

繼302個大豆重測序研究之后,中科院遺傳發育研究所的田志喜團隊又對809份大豆進行了重測序(8.3×)分析,深入解析了大豆84個農藝性狀間的遺傳調控網絡,共鑒定出245個顯著關聯位點,發現其中95個關聯位點和其它位點存在上位性效應。

 809份大豆取樣地理位置分布及大豆群體結構分析

例如,對於油含量相關性狀,共鑒定到24個脂肪酸代謝相關和21個脂代謝相關的基因。深入分析發現,這些基因是通過加性效應共同調控多個大豆油脂性狀的形成。

大豆植株高度性狀的GWAS分析

這些關聯位點揭示了不同性狀間相互耦合的遺傳基礎。根據連鎖不平衡分析,發現115個關聯位點可相互連鎖,並與所觀測的51個性狀聯系起來,形成復雜的多性狀多位點調控網絡,該遺傳調控網絡很好地解釋了不同性狀間的耦合關系。研究還發現其中23個關聯位點,包括16個新鑒定的位點,對不同性狀的形成起到關鍵調控作用。

大豆的不同性狀之間的關聯網絡分析

2018年8月:中國國審大豆品種中黃13的基因組完成(Science China Life Science)

De novo assembly of a Chinese soybean genome

中國科學院遺傳與發育生物學研究所田志喜團隊聯合其他單位,綜合運用單分子實時測序(SMRT)、單分子光學圖譜(optical mapping)和高通量染色體構象捕獲技術(Hi-C),對中國國審大豆品種“中黃13”的基因組 (Gmax_ZH13) 進行從頭組裝,最終得到1.025 Gb的基因組序列,包含20條染色體和1條葉綠體。該基因組Contig N50為3.46 Mb,Scaffold N50為51.87 Mb,是目前連續性最好的植物基因組之一。

進一步分析表明,Gmax_ZH13和Williams 82基因組之間存在着大量的遺傳變異,包括1404個易位事件、161個倒位事件、1233個倒位易位事件,以及在Gmax_ZH13中出現的505506個小插入/缺失(1-99 bp)和17409個大插入/缺失(≥100 bp)。

該研究整合大量轉錄組數據為Gmax_ZH13基因注釋基因構建了一個完整的基因共表達網絡。通過已報道控制大豆開花時間的基因與新定位的QTL或GWAS區間內候選基因的共表達關系,對新定位區間內控制該性狀的基因進行更精確地篩選,得到26個可能控制大豆開花時間的基因,並利用自然群體遺傳變異和表型差異的關聯對其中部分基因進行驗證,為重要農藝性狀基因的挖掘提供了新思路。Gmax_ZH13基因組的發表為大豆基礎研究提供了重要資源,為國產優異大豆品種的培育奠定了基礎。
Gmax_ZH13和Williams 82基因組比較分析

2019年3月:最優質野生大豆基因組完成(Nat Commun)

A reference-grade wild soybean genome

野生大豆含有豐富的基因資源,可用於提升栽培大豆抗逆性、種子蛋白質和次級代謝產物含量等農藝性狀,是大豆品種改良的天然寶庫。2019年3月,香港中文大學與華大基因的聯合科研團隊針對野生大豆W05,應用三代PacBio測序技術、Bionano Genomics雙酶切光學圖譜(OM)和高通量染色體構象捕獲技術(Hi-C)產出的數據,組裝得到染色體級別的參考基因組。最終組裝獲得的基因組大小為1013.2Mb,contig N50 3.3Mb,scaffold N50 50.7Mb。注釋獲得55,539個蛋白編碼基因,對應89,477個蛋白質編碼轉錄本。此外,在W05基因組中,還發現了288個miRNA,1,988個snRNA及147 個rRNA。

野生大豆W05基因組概貌

2020年6月:大豆圖形結構泛基因組圖譜(Cell)

Pan-Genome of Wild and Cultivated Soybeans

中科院遺傳發育所田志喜/梁承志課題組合作發表了大豆圖形結構泛基因組圖譜。這項研究在植物中首次實現了基於圖形結構的基因組構建,突破了傳統線性基因組的存儲形式,將引領下一代基因組學研究思路和方法,被審稿人稱為“基因組學的里程碑工作”。

該研究首先對來自世界大豆主產國的2898個大豆自然種質資源進行了深度重測序和群體結構分析,進而精心挑選出26個最具代表性的大豆種質材料。該26個種質包括3個野生大豆,9個農家種和14個現代栽培品種,其中一些材料作為骨干核心親本已經培育了上百個優良新品種,一些材料是各個大豆主產區推廣面積最大的主栽品種。進一步利用最新組裝策略,對該26個大豆種質進行了基因組的從頭組裝和精確注釋。在此基礎上,結合已經發表的中黃13、Williams 82 和 W05 基因組,構建了高質量的基於圖形結構的基因組,經過泛基因組分析,挖掘到大量的大片段結構變異。

深入分析發現,有些結構變異導致了不同基因間的融合,這為新基因的產生研究提供了重要線索;一些結構變異在重要農藝性狀調控中發揮重要作用,如種皮亮度、種皮顏色的馴化、缺鐵失綠等。

大豆圖形結構泛基因組分析

綜上,經過10年的努力,起源於中國的大豆再次迎來了自己的高光時刻!這些遺傳變異的發布為大豆研究提供了極為重要的資源和平台,無疑將大力推進大豆分子設計育種,助力實現大豆“綠色革命”。

參考:https://mp.weixin.qq.com/s/bakt49LAL34KJBLlBswQHg
http://www.bioon.com.cn/news/showarticle.asp?newsid=72291


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM