來源
單位:University of California Riverside
豇豆(Vigna unguiculata),與綠豆(Vigna radiata)、小豆( Vigna angularis )同屬於豇豆屬 Vigna。
菜豆科家族Phaseoleae tribe (soybean, common bean, adzuki bean, mung bean, pigeon pea and cowpea)
豇豆在非洲馴化,從那里傳播到各大洲,現在亞洲、歐洲、美國以及中南美洲的許多地方普遍種植。豇豆的優勢之一是對惡劣條件,如炎熱干燥的環境和貧瘠的土壤的高度恢復能力。
豇豆染色體數為 2 n = 22,之前估計的基因組大小為 613 Mb。其基因組與其他暖季豆科植物(菜豆科家族)具有高度共線性。之前使用二代+BAC組裝了一個品系 IT97K-499-35 的碎片化草圖。
結果
基因組大小估計
流式細胞儀估計大小640.6 Mb。
kmer評估大小 560.3 Mb。kmer 估計會因PCR 引入的錯誤導致的低拷貝 k-mer 的高估、基因家族中重復的 k-mer 和保守基序的計數不足以及 k-mer 的大量低估而帶來不准確。因此本研究采用640.6 Mb。
采用stitching方法組裝
PacBio測序91.7X,采用CANU、Falcon、 ABruijn等多種方法組裝,再結合Bionano拼接合並。最后使用 通過使用ALLMAPs將44 003 個SNP錨定到11條假染色體上。錨定大小473.4Mb(91.1%)。GC含量與其他豆科類似。
評估組裝質量:
- 約168M 149-bp paired reads比對率98.92%;
- 之前二代組裝的129 000 contigs (500 bp or longer)比對率99.69%;
- 之前組裝的178 000 個BAC比對率99.95%;
- 約157 000 transcripts比對率99.95%;
- 采用BLASR 將原始的PacBio 5.29 M reads比對率88.68%
修改豇豆染色體編號
通過豇豆和菜豆(普通豆)的同線性,修改染色體編號,並將部分染色體方向翻轉。
基因注釋和重復DNA
豇豆EST+根莖葉花種子RNAseq,擬南芥、普通豆、大豆、紫花苜蓿、楊樹、水稻和葡萄的蛋白質序列,結合從頭預測,共注釋了 29 773 個蛋白質編碼位點,以及 12 514 個可變剪接的轉錄本。
BUSCO評估95.9%。
重復序列注釋估計 49.5% 組成:39.2% 的轉座元件 (TE)、4% 的簡單序列重復 (SSR) 和 5.7%未識別的低復雜度序列。
着絲粒區域是基於 455 bp 串聯重復序列定義的,該重復序列先前被 FISH 鑒定為豇豆着絲粒中含量豐富。包含該序列的區域跨越 20.18 Mb(組裝基因組的 3.9%)
(a)紅線代表着絲粒區域,基於 455-bp 串聯重復比對;(b) 每 1 Mb 的重組率;(c) 1 Mb 窗口中的基因密度;(d) 在 1 Mb 窗口中重復覆蓋;(e) 1 Mb 窗口中的SNP密度。
SNP分布和着絲粒位置推斷
豇豆遺傳多樣性
SNP和INDEL
將前人研究的 36 個不同種質的二代測序數據比對到上一版本的基因組,共得到 957 710 個SNPs(1M),為將它們定位在豇豆新組裝的參考基因組上,由 SNP 位置及其每側 60 個鹼基組成的 121 個鹼基序列與參考基因組進行 BLAST比對,保留Top1,99.83%能比對上參考序列上,其中包括 Illumina iSelect Consortium Array芯片中49 697 SNPs ,約35% (336 285 SNPs)和基因相關。表明 iSelect 芯片設計對基因的預期偏見是可信的。
BreakDancer v.1.4.5 檢測結構變異,共17 401 個插入和 117 403 個缺失。插入比缺失數量少得多,這可能反映了當reads比對到參考基因組時軟件識別插入的能力有限。
Vu03 上 4.2-Mb 染色體倒位的鑒定
10張遺傳圖譜用於錨定和定向scaffold到假染色體上,其中7個表明有一些大片段區域存在倒位,而其他三個顯示在同一區域無重組,表明雜交中的兩個親本具有相反的方向。為找到倒位斷點,用一些之前的材料測序的contig比對,與參考基因組相同的共線性好,相反方向的則在斷點之前對齊。證實了染色體倒位和參考序列中兩個斷點的位置:36 118 991 bp(斷點 1)和 40 333 678 bp(斷點 2),用於包含 242 個基因的 4.21-Mb 倒置。兩個斷點區域的 PCR 擴增進一步驗證了這種反向。
使用 368 份不同的豇豆種質,包括 243 個地方品種和 97 個育種種質(含有 iSelect 芯片數據),用於估計種質之間的倒位頻率。總共有 33 個材料 (9%) 與整個區域的參考基因組具有相同的 SNP 單倍型,即可能是相同的方向,其中 3 個是地方品種(占該組地方品種的 1.2%),而其他 30 個是包括參考基因組在內的育種材料。表明該區域的參考基因組方向在地方品種中很少見,並且其頻率在育種材料中有所增加。
另外,這部分區域很少有重組,說明在栽培×野生雜交的遺傳圖譜中,野生與栽培種質的方向相反。因為這個培育的親本與參考基因組具有相同的單倍型,因此大概也具有相同的方向,該區域缺乏重組表明與參考方向相反的方向是祖先(野生)類型。
豇豆和小豆的比較表明 IT97K-499-35 和小豆基因組組裝在該區域具有相反的方向,這與豇豆參考基因組在該區域相對於野生豇豆種質中保留的祖先狀態發生倒位的猜想一致,並且出現在同類物種中。
Comparison between the Vu03 chromosomal inversion region in cowpea (y-axis) and its syntenic region in Vigna angularis (vigan.Shumari). inverted segment (~36-41 Mbp in the V. angularis chromosome)
倒位的直接影響是抑制雜合子的重組,導致倒位區域獨立進化。攜帶倒轉的三個地方品種B-301(獨腳金抗性供體)、 B-171、TVu-53。
探索倒位是否與獨腳金抗性相關,將先前鑒定的該性狀 QTL 的圖譜位置與倒位位置進行比較。獨腳金小種 1 和 3 抗性的 QTL 位於與 Vu03 倒位不同的染色體上,排除了倒位作為這些抗性的基礎。然而,注意到高粱基因Sobic.005G213600通過存在/缺失變異調節獨腳金抗性 編碼與豇豆基因Vigun03 g220400同源的磺基轉移酶,其位於 Vu03 上的倒位區域內,並在根組織中高表達。因此,包含Vigun03 g220400的區域似乎可能以尚未發現的方式影響獨腳金相互作用。
此外,豆莢數的 QTL位於倒位區域內。
與其他暖季豆科植物共線性分析
對豇豆及其近親小豆( Vigna angularis )、綠豆( Vigna radiata )和普通豆( P. vulgaris )進行共線性分析。
兩種豇豆的保守程度高於普通豆(菜豆)。六條豇豆染色體(Vu04、Vu06、Vu07、Vu09、Vu10 和 Vu11)在所有其他三個物種中基本上與單條染色體具有同線性。Vu02、Vu03 和 Vu08 也與其他兩種豇豆屬一對一關系,但與菜豆一對二關系,表明這些染色體重排是豇豆與菜豆不同的特征。剩余的豇豆染色體 Vu01 和 Vu05 具有可變的共線性關系,其他三個物種中的每一個都有兩條染色體,表明這些染色體重排是豇豆屬物種形成的更多特征。還應該注意的是,在這些物種之間具有一對二關系的大多數染色體與涉及着絲粒區域的易位一致。
在這些共線性關系的基礎上,對小豆、綠豆和可能的其他豇豆采用修訂后的豇豆染色體編號物種將是直接的,有利於促進目標性狀的基因組信息從一個物種到另一個物種的相互轉化。
(a) 小豆 (Va ; Vigna angularis );(b) 綠豆(Vr;Vigna radiata);(c)使用修改后的豇豆染色體編號系統的普通豆 (Pv; Phaseolus vulgaris )
重復元素和基因組擴張
先前的分析表明豇豆在系統發育上更接近綠豆 (Vr) 而不是紅豆 (Va),盡管 Va 和 Vr 基因組的大小相對相似,豇豆分別大 11% 和 12%。
將 Vu 與 Vr 進行比較,94% 的 56 Mbp 大小差異可以通過 TE 的差異含量來解釋,57% 可以通過單獨的超家族Gypsy逆轉錄轉座子的差異含量來解釋。
和普通豆進行了類似的比較,雖然組裝的基因組小( 473 Mb (9%)),但TE含量更高,45.2% versus 39%。有可能是P. vulgaris的 contig N50=0.395 Mb,而 Vu = 10.9 Mb。真正的P. vulgaris基因組比 Feulgen 密度測定法估計的要大得多,其中大部分 TE 影響了組裝。
跨物種比較表明,豇豆基因組大小的差異在很大程度上可以通過 TE 含量來解釋,尤其是Gypsy逆轉錄轉座子的含量。這可能是由於最近的差異擴張或古代插入的差異保留造成的。
豇豆基因家族變化
為了鑒定豇豆中拷貝數顯着增加或減少的基因,來自豆科植物信息系統的 18 543 個科 ( https://legumeinfo.org/search/phylotree和https://legumeinfo.org/data/public/Gene_families/) 進行了分析。該集合的構建是為了捕獲源自豆科植物分類深度的基因,基於直系關系和豆科植物和外群物種的每個物種同義位點率。這些科包括 14 種豆科植物,其中 6 種來自菜豆族(大豆、普通豆、紅豆、綠豆、木豆和豇豆)。在豇豆基因成員相對於每個豆科植物物種的平均成員處於最高百分位的 185 個基因家族中,這些家族包括以下超家族組中的幾個:NBS-LRR 抗病基因、各種受體樣蛋白激酶、防御素、核糖體蛋白、NADH-醌氧化還原酶成分。所有這些家族都出現在基因芯片中,它們可能通過旁系同源基因的跳躍錯配而擴張或收縮。
在18 543個豆科植物基因科中,有2 520個科沒有豇豆基因成員,這與菜豆科其他6個已測序基因組的平均無成員家庭數(3 057個)相當。2520 個“無豇豆”家族富含以下超家族:UDP-糖基轉移酶、枯草桿菌蛋白酶樣絲氨酸蛋白酶、幾個激酶超家族、幾個可能的逆轉錄轉座子相關家族、FAR1 相關蛋白和 NBS-LRR 抗病家族。
SAUR 樣生長素超家族在豇豆中包含 138 個注釋基因,而在紅豆和綠豆中分別為 90 和 52 個。NBS-LRR 超家族包含 402 個注釋基因,而紅豆和綠豆中分別為 272 和 86 個。
多器官增大候選基因的鑒定
作物馴化通常涉及人類收獲的特定器官的大小增加。最近有研究使用源自馴化×野生雜交的重組近交系(RIL)群體在 Vu08 上鑒定了與豇豆器官大小增加相關的基因組區域。該區域包含一組關於豆莢長度、種子大小、葉長和葉寬的 QTL(CPodl8、CSw8、CLl8、CLw8)。
這里使用參考基因組序列用於進一步研究這個馴化熱點,跨越 2.21 Mb 包括 313 個基因。鑒定了普通豆基因組中的共線區域,其中最大的區域位於普通豆染色體 8 (Pv08) 上。該區域總共包含 289 個常見的豆類合成基因,然后將其與 Schmutz等人提供的與馴化相關的常見豆類基因列表進行比較。這兩個列表的交集僅包含一個基因Phvul.008G285800,這是一個與豇豆Vigun08 g217000相對應的用於增加種子大小的普通豆候選基因.,該基因編碼組氨酸激酶 2,在多種豇豆組織中表達,包括根、種子、豆莢和葉。擬南芥直系同源AHK2 ( AT5G35750.1 ) 是一種細胞分裂素受體,已被證明可調節植物器官大小等。因此Vigun08 g217000是進一步研究的候選基因。