幸运飞艇官方开户

服務熱線:025-85381280
文獻解讀

集思慧遠客戶發表《麻櫟葉綠體全基因組序列及系統發育分析》

幸运飞艇官方开户FABURIQI:2019-03-17 LIULANCISHU:1007

南京集思慧遠客戶發表

麻櫟葉綠體全基因組序列及系統發育分析



  麻櫟(Quercus Acutissima)是櫟屬重要的特有生態植物,廣泛分布于全國各地。然而,對其葉綠體基因組的研究卻很少。在本研究中,對麻櫟的葉綠體(Cp)全基因組進行了測序、分析,并與殼斗科家族4種植物進行了比較。麻櫟葉綠體基因組的大小為161124bp,包括1個90,423 bp的大單拷貝(LSC)區和一個19,068 bp的小單拷貝(SSC)區,由51,632 bp的兩個反向重復區(IR)隔開。全基因組的GC含量為36.08%,LSC、SSC和IR的GC含量分別為34.62%、30.84%和42.78%。麻櫟葉綠體基因組編碼136個基因,其中蛋白質編碼基因88個,rRNA基因4個,tRNA基因40個。在重復結構分析中,麻櫟葉綠體基因組中共檢測到31個正向重復、22個反向重復序列和65個簡單序列重復位點。基因組中豐富的簡單序列重復位點(SSRs)的存在表明了未來群體遺傳工作的潛力。基因組比較表明,LSC區比SSC區和IR區的差異更大,非編碼區的差異比編碼區的差異更大。25個物種的系統發育關系推斷,櫟屬的成員不形成進化枝,而麻櫟(Quercus acutissima)與栓皮櫟(Q.variabilis)密切相關。本研究確定了麻櫟葉綠體基因組的獨特特征,為物種鑒定和生物學研究提供了理論依據。


  材料方法

  材料:在南京林業大學和南京紫金山分別種植麻櫟,收集新鮮的葉子用冰冷凍,并立即儲存于-80?C,以供后期分析。

  方法:測序平臺:Illumina Hiseq 2500;數據質控:Fastqc;組裝軟件:NOVOPlasty;注釋:CpGAVAS;檢測注釋結果:Dogma和BLAST;鑒定tRNA:tRNAcanse;圖譜繪制:OGDRAWv1.2;用MISA和REPuter對SSRs和long repeat進行處理;序列比對:MUMmer;用NCBI和NR數據庫,結合BI(貝葉斯推理)方法構建系統進化樹;序列對齊:MAFFT;序列可視化和調整:BioEdit;最優擬合評價:IQ-tree;用Mrbayes進行BI分析。



  結果分析

  1.麻櫟CpDNA的特征


  Fig.1麻櫟葉綠體基因組圖譜


  圓周內的基因是順時針轉錄的,而外面的基因則是逆時針轉錄的。具有不同功能的基因是彩色編碼的。內部圓圈中較深的灰色顯示GC含量,而較淺的灰色顯示AT含量。

  Cp基因組顯示出典型的四部分結構,包括一對IR(25,816bp),由大的單拷貝(LSC;90,423 bp)和小的單拷貝區域(SSC)分隔。

  LSC區、SSC區、IR區和全基因組的DNA G+C含量分別為34.62、30.84、42.78和36.08 mol%,與其它櫟屬植物的葉綠體基因組相似,如圖A1和表2。


  Fig.A1葉綠體基因組的BLAST結果和麻櫟的GC偏移


  表2麻黃葉綠體基因組的堿基組成


  DNA G+C含量是物種親和力的重要指標。IR區DNA G+C含量明顯高于其它區域(LSC、SSC),這種現象在其他植物中很常見。

  在麻櫟葉綠體基因組中,136個功能基因被預測并分成6組,包括8個rRNA基因、40個tRNA基因和88個蛋白質編碼基因(表1和3)。此外,14個tRNA基因、8個rRNA基因和15個蛋白質編碼基因在IR區域被復制(圖1)。LSC區包括62個蛋白質編碼區和25個tRNA基因,SSC區包含13個蛋白質編碼基因(表A1)。

  表1 五種櫟屬葉綠體基因組特征綜述

  


  表3 對麻櫟Cp基因組中注釋的基因進行了排序


  表A1麻櫟葉綠體基因組中的基因數目


  發現23個包含內含子的基因,包括15個蛋白質編碼基因和8個tRNA基因(表4)。

  表4麻櫟葉綠體基因組外顯子和內含子基因的內含子長度


  21個基因(13個蛋白編碼基因和8個tRNA基因)包含一個內含子,2個基因(ycf 3和clpP)包含兩個內含子。trnK-UUU內含子最大(2505bp),trnL-UAA內含子最小(483bp)。

  有研究表明,ycf 3是光系統Ⅰ復合物穩定積累所必需的。因此推測,麻櫟的ycf 3內含子增益可能有助于進一步研究光合作用演化的機制。


  2.基因組結構的比較分析

  葉綠體序列通常用于測量物種內部的遺傳多樣性、物種間的基因流動以及分離的姐妹物種祖先種群的大小。因此,有必要了解物種間葉綠體的差異。將麻櫟的葉綠體基因組和栓皮櫟,匙葉櫟,板栗,猴面柯,米心水青岡的葉綠體基因組進行比較。米心水青岡有最小的Cp基因組,最大的IR區(51,784 bp),匙葉櫟有著最大的Cp基因組(表1)。

  為了驗證基因組差異的可能性,以栓皮櫟為參考,用mVISTA程序計算了6種葉綠體DNA的序列同源性(圖2)。


  排列上方的灰色箭頭和粗粗的黑色線條表明了基因的方向。y軸表示從50%到100%的相似性。


  Fig.2以栓皮櫟葉綠體基因組為參照,對6個物種進行完整的葉綠體基因組比較

  比較結果表明,LSC區域比SSC和IR區域具有更大的差異,而非編碼區域的差異高于編碼區。F.engleriana(米心水青岡)的完整Cp基因組序列與其他五個植物有很大的不同。

  六個物種中Cp基因組的變異主要發生在LSC和SSC區域,部分基因的編碼區域存在顯著差異,在非編碼區中差異最大的是基因間區域基因(圖A2)。

  Fig.A2 6個物種的完整Cp基因組變異百分比


  IR區的收縮和擴張在演化中起著重要的作用。它們是常見的進化事件,也是葉綠體基因組大小變化的主要原因。它們也可能導致被子植物質體基因組長度的變化。圖3詳細比較了上述六種殼斗科植物Cp基因組的IR-SSC和IR-LSC邊界。


  基因用彩色盒子表示。基因和邊界之間的差距用堿基長度(bp)來表示。基因的延伸在方框的上方。


  Fig.3葉綠體基因組的大單拷貝(LSC)、小單拷貝(SSC)和反向重復(IR)區比較

  結果表明,在栓皮櫟屬中,IR區相對高度保守--栓皮櫟Cp基因組中rpl2基因在LSC/IRB邊界處由IRB向LSC轉移62 bp,在IRA/LSC邊界處由IRA向LSC轉移62 bp。與屬內其他物種相比,IRA/SSC區域范圍變化較大。ycf 1基因跨越SSC/IRB區,SSC/IRA連接位于所有殼斗科植物葉綠體基因組的ycf 1區,并根據基因組以不同的長度延伸到SSC區。


  3.長重復序列和SSR分析

  在重復序列結構分析中(表5),在麻櫟Cp基因組中檢測到31個正向重復和22個反向重復。


  表5麻櫟葉綠體基因組中的長重復序列


  這些重復大多在19~46bp之間。最長的反向重復是46bp,位于LSC區域。在LSC、SSC、IR區域分別發現了35個,18個和8個重復。7個反向重復被發現在IR區,一個和ycf1基因相關,一個和trnV-UAC和trnA-UGC基因相關。基因間間隔的大部分重復序列分布在LSC區域。10個重復序列分布在SSC區域,其中只有4個位于基因間隔區。

  由于葉綠體特異性SSR是單性遺傳的,易發生滑脫鏈錯配,因此常用于野生植物的種群遺傳學、物種鑒定和進化過程研究。


  表6麻櫟葉綠體基因組中的簡單序列重復序列(SSRs)


  研究共發現65個SSRs,主要分布在LSC和SSC中,部分分布在IR中。其中單核苷酸SSRs 61個(93.85%),二核苷酸SSRs 4個(6.15%)。與其他櫟類相比,麻櫟中發現的SSRs種類較少。其中兩個SSR屬于c型,其他都屬于A/T型。還發現12個SSR定位在基因中,其余均位于基因間區。


  4.系統進化分析法

  對25個植物的葉綠體基因組進行了系統發育分析(圖4)。采用基于RAxML的貝葉斯推理(BI)方法構建系統發育樹,以楸子(海棠果)、醉翁榆為外群。


  Fig.4貝葉斯推斷(BI)系統發育樹重建,包括基于所有葉綠體基因組的25種植物


  結果表明,值得注意的是,櫟屬的物種并不構成一個類群。幾種常綠樹種聚集在一起形成一個類群。中國特有種中,麻櫟(Q.acutissima)和栓皮櫟(Q.variabilis)是姊妹種,常混在一起;第二個分支分裂成兩個子類。F.engleriana排在首位,Q.acutissima似乎與Q.variabilis、Q.dolicholepis和Q.baronii更接近。



  結論

  本研究報道并分析了中國特有的生態樹種-麻櫟的Cp全基因組。葉綠體基因組的保守性與其它櫟屬相似。與其它5種櫟木的Cp基因組相比,其LSC在4個區域間差異較大,而非編碼區發散較高。通過對6個物種間系統發育關系的分析,發現麻櫟與栓皮櫟有著密切的關系。該樹種在殼斗科植物中的發育地位與前人的研究結果基本一致。

  這項研究的結果提供了麻櫟的一個完整的葉綠體基因組的組裝,這可能有助于未來的遺傳學、育種和生物學發現。


  原文鏈接:http://doi.org/10.3390/ijms19082443