食性进化研究(2):植食者天牛
2016-11-15 18:08阅读:
天牛是鞘翅目多食亚目天牛科昆虫的总称,咀嚼式口器,有很长的触角,常常超过身体的长度,全世界约有超过35,000种。其中一些种类属于害虫,其幼虫生活于木材中,可能对树或建筑物造成危害。
光肩星天牛(Anoplophora
glabripennis,以下简称AGLAB)原产中国,现已入侵美国,英国、澳大利亚等。初孵化幼虫先在树皮和木质部之间取食,25~30天以后开始蛀入木质部;并且向上方蛀食。虫道一般长90毫米,最长的达150毫米。幼虫蛀入木质部以后,还经常回到木质部的外边,取食边材和韧皮。详见Figure1.
Figure 1
A.glabripennis, the Asian longhorned beetle, is a high profile
invasive pestspecies capable of inflicting severe damage on its
hosts, which include manyimportant
orchard, ornamental, and forest tree species.
本研究从头组装出一个AGLAB基因组,联合另外14个昆虫基因组(其中Agrilus
planipennis和Onthophagus
taurus属于i5k计划中新测的物种,鞘翅目物种5个,是系统发育树上绿色枝部分,下文简称甲虫。具体的物种拉丁名及缩写参见Figure
2a),展开比较基因组分析,探讨了AGLAB植食性的适应性进化在基因组上的体现。
Figure 2
Phylogeneticrelationships and estimates of completeness
among the 15 insect genomes studied.
一、
基因组特征
1.
组装与注释
选取AGLAB雌性幼虫,提取DNA,测序组装,一共134X数据,最后装出来的基因组大小为710Mb,Scaffold和ContigN50分别是659kb和16.5kb。
利用MAKER流程预测出22035个蛋白编码基因,手工注释出1144个基因,合并去冗余后,得到22,253个蛋白编码基因,66个假基因。
2.
Horizontal gene
transfer(HGT)鉴定
目前的研究发现,甲虫物种的基因组上有很多基因编码植物细胞壁降解酶(Plantcell wall
degrading enzymes,
PCWDEs),这些酶的主要作用是降解木质植物组织中的纤维素、半纤维素或者果胶(植物细胞壁中的主要成分之一),释放的糖类,矿物质及其它的营养物种。目前的研究表明:一些甲虫的PCWDEs基因,是通过水平基因转移的方式从细菌或者真菌中获得,随后进化成多基因数目的家族。
除了糖苷水解酶(GH)家族基因,利用HGT分析流程还注释出8个HGT候选基因。其中的4个基因来自细菌,与沃尔巴克氏体(Wolbachia)的关系最近;还有2个基因与Wolbachia的序列显示出95%的相似度;最后两个基因与Wolbachia相比出现了indel,只有70-71%的相似度,推测这两个基因可能转移的比较早,后期发生了改变。
预测的这8个基因在随后的RNAseq中没有检测到表达,大概是因为RNAseq选取的是单一组织,而HGT相关的基因具有组织特异性,或者表达量很低,RNAseq检测不到。
相比而言,发生过HGT的GH基因转移时间更为古老,已经进化成功能性的多基因家族。
3.
不完整的甲基化机制
AGLAB基因组上似乎存在不完整的甲基化机制,只发现了维持性甲基化转移酶DNMT1,而缺少denovo
甲基化转移酶DNMT3。这和赤拟谷盗、果蝇比较类似。但是其他的甲虫基因组中存在着完全的甲基化机制。
二、
植物细胞壁降解酶(PCWDEs)研究
在AGLAB基因组中手工注释出86个GH家族基因。其中有57个GH1,18个GH28,11个外生/内生葡聚糖酶,包括GH9、GH45、GH48及GH5亚家族2(GH5-2)的成员。其中GH5是AGLAB基因组特有的(详见Figure3)。
接下来用RNAseq的手段研究食性依赖的GH基因家族的调控表达。做法是分别用人工食物和活的糖枫树(sugarmaple
trees)作为AGLAB的食物,然后测定转录组数据(每组4个三龄幼虫个体。具体差异基因表达的趋势,参考Figure4)。
在糖枫树喂食组中,GH5和GH45基因相比人工食物组的基因表达量在2倍以上,这两个基因可能参与把纤维素转化成容易消化的纤维低聚糖。
超过30个GH1基因在糖枫树组高表达,这些基因推测是Beta-葡萄糖苷酶,转化植物细胞壁中的纤维二糖或者寡聚糖成单糖。GH1家族还有部分的Beta-糖苷酸有解毒的功能。
有12个GH28家族的基因在糖枫树组高表达,GH28在AGLAB近缘物种中的同源基因的功能是聚半乳糖醛酸酶。这样看来,植物细胞壁中的果胶组分可能是AGLAB幼虫主要的糖来源。GH35在糖枫树组也被诱导,同源比对发现和Beta-半乳糖苷酶高度相似,可能在处理植物细胞基质中的Beta-1,4半乳糖苷多聚体中起重要作用。GH30同样被诱导,主要功能可能是消化植物次级细胞壁。
以上都是计算机的预测,没有被真正验证。接下来在体外检查GH酶家族的底物特异性和功能。18个GH28家族基因中有15个在平板鉴定中表现出功能特征。大多数GH28蛋白被至少一种同聚半乳糖醛酸聚合物激活。
另外6个GH5基因,2个GH45基因,1个GH9基因也在体外得到功能验证。通过体外实验分析表明,AGLAB基因组中至少有三个纤维素和半纤维素酶(GH5-2,GH9,GH45),还有1个多聚半乳糖醛酸酶(GH28).
通过数据挖掘,只在三个甲虫物种中发现了GH28、GH45、GH5-2,其他12个昆虫基因组中缺失。其中,GH28在三个甲虫中都检测到了。而GH45只在两个甲虫物种中检测到(AGLAB,DPOND)。GH5-2只在AGLAB中发现,是叶甲总科物种特有的。这些基因没有在白蚁基因组序列中找到,但在其肠道微生物中发现了相关的基因。目前的研究表明GH28家族基因通过HGT的方式获得,并且AGLAB和DPOND是独立获得的。
Figure 3
Sub-familysizes for gycoside hydrolases found in the genome
sequences of 15 insectspecies, including A. glabripennis.
Figure 4
Heatmap showing gene levels from A.glabripennis
gycoside hydrolase genes with putative involvement in plant cell
wall degradation.
另外,GH1家族的基因编码两种蛋白,一种是有消化功能,另外一种没有。AGLAB基因组中23个GH1基因和赤拟谷盗(TCAST)中的葡萄糖硫苷酶(MYR)有44%左右的同源性。对于一些昆虫来说,MYR的作用是协同性警告或者竞争性的信息素。在某些植物中常会释放出硫代葡萄糖苷,恰好是MYR的底物,因此昆虫可以解除毒性。其中还有几个基因是生氰的Beta-糖苷酶。在某些植物中有毒性的生氰糖苷是植物的防御系统,用来对抗生物胁迫。和MYR的机制类似,生氰的Beta-糖苷酶也可以解除生氰糖苷的威胁。
AGLAB肠道中的微生物对其营养物质的生物合成和循环有重要的作用,能帮助AGLAB在营养贫瘠的环境中繁殖、发育。AGLAB编码的基因中,有8个基因有血蓝蛋白的结构域。其中3个高表达的基因在以木质植物作为食物来源的生物中存在,与肠道微生物一起协作,在多个生物反应中起氧化降解作用。
三、
对植物异种化感物的解毒机制研究
1.
CYP450家族
目前植食性动物解毒相关的基因,研究最多的就是CYP450家族基因。通过手工注释,得到106个CYP450基因和19个假基因。CYP6代谢毒性化合物,CYP4参与角质层的碳氢化合物的合成,与杀虫剂的抗性相关。糖枫树喂养的幼虫组中,25个CYP450家族基因在AGLAB的肠道中被诱导。而这些诱导的基因中,只有2个在赤拟谷盗中存在。CYP基因家族的扩张,是AGLAB适应和应对植物防御系统的结果。
2.
UGT家族
UGT(UDP-葡糖醛酸基转移酶)家族的基因参与毒性物质的解毒,外源性物种的降解及内源性物质的调控。手工注释出65个UGTs基因,包括7个假基因。UGTs在甲虫物种基因组中的扩张和其广泛的宿主植物有关,其中大部分基因聚在一起形成cluster,7个cluster就包含了50个基因,其中大部分基因通过串联复制的机制形成多样性,增加了结合次级代谢物底物的范围。
最大的UGT家族是UGT352,对AGLAB物种来说是特异的,包括21个基因,其中的14个UGTs基因同向定位在一个scaffold上(参考Figure5)。AGLAB特异扩张的UGT家族是UGT321,有7个基因,这些扩张能使AGLAB适应广泛的宿主植物的防御系统。在糖枫树喂养的幼虫组中有4个UGT基因上调,包括2个UGT321和1个UGT352基因。
虽然在RNAseq数据中只发现了一部分UGT基因,这主要是因为研究只使用了1个宿主植物喂养有关,不同的宿主,可能会激发不同的UGT基因表达。
3.
酯酶类(Esterases)
在AGLAB基因组中发现了更多的esterases酶,主要是Type-B羧酸酯酶(COesterase)的扩张。COesterase对外源性物质的代谢和植物细胞次级代谢物中木质素-半纤维素的酯键断裂很重要。一共鉴定出107个COesterase,是其它昆虫的两倍多,大部分是形成cluster,只有25%的基因是singletons。
Figure5
Phylogenetictree showing A. glabripennis (color) and T. castaneum
(black)UDP-glycosyltransferases (UGTs), reconstructed from amino
acid sequences usingML inference.
COesterase在糖枫树幼虫组被高诱导,而COesterase基因中被高诱导的基因,大多是AGLAB特异的,在基因组上形成了串联重复。COesterase在AGLAB上潜在的功能是木质植物消化或者植物异种化感素的解毒作用。
消化性蛋白酶作用是清除来自植物细胞壁蛋白或者肠道内共生体的氮物质,用来对抗植物产生的蛋白酶抑制物。蛋白酶的直系同源基因也在AGLAB基因组上发生扩张,编码胰蛋白酶基因,可以产生分泌性的丝氨酸蛋白酶。但是呢,大部分蛋白酶对每种甲虫都是特异的,这可能意味着它们的进化发生在不同甲虫物种形成之后。
四、
AGLAB感官相关的基因研究
1.
化学感官基因
化学感官包括嗅觉和味觉。在AGLAB基因中手工注释出52个OBP(odorantbinding
protein),大部分是minus-C亚家族,只有一个是plus-C亚家族,和TSACT和DPOND类似。表明OBP自从190百万年前鞘翅目扁甲系起源开始,朝plus-C
方向进化。另外鉴定出131个OR(odorant
receptor)。在AGLAB中共鉴定出234个GRs(gustatoryreceptors),其中3个CO2
受体,10个糖受体,3个果糖受体,另有127个GRs,通过可变剪接形成218个受体基因,主要是苦味感知受体和信息素感知受体。类似于TSACT,AGLAB的OR、GR相关的基因比果蝇多。
2.
视觉基因
AGLAB有一个单独的长波长敏感的视蛋白(opsin),一个单独的紫外线敏感的视蛋白。有RH7视蛋白,但是缺C-opsin.
五、
小结
1.
光肩星天牛是一种植食性昆虫,在其基因组中进化出一套完整的酶促指令,可以降解植物宿主中的大部分多聚糖,比如纤维素、木葡聚糖、木聚糖、果胶等。解毒基因和消化蛋白酶基因的多样性组合,提供了代谢的可塑性,来克服不同宿主植物的防御机制。
2.
PCWDEs基因数目在AGLAB基因组上也发生了扩张。其中三个重要的家族GH5-2、GH9和GH45推测是纤维素酶,可以处理纤维素和半纤维素,AGLAB通过利用肠道微生物或者基因组编码的酶处理木质素。
3.
CYP450家族基因、UGTs家族基因及COesterases都在AGLAB基因组中通过串联复制发生了扩张。这些基因家族的功能主要是克服植物宿主释放出来的毒素,降解外源性物质,对抗植物释放的蛋白酶抑制剂。
4.
AGLAB通过HGT,从真菌或者细菌中获得GH基因,GH基因通过基因拷贝数扩增、功能趋异,导致其代谢指令的增加、扩张和强化,使AGLAB适应广泛的植物宿主。
无论是植食性物种还是肉食性物种,在其特定的食性环境下,受到选择,进化出一套完善的对抗指令,比如植食性物种需要对抗植物的防御机制,而肉食动物需要特定的代谢系统,来消化肉食中特定的营养物种,比如高蛋白和高胆固醇以及较低的糖类物质。所以从某种程度上讲,食性塑造了物种的基因,使食物链的上下游形成了一套行之有效的进攻与防御指令。
From:McKenna,
D. D. et al. Genome of the Asian longhorned beetle
(Anoplophoraglabripennis), a globally significant invasive species,
reveals key functionaland evolutionary innovations at the
beetle–plant interface. Genome biology 17,227,
doi:10.1186/s13059-016-1088-8 (2016).
2016/11/13