1. 研究目的与意义
卵菌基因组存在一类特殊的分泌蛋白,它们是从已鉴定的无毒基因的序列比对中被发现:一般为短蛋白,没有内含子,序列前端的信号肽下游,50-70 位氨基酸左右,具有保守的 RxLR-dEER 元件。RxLR类(R,精氨酸;x,任何氨基酸;L,亮氨酸)效应分子在卵菌逃避植物识别以及卵菌进化过程中均起着重要作用。因RXLR-dEER与卵菌无毒基因具有类似的N端保守结构,因此将这类蛋白称作无毒基因同系(Avr homologs, Avh )基因。本研究借助重复比对(recursive BLAST)、隐马尔可夫(HMM)、跨膜结构预测等生物信息学方法,从樟疫霉中筛选出RXLR类效应分子,并对这些效应分子的进化关系和结构域进行分析,从而对后期研究效应分子的毒性功能和作用机制提供重要依据。
2. 国内外研究现状分析
随着病原菌无毒基因研究的深入,研究者发现由无毒基因编码的蛋白或者被携带相应抗病基因的植物识别而表现无毒功能,或者不被未携带相应抗病基因的植物识别而表现毒性功能的一类蛋白质,称之为效应分子。卵菌门中的大豆疫霉、橡树疫霉均含有350个左右的保守RXLR-DEER(R.精氨酸;X.任何氨基酸;L.亮氨酸;D.天冬氨酸;E.谷氨酸)基序(motif)的效应分子。已经明确植物病原卵菌RXLR效应分子功能具有多样性、冗余性等特点。植物与病原菌互作过程中,病原菌为了实现在植物中定殖、扩展等过程,会有众多分泌蛋白参与其中,发挥着重要作用。而根据病原菌效应分子保守基序的特点,大部分效应分子属于分泌蛋白。真菌的分泌蛋白具有以下4个基本特征:N端含有信号肽;无跨膜结构域;无GPI锚定位点;不具有将蛋白输送至线粒体等胞内细胞器的预测定位信号。基于上述特征,众多国内学者利用生物信息学相关软件,对已经完成全基因组测序的酿酒酵母、根癌土壤杆菌、禾谷镰刀菌、粗糙脉孢菌、稻瘟菌、大丽轮枝菌、致病疫霉、米曲霉、禾谷炭疽菌进行了分泌蛋白预测。目前,认为病原菌效应分子除具有分泌蛋白的4个基本特征外,还应具有以下3个基本特征:氨基酸序列长度为50-300个氨基酸;富含半胱氨酸;具有高度序列特异性。
在卵菌基因组中发现了大量具有RXLR-dEER基序的外泌蛋白,因为它们具有与卵菌无毒基因类似的N端保守结构,因此将这类蛋白称作无毒基因同系(Avr homologs, Avh )基因。卵菌中被预测有信号肽的效应因子有很大一部分的特征为N端具有RxLR-dEER功能域。借助重复比对(recursive BLAST)和隐马尔可夫(HMM)生物信息学方法,以无毒基因Avr1b为母序列,在P. sojae和P. ramorum基因组中分别预测到了370和385个RXLR-dEER基因,其中有68个基因在基因序列上因为出现移码现象而被判定为假基因。在755个Avh基因中552个有严格的RxLR序列,但是其它的基因中存在着KxLR,RxLG或PxLR等相似序列,这些变化的序列仍然保留着细胞定位的功能,但含有这些序列的基因可能是假基因或无功能的基因。这些基因中包括54个实验已经验证的RxLR基因和30个高度相似的预测基因。为了鉴定在RxLR基因C端有可能的保守域,MEME程序被用于扫描RxLR-dEER序列后的C端序列,鉴定到多个长度为21-30氨基酸的保守域,分别叫做W,Y和L保守域。有60%的RxLR基因含有W保守域,而含有Y和L保守域的RxLR基因占基因总数的30%。Y和L保守域在95%的情况下是位于W保守域之后,形成一个W-Y-L模式。有30%的家族成员拥有两个到八个W-Y-L模式序列,重复排列在C端,而且这30%的家族成员比起其它没有W-Y-L模式序列的成员具有更高的编码可信值,也就是说这些预测基因编码真正基因的可能性更大。
CRN基因家族就是其中的一类胞质效应分子蛋白,首先是在致病疫霉中发现的。通过研究分泌蛋白转录,发现有两个蛋白可以引起烟草的细胞坏死,命名为CRN1和CRN2。之后几年对CRN基因家族的研究较少,直到致病疫霉的基因组测序完成后,Haas等将致病疫霉、大豆疫霉和橡树疫霉基因组数据一起进行比较,对CRN家族做了大量的分析。他们发现CRN家族基因是个非常庞大的基因家族,基因数目非常多,在致病疫霉中有451个(196个基因和255个假基因),大豆疫霉有202个(100个基因和102个假基因)以及橡树疫霉的61个(19个基因和42个假基因)。CRN家族在N端的大约50个氨基酸左右的位置含有FLAK序列元件,近期的实验证明,这个序列元件就是CRN家族进入寄主细胞所必须的。CRN家族的C端是它的功能区域,根据其序列的保守性,Haas等将致病疫霉的CRN家族的C端归纳出36个保守的功能域,并且发现CRN基因具有干扰寄主细胞生理的功能,其中DC, DBF, D2和DXW-DXX-DXS与CRN2的DXZ功能域相似,具有引起细胞死亡的活性[4]。CRN效应因子在其蛋白N端为信号肽紧接着有一个高度保守的FLAK(F:苯丙氨酸,L:亮氨酸,A:丙氨酸,K:赖氨酸)保守基序,其C端为多变区域。N端的信号肽-FLAK序列模式是CRN效应因子的分类特征,早期很多研究均认为CRN效应因子的主要活性是诱导植物细胞死亡,然而近期的研究结果表明,只有极少数的CRN效应因子可以诱导植物细胞死亡。我们发现很多CRN效应因子能够抑制由激发子触发的细胞死亡,这些结果表明我们可以利用疫霉菌的效应因子提高植物的抗病性。
3. 研究的基本内容与计划
(1)2015.10.20―2015.11.30:查阅文献,做好预备实验;
(2)2015.12.01-2016.5.20:卵菌中被预测有信号肽的效应因子有很大一部分的特征为N端具有RXLR-dEER,同时功能域效应分子CRN基因家族是卵菌中发现的一组基因,与RXLR家族类似,属于寄主胞质效应分子,其首次在致病疫霉中被报道能引起烟草的细胞死亡,并因此命名Crinkler and necrosis protein(CRN)。本研究借助重复比对(recursive BLAST)和隐马尔可夫(HMM)等生物信息学的方法对樟疫霉RXLR家族和CRN基因家族进行了分析。在鉴定RXLR效应分子的基础上,构建序列进化树了解基因之间关系;同时鉴定出已经测序的大豆疫霉、橡树疫霉、致病疫霉的RXLR家族的效应分子,并进行进化关系分析。同时对樟疫霉CRN基因家族进行了分析,表明该基因家族为卵菌所特有,且具有保守的LQLFLAK序列元件和HVLVVVP序列元件,在鉴定CRN效应分子的基础上,构建序列进化树了解基因之间关系。
4. 研究创新点
疫霉菌分泌效应蛋白以改变寄主生理以促进侵染。这些进化速度较快的分泌蛋白主要分布在致病疫霉基因组中基因较分散的区域。致病疫霉编码的众多家族的与致病相关的效应分子,大致分为两类:一类是作用于植物细胞间的质外体(apoplastic)效应分子;另一类则是通过侵染结构吸器(haustorium)被直接转运进入植物细胞的细胞质(cytoplasmic)效应分子。前者包含了分泌的水解酶,如蛋白酶、脂肪酶和糖基化酶等,用于降解植物组织;用于保护病原菌避免被植物防卫酶类破坏的酶抑制剂;引起坏死的毒素,如Nep1-like 蛋白(NLP)和PcF-like 富含丝氨酸小蛋白(PcF-like small cysteine-rich proteins, SCRs)。在疫霉属中,候选的效应分子数量众多,且与非致病相关因子
比,数量上具有明显的扩张现象,如:分泌到细胞内的RxLR 和Crinkler(CRN)家族的效应分子。对卵菌中存在的大量效应分子进行生物信息学分析,结果表明: RXLR效应分子其N末端RxLR基序两侧30-60个氨基酸之间具有显著的偏好性,具有分泌和转运功能;同时C末端区域变异性较大,可能涉及快速逃避植物或动物R蛋白的检测、并具有操控植物或动物防卫反应的功能。RxLR核心基序对于卵菌效应分子在各自病原系统中的转运是必要的,但是仅仅依靠它们并不能完成全部转运功能,尚需要两翼序列共同来完成其转运功能。CRN家族基因目前其功能的研究还不多,主要集中在对其基因组水平的研究和引起坏死活性的研究,最近的实验表明它们具有转运入核的作用,,并且具有将转运到寄主细胞的功能,与致病疫霉的和大豆疫霉的序列元件具有类似的功能。本研究对樟疫霉CRN家族基因在主要的物种内做了生物信息学分析,发现CRN家族基因是卵菌特有的一组基因。CRN家族基因是一组序列相似性非常高的基因,是疫霉基因组庞大和进化快速的重要组成部分。因此,对这组基因在基因组中的分布和进化分析可以揭示樟疫霉在进化过程中是如何逃避寄主的识别和在侵染过程中起到一定的作用的。
