基于叶绿体的植物基因组进化研究开题报告

 2021-08-09 01:04:03

1. 研究目的与意义

关于叶绿体的起源,目前大家普遍认可的是内共生理论,即叶绿体来源于原始的古细菌蓝藻.在这次事件中,具备光合能力的蓝藻首先被没有光合能力的单细胞真核原生生物吞噬,进一步被控制,最终形成相互依赖关系,逐步演化成后面3个主要种群,即绿藻(green algae)、红藻(red algae)和褐藻(glaucophyte algae),其中部分藻类还进行了第2 次共生,第3次共生,甚至第4次共生. 这3个种群之间的关系还不是十分清晰,但褐藻一个明显的特征是其叶绿体结构中二层胞膜之间还保留来自祖先蓝藻的肽聚糖壁的遗迹,而另外2个种群则没有保留下来. 通过分析一种褐藻(Cyanophora paradoxa)叶绿体编码的蛋白质序列,发现这种褐藻比绿藻和红藻的分化时间要早. 最古老的真核生物种群化石证明,红藻的首次出现大约是在一亿二千万年前,支持此学说的证据还包括发现了一种光合细胞器蓝小体,结构类似蓝藻,DNA和叶绿体相似,是介于二者之间的一种过渡结构. 除此之外,叶绿体细胞分裂的机制还部分类似于其原核生物的祖先。

叶绿体作为植物细胞器的重要组成部分和光合作用的器官,叶绿体在生物进化的漫长历史中发挥了重要作用. 伴随着生物技术的深入发展,人们发现叶绿体基因组结构和序列的信息在揭示物种起源、进化演变及其不同物种之间的亲缘关系等方面具有重要价值. 与此同时,比核转化具有明显优势的叶绿体转化技术在遗传改良、生物制剂的生产等方面显示出巨大潜力,而叶绿体基因组结构和序列分析则是叶绿体转化的基石. 基于叶绿体的这些重要作用,收集整理了有关的资料,从几个方面归纳了本领域最近的研究进展,希望能使读者对迅速发展的叶绿体基因组研究有更全面的了解,以及对叶绿体基因组在物种的进化、遗传、系统发育关系等方面的作用有更深刻的认识,同时也希望对叶绿体转化技术的研究和广泛应用产生积极作用.而本课题主要是针对在提取植物叶绿体序列特征的基础上,构建系统发生树,研究植物进化演变历程。

2. 国内外研究现状分析

1909年,Correns和Baur分别独立地从紫茉莉(Mirabilis jalapa) 和马蹄纹天竺葵(Pelargoniumzonale)的叶色遗传中发现非孟德尔现象,之后在光学显微镜下发现叶绿体中存在DNA,在电子显微镜下看到了DNA纤丝,并发现有从单体到四体等多种存在形式.利用叶绿体基因组研究不同物种之间的关系主要有3种方法。

1酶切. 1998年以前此方法广泛应用. 通过酶切片段大小的比较了解不同物种叶绿体基因组序列之间的变化. 1979 年Scowcroft以9种不同群体的烟草为材料,仅用EcoRⅠ一种酶切,发现了酶切图谱的变化并据此得到一个简单的关系图. 1980年,Vedel等利用4种麦类作物为材料,4种酶切,研究叶绿体和线粒体之间的进化关系,发现叶绿体基因组酶切的多态性要远小于线粒体基因组. 1982年Palmer等用12个番茄属(Lycopersicon) 品种和3 个近缘茄科(Solanaceae)品种作为材料进行分析,在25 种内切酶酶切后的凝胶电泳图谱中,调查的484个酶切位点中仅检测到39个位点的突变.2研究结构重组. 利用分子杂交和PCR的方法对大量的叶绿体基因组发生重组的位点附近进行比较,检测结构的变化如基因、内含子的倒位丢失、IR区域的膨胀与收缩等. 菊科中许多原来互相矛盾的关系通过此方法得到了理顺和纠正.3测序.1986年烟草和地钱叶绿体基因组序列的发表使人们第一次有机会从碱基水平上对不同基因组之间进行比较,在研究方法上有了实质性的突破. 第一种方法由于分析的局限性而逐步淘汰,后二种方法还将继续应用. 在DNA序列的差异非常多的时候,用分析结构的方法尤为重要,遗憾的是这种可以被利用的结构差异比较少.不同物种之间基因组的比较和重复分析可以提供丰富的信息. 首先,可以用Dogma 程序来进行基因鉴定,然后利用如MultiPipmaker等多种软件工具来比较基因组序列. 通过比较,可以了解基因组成、基因顺序、序列的相似性、重复序列等一系列信息. 目前,已经得到的82组不同物种叶绿体基因组的序列中,被子植物共占46组,其中双子叶植物37组和单子叶植物9组,裸子植物3组,其他包括苔藓类、藻类等低等原生生物共33组. 基因数量最多的是条斑紫菜,为264个;最少的是一种寄生性绿藻(Helicosporidium sp.ex Simulium jonesii), 为54个. 科学家在新喀里多尼亚岛(New Caledonia)上发现一种常绿灌木(Amborella trichopoda),被认为是最古老被子植物惟一现存的代表,可能代表裸子植物和被子植物之间分化刚开始时关键的中间状态,其叶绿体序列已公布,共有133个基因,其中编码蛋白质的基因有86个.重要作物叶绿体基因组的研究非常重要.目前,许多作物如水稻、小麦(Triticum aestivum)、玉米、大豆(Glycine max)等的叶绿体基因组序列已测定. 同时,新的序列不断出现,本研究小组关于大麦(Hordeum vulgare)、高粱(Soughum bicolor)和草坪草(Agrostis stolonifera)叶绿体基因组序列的研究论文前不久刚发表. 这几种作物叶绿体基因组序列的特征上,其A T含量基本一致,水稻为61.1%,小麦为61.7%,玉米为61.5%,大麦为61.9%,高粱为61.5%,草坪草为61.55% . 大豆叶绿体基因组的序列特征和其他被子植物差别较大,A T含量比较高,为66%,而且在LSC区域的rbcL基因和rps16基因之间有一个约51kb的序列倒置片段,这个现象在其他豆科植物如百脉根(Lotus japonicus)和苜蓿也同样存在. 通过比较水稻、小麦和玉米的叶绿体基因组,发现了一些容易产生突变的热点区域,而且串联的tRNA区域和其下游的rbcL表现出种属特异性,IR区域里面开放阅读框的删除方式和IR与SSR的边界特征表明,水稻和小麦之间的亲缘关系比玉米更密切. 一般的研究只用一个叶绿体基因组的基因研究禾本科的进化关系,很难明确其关系,而Matsuoka等用106个基因进行研究,用烟草作为参照,通过对水稻、小麦和玉米叶绿体基因组的比较,发现86.8%的基因进化速率一致,相对其他基因,RNA基因的进化高度保守,同时也得出明确结论,支持水稻(竹亚科)和小麦(早熟禾亚科)之间的关系更加紧密的论点,说明玉米(黍亚科)在草本植物进化的早期就和水稻、小麦开始分化了.

3. 研究的基本内容与计划

1分子系统发生分析 系统发生学是进化生物学的一个重要研究领域,系统发生分析早在达尔文时代就已经开始。从那时起,科学家们就开始寻找物种的源头,分析物种之间的进化关系,给各个物种分门别类。经典系统发生学研究所涉及的特征主要是生物表型(phenotype)特征,所谓的表型特征主要指形态学的(结构的)特征,如生物体的大小、颜色、触角个数,也包括某些生理的、生化的以及行为习性的特征。通过表型比较来推断生物体的基因型(genotype),研究物种之间的进化关系。但是,利用表型特征是有局限性的。有时候关系很远的物种也能进化出相似的表型,这是由称为趋同进化(convergent evolution)的过程造成的。例如,如果一个生物学家按照生物体是否有眼睛来构建进化树,那么他可能将人类、两翼昆虫和软体动物放在同一个进化组中,因为它们都有光探测器官。在这个例子中,很明显这三种生物体并不具有密切的关系,在其它特征上有天壤之别,就是它们眼睛的构造也大相径庭。这说明表型有时候会误导我们,表型相似并不总是反映基因相似。用表型来判定进化关系的另一个问题是,对于许多生物体很难检测到可用来进行比较的表型特征。例如,即使用显微镜检查,也难以发现细菌的明显特性。当我们试图比较关系较远的生物体的时候,第三个问题又出现了,即什么样的表型特征能用来比较呢?例如,分析细菌、蠕虫和哺乳动物,它们之间的共同特征实在是少之又少。随着人们对生物的认识从宏观发展到微观,科学家对物种分类的依据也从宏观上的形态发展到了微观上的分子,并且有了突破性的进展,系统发生分析进入分子层次。科学家认为,现今世界上存在的核酸和蛋白质分子都是从共同的祖先经过不断的进化而形成的,作为生物遗传物质的核酸和作为生命机器的蛋白质分子中存在着关于生物进化的信息,可用于系统发生关系的研究。在分子水平上进行分析具有许多表型分析所没有的优势,所得到的结果更加科学、可靠。分子系统发生分析直接利用从核酸序列或蛋白质分子提取的信息,作为物种的特征,通过比较生物分子序列,分析序列之间的关系,构造系统发生树,进而阐明各个物种的进化关系。当然,这些分子不仅在序列上保留进化的痕迹,它们的结构也保留着进化的痕迹。在分子水平上研究生物之间的关系早在20世纪初就开始了。科学家发现,当把一个生物体的血液注射到另一个测试生物体中时,产生免疫反应的程度与这两个生物体的进化关系直接相关,由此最早正确地推断出人和猿比它们和其它灵长类动物有更近的共同祖先。直到20世纪中期,分子数据才开始被广泛应用于系统发生研究。蛋白质电泳使得我们可以在一些浅层特征上,如分子大小和电荷,来分离和比较相关的蛋白质。20世纪60年代,蛋白质测序成为可能;20世纪70年代,研究者开始能够获得基因组信息,特别是DNA序列。蛋白质序列和DNA序列为分子系统发生分析提供了可靠的数据。 在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。根据核酸和蛋白质的序列信息,可以推断物种之间的系统发生关系。其基本原理非常简单,从一条序列转变为另一条序列所需要的变换越多,那么,这两条序列的相关性就越小,从共同祖先分歧的时间就越早,进化距离就越大;相反,两个序列越相似,那么它们之间的进化距离就可能越小。为了便于分析,一般假设序列变化的速率相对恒定。关于地球上现代人起源的研究是一个典型而有趣的例子,科学家分析了取自世界不同地区许多人的线粒体DNA,分析结果表明,所有现代人都是一个非洲女性的后代。线粒体DNA非常适合于系统发生分析,因为线粒体DNA从母体完全传到子代,不与父代DNA重组。由于DNA 分子非常稳定,所以我们既可以通过DNA 分析活着的生物,也可以分析死去的生物,甚至分析已经绝种的生物。当然,用细胞核基因来研究系统发生关系时,遇到的一个严重的问题是,基因常常会被复制,导致在个体基因组中,一个基因可能有若干个拷贝。在进化过程中,这些拷贝各自演变,形成两个或更多的相似基因。在对不同物种的基因进行比较时,如果选择这类基因,其分析结果的可靠性将存在问题。所有的生物都可以追溯到共同的祖先,生物的产生和分化就像树一样地生长、分叉,以树的形式来表示生物之间的进化关系是非常自然的事。可以用树中的各个分支点代表一类生物起源的相对时间,两个分支点靠得越近,则对应的两群生物进化关系越密切。系统发生分析一般是建立在分子钟(molecular clock)基础上的。生物随着时间的推进而演化,进化的速率被视为进化研究中的基本问题之一。进化速率就是在某一段时间内的遗传改变量。分子进化速率相关的分子钟的概念源于对蛋白质序列的研究。在长期的进化过程中,有着相似功能约束的位点的分子进化速率则几乎完全一致。20世纪60年代最早由Emile Zuckerkandl 和Linus Pauling所做的蛋白质序列的比较研究表明,蛋白质同系物的替换率就算过了千百万年也能保持恒定,因此他们将氨基酸的变异积累比做分子钟。科学家们在比较几种动物的血红蛋白、细胞色素C的序列后注意到:这些蛋白质的氨基酸取代速率在不同的种系间大致相同,即分子水平的进化存在恒速现象。分子时钟在不同的蛋白质中运行的速率是不同的,但是,两个蛋白质同系物的差异始终和它们独立分化的时间成正比。两序列间稳定的变异速率,不仅有助于确定物种间系统发生关系,而且能够像利用放射性衰变考察地质年代那样,准确测定序列分化发展的时间。不同物种间的蛋白质氨基酸序列差异随着分歧时间的加大而增加,而DNA 序列也存在这种规律。Kimura进一步提出了具体的分子进化观点:对于各物种的每个蛋白质,如果用每个位点每年发生的氨基酸替换次数作为衡量分子进化的速率,则该速率是大致恒定的;功能上次要的分子(或者分子部分)的进化速率比功能重要的分子(或者分子部分)进化速率快;对现有分子结构或者功能破坏小的氨基酸替换比破坏力大的氨基酸替换发生得更加频繁。尽管以上的分析给我们带来了很多希望,但是,Zuckerkandl 和Pauling的分子时钟假说还是有争议的。经典进化学家们认为形态的进化不够稳定,这与分子以稳定的速度变异不一致。关于分化时间也有不同意见,这些意见对这个假说的核心即进化率是稳定的表示质疑。2系统发生树各种进化树(自N. Nikolaidis)

一般来说,系统发生树是一种二叉树。所谓树,实际上是一个无向非循环图。系统发生树由一系列节点(nodes)和分支(branches )组成,其中每个节点代表一个分类单元(物种或序列),而节点之间的连线代表物种之间的进化关系。树的节点又分为外部节点(terminal node)和内部节点(internal node)。在一般情况下,外部节点代表实际观察到的分类单元,而内部节点又称为分支点,它代表了进化事件发生的位置,或代表分类单元进化历程中的祖先。分类单元是一种由研究者选定的基本单位,在同一项研究中,分类单元一般应当一致。在下面的讨论中,我们基本上以序列(DNA序列或蛋白质序列)作为分类单元。树节点间的连线称为分支,其中一端与叶节点相连的为外支,不与叶节点相连的为内支。系统发生树有许多形式:可能是有根树(rooted tree),也可能是无根树(unrooted tree);可能是一般的树,也可能是二叉树;可能是有权值的树(或标度树,scaled tree,树中标明分支的长度),也可能是无权值树(或非标度树,unscaled tree)。在一棵有根树中,有一个唯一的根节点,代表所有其它节点的共同祖先,这样的树能够反映进化层次,从根节点历经进化到任何其它节点只有唯一的路径。系统发生分析中一个重要的差别是,有的能由系统发生树推断出共同祖先和进化方向,而有的却不能。无根树没有层次结构,无根树只说明了节点之间的关系,没有关于进化发生方向的信息。但是,通过使用外部参考物种(那些明确地最早从被研究物种中分化出来的物种),可以在无根树中指派根节点。例如,在研究人类和大猩猩时,可用狒狒作为外部参考物种,树的根节点可以放在连接狒狒与人和大猩猩共同祖先的分支上。二叉树是一种特殊的树,每个节点最多有两个子节点。在有权值的树中,分支的长度(或权值)一般与分类单元之间的变化成正比,它是关于生物进化时间或者遗传距离的一种度量形式。一般假设存在一个分子钟,进化的速率恒定。系统发生树具有以下性质: (1)如果是一棵有根树,则树根代表在进化历史上是最早的、并且与其它所有分类单元都有联系的分类单元; (2)如果找不到可以作为树根的单元,则系统发生树是无根树; (3)从根节点出发,到任何一个节点的路径均指明进化时间或者进化距离。 对于给定的分类单元数,有很多棵可能的系统发生树,但是只有一棵树是正确的,分析的目标就是要寻找这棵正确的树。基于单个同源基因差异构建的系统发生树称为基因树(gene tree),这比称作物种树(species tree)更为合理。因为这种树代表的仅仅是单个基因的进化历史,而不是它所在物种的进化历史。物种树一般最好是通过综合多个基因数据的分析结果而产生。基因树和物种树之间的差异是很重要的,例如,假设只用HLA的等位基因来构建物种树,许多人将与大猩猩分在一起,而不是和其他人分在一起。3构建方法以NEXUS文件或PHYLIP文件为基础。建树的方法包括:包括UPGMA法, 邻位法,最少进化法等还有极大似然法、贝叶斯法、最大简约法等。有为数众多的软件可以实现,参见网址http://evolution.genetics.washington.edu/phylip/software.html基于以上方法等都需要考虑ATCG相互替换的关系,即碱基替换模型。建立进化树的软件PHYLIP 距离法、极大似然法PAUP* 最大简约法、极大似然法、距离法MrBayes贝叶斯法PHYML 极大似然法(大样本量)RAMxL 极大似然法(大样本量)MEGA 距离法、极大似然法等

4. 研究创新点

研究者们之前分别对棉花、小麦、蕨类植物、水稻等植物做了不同方向的研究,都取得了突破性的进展,而本课题则是通过植物叶绿体的全基因组序列,研究植物的分类和系统进化。借助于信息论,提取植物叶绿体全基因组的序列特征,将四进制的DNA序列转换成计算机可处理的二进制信息,构建分子系统发生树,研究植物进化演变历程。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版