1. 研究目的与意义
植物的细胞器(叶绿体和线粒体)基因组序列为研究植物分子生态及进化提供了重要的资源和信息。随着dna高通量测序技术的发展,越来越多的植物全
基因组被测序。然而,由于植物的细胞器基因组dna难于和核基因组dna分
离,这使植物中单独分离纯化细胞器dna测序变的非常麻烦、困难及耗时长。因此,能从植物全基因组测序数据中组装叶绿体及线粒体基因组变的非常重要,并且在系统进化、物种鉴定、核质互作、基因工程等研究中也具有重要作用。
2. 国内外研究现状分析
随着基因组测序技术的进步及测序数据的迅猛增长,DNA测序目前已发展到第三代测序技术,该技术主要有单分子实时测序技术和纳米单分子测序技术。该测序方式对比第二代测序直接对DNA分子测序,不需要模板扩增,具有更高的通量和灵敏度,更长读长及测序费用更低。第三代单分子实时测序技术(SMRT)虽然弥补了第二代测序读长短、受GC含量影响大等局限性,同时时间复杂度较低,模板不用进行扩增,但是其测序的随机错误率较高影响了拼接算法的可行性,进而降低基因组装配的质量。应对第三代测序获得的reads数据准确性低的状况,需要进行高效精确确的数据纠错,进而对全基因组组装拼接。
目前,国内外关于基因组拼接组装的软件主要通过以下三种策略实现:基于贪心策略的算法、基于OLC图的算法和基于De Bruijn图的算法。
3. 研究的基本内容与计划
(1)研究内容
一、介绍
1.茶花介绍(历史、历史、特征、分布、价值等)
4. 研究创新点
dna测序目前已发展到第三代测序技术,该技术主要有单分子实时测序技术和纳米单分子测序技术。该测序方式对比第二代测序直接对dna分子测序,不需要模板扩增,具有更高的通量和灵敏度,更长读长及测序费用更低,但是其测序的随机错误率较高影响了拼接算法的可行性,进而降低基因组装配的质量。第三代测序技术平均准确性只有87%-89%,因此需要进行数据纠错。
本研究课题:茶花三代数据的线粒体全基因组装配
(1)对第三代测序获得的reads数据进行纠错,进而组装拼接线粒体基因组,获得精确度高的线粒体全基因组。
