基于信息技术的基因组序列特征分析开题报告

 2021-08-09 01:03:45

1. 研究目的与意义

基因组研究中已经浮现出大量的数学问题, 已为世界上众多数学家和信息学家关注. 作为解读基因组这一庞大计划的一个十分重要而又基础的部分, 就是研究基因组的结构, 而其中更基础的是DNA 序列的结构. 结构这个词在这里的含义是十分广泛的, 也就是说, 作为由A、T、C、G 四个字符组成的一个有序字符串, 任何呈现规律性的特征都可以称为结构. 由于规律呈现范围不同, 我们又可以分为局部结构与整体结构, 或称小尺度结构与大尺度结构, 这些结构的揭示将大大有助于人们对于基因与基因组的解读。

2. 国内外研究现状分析

一、国际水平

从国际范围看,若干种热带作物基因组学已取得显著进展,例如水稻、番木瓜和甘蔗的姐妹种高梁已完成全基因组测序,并且建立了如甘蔗、香蕉、咖啡、柑桔、可可等多种热带植物的国际基因组数据库与资源库,如多种热带作物的信息系统tropgene-db,这将大大促进热带作物重要农艺性状基因的鉴定与克隆。

美国联邦国家人类基因组研究项目负责人弗朗西斯柯林斯博士于美国当地时间4月14日中午在华盛顿宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的基本内容与计划

基因组研究中已经浮现出大量的数学问题, 已为世界上众多数学家和信息学家关注. 作为解读基因组这一庞大计划的一个十分重要而又基础的部分, 就是研究基因组的结构, 而其中更基础的是DNA 序列的结构. 结构这个词在这里的含义是十分广泛的, 也就是说, 作为由A、T、C、G 四个字符组成的一个有序字符串, 任何呈现规律性的特征都可以称为结构. 由于规律呈现范围不同, 我们又可以分为局部结构与整体结构, 或称小尺度结构与大尺度结构, 这些结构的揭示将大大有助于人们对于基因与基因组的解读。

本课题从信息科学角度,将基因组字符序列视为信息流,j碱基字母出现的特征是熵的改变,采用信息科学中的相关方法对序列进行深度挖掘。

4. 研究创新点

首先对基因组序列的A,T,C,G个数进行分析并提取。把数据进行整理归纳。

1 用非比对方法进行基因组序列进行分析 2 采用信息论等对基因组序列进行编码输入基因组的A,T,C,G后进行确定,自动检测A,T,C,G的个数和所占百分数。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付