1. 研究目的与意义
本次研究的目的主要是对短序列特征提取,进入分类识别验证。基因组计划的开展随之产生了巨量的基因组信息,同时基因组占着生命科学的重要的角色,其中短序列类别的预测是基因组预测中较为关键的一步。所以本次研究的意义主要在于对茯苓基因组测序过程中的短序列进行预分类,为下一步正确装配提供先验知识。
2. 国内外研究现状分析
神经网络在基因序列预测中的应用研究:区分DNA序列上的外显子和内含子成为基因工程中对基因进行识别和坚定关键环节之一。如何建立良好的系统模型将基因组进行有效地存储,分析和挖掘,仍是难题。使用MATLAB神经网络工具箱和图形用户面开发技术,对UCI机器学习数库中的基因数据采集用二进制编码,完成样本选取。
蛋白质二级结构预测的人工神经网方法研究:在过去十几年中,科学家们提出了几十种从蛋白质一级结构预测其二级结构的方法。其中比较常用的方法是分别由Chou,Garnier和Lim等提出的统计方法和基于已有知识的预测方法。近年来,人们将人工神经网络方法应用到蛋白质二级结构预测的研究中,使二级结构预测的准确率有所提高。
3. 研究的基本内容与计划
matlab工具:matlab的神经网络工具箱涵盖很多现有神经网络模型,为了进行神经网络理论研究应用于基因序列的前沿探讨,设计开发可软件:nnsp基于神经网络的基因序列预测分析。
基于matlab的bp神经网络设计:1,bp网络的创建和初始化2,bp网络的训练3,bp网络的数据处理和统计分析
基于matlab的grnn神经网络设计:1,grnn网络的创建和训练2,grnn网络仿真和预测
4. 研究创新点
生物信息学是当前的热点研究课题,很多研究者对人类基因组、水稻基因组等常见的动植物进行研究,对于茯苓的基因组研究目前还未见报道,本次的研究主要是对于茯苓基因组测序过程中的短序列进行预分类,主要运用到方法就人工神经网络同时用到matlab在这一工具。此次研究有自己的独特性,是通过对短序列特征提取,进入分类识别验证,来判别是否属于茯苓基因组中的一部分,同时茯苓也是个新选生物种类。
