基于机器学习的基因位点识别开题报告

 2022-01-21 21:25:47

1. 研究目的与意义、国内外研究现状(文献综述)

1.1课题意义20世纪后半叶以来,生命科学各领域所取得的巨大进展使生命科学在自然科学中的位置起了革命性的变化,信息科学则是推动其迅速发展的重要力量。

由于人类基因组等计划的顺利实施,生物分子数据量呈现爆炸性增长,现有生物信息数据库中的数据量迅速膨胀,数据库的复杂程度也在不断增加。

生物信息学[1]以计算机、网络为工具,采用数学和信息科学的理论、方法和技术去研究生物大分子[2]。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

2.1研究目标通过查阅资料,研究k近邻和决策树、神经网络、支持向量机分析方法,了解四种算法的运用四种分析方法进行基因位点识别,找出病理所对应的位点,比较四种方法的优劣,找出其中最合适的方法;2.2研究内容首先根据根据研究计划,找出四种方法的算法,根据算法,写出相应的程序,比较四种方法的优劣,通过算法研究与改进,得出实验数据,对实验数据进行比较,得出四种方法存在的不足之处。

2.3拟解决的问题对算法了解还不够透彻,仍存在很多问题有待解决,需要彻底分析并理解其中算法。

在理解算法的基础上,开始尝试进行算法的编写任务,编写算法的过程中可能出现各种问题,例如算法中数据无法录入,数据结果明显与事实不符等情况。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

3.1研究方法近邻分类算法,规则学习分类算法,人工神经网络算法,支持向量机。

3.2技术路线knn算法:knn是通过测量不同特征值之间的距离进行分类。

决策树算法:决策树是一个类似于流程图的树结构。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

最近十几年,随着基因组技术的快速发展,特别是测序技术手段的提高,人类全基因组计划(HGP)和许多动植物的全基因组测序已经完成,全基因组关联分析(GWAS)已经成为研究复杂性状的重要方法。

本课题采用近邻分析算法,规则学习分类算法,人工神经网络算法和支持向量机方法来检验生物体内的基因位点。

5. 研究计划与进展

研究计划:运用四种方法进行实验数据的测算,通过实验结果,分析比较四种方法的优劣。

预期进展:阶段一(2017.10月)学习r语言并熟练掌握算法;自学了近邻分析方法,规则学习算法,人工神经网络算法,支持向量机四种。

对这四种方法的理论步骤有了一定的了解。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版