基于机器学习的2D构型预测研究开题报告

 2022-02-21 20:10:15

1. 研究目的与意义

随着生物科学的发展,蛋白质序列的发现速度呈现几何级上升,用于蛋白质结构的预测方法也比较多,有些方法也已取得了一些不错的效果,但基于机器学习的方法来进行预测却少有人做。

本课题的目的是基于机器学习中的算法来对蛋白质2D结构进行预测研究,主要对二级结构中的基本规则元素如α螺旋和β螺旋进行预测,从而方便生物科学的研究人员探索蛋白质结构和功能之间的关系。

2. 研究内容和预期目标

由于生物科学的大力发展,生物科学家们得到蛋白质序列的速度越来越快,与之对应的对于结构与功能的研究也就带动起来。本课题主要研究已知序列的蛋白质二级结构的可能构造。目前常用的方法是将构成蛋白质的氨基酸按照其亲疏水性分为两种不同类型的氨基酸,从而忽略了氨基酸细节,使得科学家可以更加专注于功能的研究。目前蛋白质序列数据库中已经有众多的序列数据,但是与之对应的结构数据都是寥寥无几的,因此研究蛋白质的二维结构具有重大的实际意义。

3. 研究的方法与步骤

主要研究算法:

本研究课题是采用python语言实现,它的核心算法是贪心学习算法,贪心学习算法是很经典的无监督学习算法,具有良好的探索性能,时间复杂度和空间复杂度经过优化之后均比较低。利用输入的蛋白质二维序列进行探索学习,输出最终的结构矩阵。

算法步骤:

1.第一步探索点随机;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]王菲露. 基于机器学习方法的蛋白质相互作用位点及二级结构预测[d]. 安徽大学, 2009.

[2]木瑞塔. 基于机器学习和统计方法的蛋白质结构特征预测[d]. 中南大学, 2013.

[3]张丽超. 基于序列的蛋白质结构预测的机器学习模型[d]. 中国海洋大学, 2015.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)2022.03.01-2022. 03.15 查找相关资料,了解课题

(2)2022.03.16-2022.03.31 阅读相关论文,学习算法

(3)2022.04.01-2022.04.30 实现预测算法与算法改进

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版