基于深度学习的RNA预测方法的研究与实践开题报告

 2022-05-10 08:05

1. 研究目的与意义

1.1研究的背景

dna是遗传信息的载体,dna信息又被包括于 rna 之中,参与几乎所有生物体之中最为重要生命进程[1]。顺利开展人类基因组计划后,人们在算法和成果上继续深入研究,生命科学研究由此进入后基因组时代。近年来,生物医学实验发现 rna 不仅在蛋白质合成方面有重要作用,在控制不同基因是否可以完全显现出来的过程以及作为催化剂来促进生物体内的一些生理反应也有非常关键的作用[2]。而在分析生物数据方面,因其具备分布、异构、多样以及异变等诸多特性,已无法依托于传统分析方式来满足需求。通过对信息、计算机科学、生物以及数学等知识的综合运用,由此对繁杂的生物学数据进行管理、处理等,即为生物信息学,这也为开展生物科学探究工作奠定了理论基础,现实意义较为突出[3]

rna是生命科学研究的重要对象,研究rna的功能需要了解它们的结构,特别是空间结构。rna的结构很大程度上决定了它的功能,如何获得rna的结构并分析研究是现代分子生物学的重要课题。研究 rna 二级结构,为治疗癌症[4]、遗传疾病等疾病找到了新的突破口,对生物学和医学来说是一个重要的里程碑式的突破[5]。通过 rna 二级结构比对过程中的基因的表达、结构能量的比较,来总结判断出 rna 二级结构和其所对应的功能之间的关系,这些比较研究,为分析 rna 功能、rna 分类等提供关键依据[6]

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

2.1研究内容

rna 二级结构包含丰富的生化信息[5],rna 的二级结构影响着三级结构。用深度学习方法去预测rna二级结构的方法有很多,但是在众多方法中哪种方法对于特定特征下的rna的二级结构预测更有效,本课题研究内容主要涉及rna序列种类的选择,深度学习算法的选择,构建训练集与预测集,模型训练与评价。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

本课题拟采用rna strand里的rna序列作为研究数据来源,选取不同种类的序列对其不定长补零的方式对数据进行统一维度的处理。对收集来的每条rna序列计算里面的碱基与其他碱基配对概率,然后使用深度学习中的lstm方法与gru对rna序列进行模型构建后预测,最后根据预测出正确率的实际情况判断算法适用的条件。

3.2步骤

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]李瑶,rna二级结构动态规划比对算法[d].燕山大学.2018.5.

[2]vandivier l e, anderson s j, foley s w, et al. the conservation and function of rna secondarystructure in plants[j]. bioinformatics,2009,25(12): i330-8.

[3]张璐. rna 二级结构比对的动态规整时间算法研究[d]. 秦皇岛:燕山大学,2016:1-13.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)2022.1.5 ---- 2022. 2.28 查阅资料, 撰写开题报告(2)2022.3.1 ---- 2022.3.15 需求分析,熟悉编程平台构建技术(2)2022.3.15 ---- 2022.3.20 方案设计与论证(3)2022.3.21 ---- 2022.4.1 算法设计与实现(4)2022.4.2 ---- 2022.5.1 算法测试与改进(5)2022.5.2 ---- 2022.5.5 毕业论文资料收集,撰写论文提纲(6)2022.5.6 ---- 2022.5.31 整理设计文档, 撰写毕业论文(7)2022.6.1 ---- 2022.6.8 论文修改、系统改进、答辩准备及答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。