基于序列特征的蛋白质亚细胞定位预测系统开发开题报告

 2022-05-15 22:42:01

1. 研究目的与意义

背景

现代生物分子信息爆发式的增长,也促进了生物信息学的迅猛发展。生物信息学是当前的前沿研究领域之一,主要的任务是使用计算机挖掘大量生物信息,并对它们进行处理与分析。生物分子信息中蛋白质数据的暴增,使得从中挖掘有用的信息变得更加困难但也更有价值。蛋白质在多种生理功能包括载体运输、酶的催化、激素调节、抗体免疫等关乎生命正常运作的关键功能上发挥着不可或缺的作用,相关的研究也愈发火热,而蛋白质定位研究便是生物信息领域非常重要的一个研究分支。对于蛋白质定位的研究通常包括两类方法:

1.1生物实验方法

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

结合国内外研究状况的分析我们可以知道,随着蛋白质数量的指数增长,传统的湿实验验证的方式已经不能满足需求,现在也出现了各种各样的高精度、低消耗的基于计算的预测方法,大大提升了蛋白质定位判断的效率。本课题研究的内容主要包括:蛋白质序列关键特征的提取,预测模型学习策略的选择,利用数据集评估预测模型的性能以及使用合适的相关机器学习模型,预测蛋白质所以在细胞器的位置。

预期目标:改进算法,优化实验,提高模型预测的效果,获得一个更加稳定与高效的预测模型,这对于实际的工作以及未来的研究都具有重要的意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

(1)首先我们获得最原始的蛋白质数据集,数据集分为训练集和测试集两个部分

(2)在训练阶段,对训练集提取特征,使用基于离散小波变换、离散余弦变换、自相关方差系数和伪氨基酸组分函数的序列特征提取方法。

(3)利用机器学习基础知识,使用相关算法工作。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1] harlowe, whyte p, jr f b, et al. association of adenovirusearly-region 1a proteins with cellular polypeptides.[j]. molecular cellular biology, 1986, 6(5):1579-89.

[2]mitchell d a, marshall t k, deschenes r j. vectors for the inducible overexpression ofglutathione s-transferase fusion proteins in yeast[j]. yeast, 1993, 9(7):715-22.

[3] carr dw, scott j d. blotting andband-shifting: techniques for studying protein-protein interactions.[j]. trendsin biochemical sciences, 1992, 17(7):246-9.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1) 2022年1月10日—2022年1月30日

接受毕业设计任务,查阅资料并完成开题报告;

(2) 2022年2月1日—2022年2月8日

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版