基于集成模型的蛋白质结晶识别方法研究与开发开题报告

 2022-05-10 20:13:39

1. 研究目的与意义

1.1研究背景

随着由美国率先提出,美国、英国、法国、德国、日本和中国六个国家的科学家共同参与的人类基因组计划的测序工作的完成,我们正式迈进了后基因组时代。在这一时期,生物分子信息爆发式的增长,也促进了生物信息学的迅猛发展。生物信息学是当前的前沿研究领域之一,主要的任务是使用计算机挖掘大量生物信息,并对它们进行处理与分析。最主要研究的是dna和蛋白质序列,也就是所谓的基因组学与蛋白质组学。在生物信息的整个发展历程上,总共经历了三个阶段,第一个阶段称为前基因组时代,这一阶段所在的时间点是20世纪90年代之前,在这个阶段所完成的研究工作是建立序列比较算法、构建相应的生物信息数据库以及用于检索生物信息的工具等;第二个阶段起于20世纪90年代,终于2001年,称为基因组时代,在这个阶段研究人员主要完成基因组测序的工作,并完善与建立科学系统的数据库等;从2001年起,我们便处于了后基因组时代,我们不再把工作的中心放在结构上,而是要去探索功能,功能基因学也由此诞生出来。

生物分子信息中蛋白质数据的暴增,使得从中挖掘有用的信息变得更加困难但也更有价值。蛋白质在多种生理功能包括载体运输、酶的催化、激素调节、抗体免疫等关乎生命正常运作的关键功能上发挥着不可或缺的作用,为了弄清楚由基因产生的蛋白质的结构与功能,相关的研究也愈发火热,蛋白质识别研究便是生物信息领域非常重要的一个研究分支,且其中蛋白质结晶的识别研究也是得益于它们的重要性而得到了极大的关注。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

2.1研究内容:

在蛋白质结晶识别研究中,将从以下方面进行:

(1)蛋白质序列的特征提取方法;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

(1)我们根据蛋白质的氨基酸组成、物化属性、及位置特异性矩阵进行特征提取;

(2)利用径向基核函数,将各种特征计算成高斯核矩阵;

(3)利用多核融合的方法,将多个核矩阵合并;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]hu j , han k , li y , et al. targetcrys: protein crystallization prediction by fusing multi-view features with two-layered svm[j]. amino acids, 2016, 48(11):1-15.

[2]overton i m , barton g j . a normalised scale for structural genomics target ranking: the ob-score[j]. febs letters, 2006, 580(16):0-4009.

[3]rahbari m. prediction of protein crystallization using collocation of amino acid pairs.[j]. biochemical biophysical research communications, 2007, 355(3):764-769.

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

序号

起迄日期

工作内容

1

2022-3-1---2022-3-31

从公共数据库上,收集当前蛋白质结晶的数据集并撰写开题报告

2

2022-4-1---2022-4-30

制定相关氨基酸序列特征提取的相关算法和机器学习策略,开始着手编写代码和试验算法

3

2022-5-1---2022-5-31

整理实验结果,撰写论文

4

2022-6-1---2022-6-12

答辩准备及答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付