1. 研究目的与意义
背景
蛋白质识别研究是生物信息领域的一个重要研究分支,所要完成的任务是能够对未知的蛋白质所属种类进行正确的分类。由于dna结合蛋白在多种生物分子功能中起着重要的作用,而蛋白质结晶是通过x射线晶体学确定蛋白质结构的关键步骤,所以对于dna结合蛋白和蛋白质结晶的识别与预测就显得尤为重要。传统的生物实验方法虽然较准确,但是却有耗时、费力且昂贵的缺点,且随着蛋白质序列数目爆发式的增长,生物实验方法已经不能满足人们的需求,于是迫切需要高精度、高速度与低消耗的计算方法来进行相关工作。由于大部分蛋白质并没有关于它的结构信息,所以基于蛋白质序列信息的蛋白质识别研究更适用于现在的具体情况。
2. 研究内容和预期目标
研究内容:
在dna-蛋白质残基结合位点识别研究中,将从以下方面进行:
(1)蛋白质序列的特征提取方法;
3. 研究的方法与步骤
(1)本课题根据蛋白质的位置特异性矩阵和氨基酸水溶性进行特征提取;
(2)利用最优尺度的滑动窗口分割蛋白质序列;
(3)融合上述两种特征;
4. 参考文献
[1] yu d.j., hu j., tang z.m., etal. improving protein-atp binding residues prediction by boosting svms withrandom under-sampling[j]. neurocomputing, 2013, 104: 180-190.
[2] ofran y., mysore v., rost b.prediction of dna-binding residues from sequence[j]. bioinformatics, 2007,23(13): i347-353.
[3] yan c., terribilini m., wu f.,et al. predicting dna-binding sites of proteins from amino acid sequence[j].bmc bioinformatics, 2006, 7(1): 262.
5. 计划与进度安排
计划如下:
2022/3/1 至 2022/3/31从公共数据库上,收集当前蛋白质-dna相互作用的数据集。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。