1. 研究目的与意义
本世纪最受关注的科学莫过于生命科学与技术,随着先进技术手段的应用和 越来越多的研究者的投入,通过学科研究中全球合作的开展,生命科学在上世纪末到目前取得重大突破和进展,完成了水稻基因组和人类基因组测序的伟大工程。特别是克隆技术取得的突破性成果,随着克隆羊多莉的诞生,相关的克隆研究进 行的如火如荼。生命科学和技术吸引了其他学科研究者的目光,进行了许多跨学科的研究。计算机科学在上世纪的理论上的成熟和技术发展的基础上,已经深入到社会生活、科学研究中的方方面面,特别是在科学研究中扮演着基本工具的作用。计算机科学和生命科学的结合,诞生的一个研究热点学科就是生物信息学。 生物信息学是信息科学、计算机科学、生物数学、比较生物学等多学科构成 的交叉研究学科。它利用相关学科提供的方法、工具对生命现象及其对其组成分子如核糖核酸、生物大蛋白质进行研究。主要研究生命物质的组成、进化、结构 与功能,以期待发现核酸和蛋白质分子在生命个体所进行的能量和信息的交换或 传递规律,破解生命奥秘。它研究的首要工具是计算机和生物电子设备,通过生 物电子设备对生物信息进行提取和分析,再用信息理论及生物数学的方法和原理 去理解和解释生物大分子的活性功能。基于收集的数据,用计算机进行分析比较 和功能性的预测。达到对生命结构和组成的更深入的认识,在疾病治疗和药物研究方面提供新的方法和手段。
2. 研究内容和预期目标
由意大利学者do rigo m. 等人首先提出的蚁群算法(a nt colony optimization alg orithm)是受到人们对自然界中真实的蚁群集体行为的研究成果的启发而提出的一种基于种群的模拟进化算法, 属于随机型智能搜索算法 , 它充分利用了蚁群搜索食物的过程与著名的旅行商问题(tsp)之间的相似性, 通过人工模拟蚂蚁搜索食物的过程(即:通过个体之间的信息交流与相互协作最终找到从蚁穴到食物源的最短路径)来求解tsp 问题。自从蚁群算法在tsp 问题[和工作排序问题上取得成效以来,已陆续渗透到其他问题领域中, 如图的着色问题、车辆调度问题、蛋白质折叠问题等等, 在许多方面表现出相当好的性能。
蛋白质是生命活动的重要承担者, 蛋白质的生物功能由其空间结构决定, 在天然蛋白质中, 蛋白质的最终构象是由氨基酸序列唯一确定的。蛋白质折叠问题就是确定一个给定氨基酸序列的蛋白质的天然结构的问题。随着计算机技术的发展, 在计算机上进行蛋白质折叠模拟已经成为蛋白质结构预测的重要方法。蛋白质折叠问题是生物信息学的一个重要问题,它研究蛋白质从一维序列到三维序结构的过程。由于这一过程及其复杂,人们往往利用简化的模型来对其进行研究,dill 提出的疏水性-亲水性(hp)模型是最简单的一种, 也是应用较为广泛的一种。 hp 模型提出的理论基础是氨基酸的疏水性是小的球蛋白形成天然构象的主要驱动力。hp 模型中, 20 种氨基酸按疏水性和亲水性被分为两类:疏水性残基(h)和极性残基(p), 因此蛋白质序列被抽象为一个由h 和p 组成的序列。本课题主要研究蚁群算法用于二维hp模型的策略,并将其应用于hp模型的测试序列求解。
预期目标:(1)设计论文一份(2)翻译资料一份(3)设计作品(包括源代码一份,软件说明书一份)
3. 研究的方法与步骤
本课题拟采用的研究方法是一种蚁群算法策略,并将其应用于hp模型的测试序列求解。
研究方法步骤:(1)初始化路径上的信息素。
(2)外部循环(循环,直到满足停止条件)。
4. 参考文献
1. 刘美玲,王仲君.蛋白质结构预测二维连续模型研究[j].武汉理工大学学报(交通科学与工程版),2005(06):989-992.
2. 王绍鹏. 蛋白质修饰位点的通用计算机预测方法[d].上海大学,2018.
3. 郭小森. dna结合蛋白中dna结合氨基酸残基的计算机预测[d].吉林大学,2008.
5. 计划与进度安排
(1)2022年2月1日----2022年3月1日 查阅资料, 撰写开题报告
(2)2022年3月2日----2022年3月15日需求分析,熟悉开发工具
(3)2022年3月16日----2022年3月25日 概要设计
