开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
一、研究目的
目前,癌症的治疗面临着化疗药物和受体靶向抗癌药物耐药的挑战。抗癌肽(Anticancer Peptides,ACPs)是一种具有明显抗肿瘤活性的多肽,通过溶膜和非溶膜两种作用方式来抑杀肿瘤细胞。抗癌肽在治疗肿瘤方面具有众多优势,如分子量低、结构简单、高抗癌活性、高选择性、较少的副作用、多种给药方式、不易引起多重耐药性等。近年来利用机器学习算法研究多肽潜在的结构与活性、溶血性以及毒性的关系变的尤为重要。本课题的目的是收集抗癌肽溶血性数据库然后用三维结构建模来预测抗癌肽溶血性,相比于前人研究中利用多肽序列的建模方式提供了一种比较新的建模思路,为计算机辅助抗癌肽的筛选奠定理论基础。
二、研究手段及工作安排
1)2020年3月中旬至2020年4月中旬:查阅文献,收集数据
这一阶段需要查阅抗癌肽溶血性以及生物信息学相关文献,对一些基本概念有一定的理解,形成完备的实验方案。利用SATPdb数据库和Hemolytik数据库收集溶血肽和非溶血肽的名称编号、序列、三维结构,将搜集到的数据汇成表格,将多肽的pdb格式的三维结构按顺序整理在文件夹中。
2)2020年4月中旬至2020年5月上旬:计算机建模
这一阶段需要完成用于预测抗癌肽溶血性的模型构建,利用之前收集整理的数据,结合特定的算法,利用计算机技术和生物信息学技术建立一个模型,使之可以判断输入的多肽的三维结构有无溶血性。
3)2020年5月上旬至2020年5月下旬:预测性能的评估,毕业论文的撰写和修改
这一阶段需要对已构建模型的精确度,预测性能等多种因素进行验证与评估,同时撰写毕业论文,对于不足的地方要及时修改。
