开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)一、背景介绍:
多肽(peptide)被越来越多的运用于临床治疗中。与其他种类的药物相比,多肽类药物选择性高、有效性好,同时安全性与和耐受性相对良好[1]。除了传统的天然来源多肽,人工合成多肽、药物筛选等手段使得越来越多的多肽药物进入人们的视野[2,3]。目前已经有百余种多肽类药物投入市场用于临床,其在全球所占的市场份额相当可观;更多的药物已进入临床研究与临床前研究,在未来几年中将陆续涌现[4]。此外,多肽药物的研究与其他学科也有所配合,例如纳米技术运用于蛋白质多肽药物的靶向治疗更加丰富了该类药物的应用范围[5]。多肽类药物用量小,生物活性强,对代谢类疾病、癌症、自身免疫性疾病、记忆力减退、精神失常、高血压和某些心血管疾病有显著的疗效和广泛的应用前途。
激素(hormone)是由内分泌细胞产生的一类具有高效能信息传递作用的化学物质。通常它们作为第一信使作用于靶细胞上的激素受体,将生物信息传入细胞内[7]。而多种疾病的引发也与激素水平的过高或过低不无关系。激素按其化学本质可分为含氮的蛋白类激素和类固醇类激素两类,多肽激素是其中重要的一种。其生理功能有三个方面:调控机体新陈代谢、维持内环境相对稳定,如胰岛素[8]、胃肠激素[9];促进细胞增殖分化、控制机体生长发育和生殖机能,并影响衰老过程,如生长激素[10];与神经系统密切配合,增强机体对环境的适应,如肾上腺皮质激素、垂体激素[11]。
二、国内外研究状况
目前已经存在诸多蛋白质多肽数据库,它们整合了多肽序列与数据信息,以供研究者使用。
UniProt(http://www.uniprot.org/)致力于为科学界提供内容全面、高质量且能够免费获取的蛋白质序列、结构以及功能等信息资源,内容覆盖各类蛋白质与多肽,是信息最丰富、资源最广的蛋白质数据库;它整合了Swiss-Prot、 TrEMBL 和 PIR-PSD 三大数据库的数据而成,包括基因组测序项目完成后续所获得的蛋白质序列,相关的蛋白质生物功能信息来源于参考文献。该数据库主要由两部分组成:UniProtKB/Swiss-Prot(包含检查过的、手工注释的条目)和UniProtKB/TrEMBL (包含未校验的、自动注释的条目)[12]。
蛋白质数据库PDB(The Protein Data Bank,http://www.rcsb.org/pdb/home/home.do)是世界范围内大分子结构信息的数据库,数据集可用于分析从结构基因组学到癌症生物学和蛋白质设计等多个领域的蛋白质结构特性[13]。1971年,由布鲁克海文国家实验室(BNL)和剑桥晶体数据中心(CCDC)共同建立了蛋白质数据库(PDB)[14]。它将核磁共振、X-射线饶射实验、理论模拟所解的蛋白质和DNA的三维空间结构收集起来,主要信息包括引用文献、原子的空间坐标、形成alpha;-螺旋和beta;-折叠的氨基酸序列、与蛋白质结合的配体和参与生化功能的残基。
Hmrbase(http://crdd.osdd.net/raghava/hmrbase/)是一款激素多肽数据库,该数据库储存着激素及其受体的信息。数据库中收载了来源于文献和公共数据库的全面的信息,例如其功能、来源于何种生物、受体、序列、结构等。Hmrbase数据库还涵盖有关激素受体的信息,例如氨基酸序列、亚细胞定位、配体以及翻译后修饰等。利用数据库网站上设置的在线辅助工具,人们可以进行关键字检索、结构检索、将给定肽段在激素/受体序列上定位、序列相似性搜索等,从而成为服务于研究人员的便捷工具[15]。
拟南芥激素数据库AHD (Arabidopsis Hormone Database, https://doi.org/10.18170/DVN/EZ1JL4) 主要包含八种植物激素的相关信息:脱落酸,植物生长素,油菜素类固醇,细胞分裂素,乙烯,赤霉素,茉莉酸和水杨酸。 通过该数据库,研究人员可以获取相关的基因序列、遗传信息、miRNA预测、基因表达特征等信息[16]。
DRAMP抗菌肽数据库(http://dramp.cpu-bioinfor.org/)旨在服务于开发抗菌肽潜在的药用价值,对于新型抗菌肽药物的设计研发具有显著的参考价值[17]。
