“基于机器学习的核酸修饰位点预测研究”文献综述
摘要:
我的毕业设计题目是基于机器学习的核酸修饰位点预测研究。本课题是智能算法及机器学习相关理论在生物信息学方面的具体应用之一。重点在于两个方面:“机器学习”和“核酸修饰位点”。其中,“机器学习”是方法,“核酸修饰位点”是研究内容,采用机器学习方法实现对于核酸修饰位点的“准确预测”,这是最终的课题目标;毕业设计的根本目的,在于采用机器学习手段,解决生物信息学中如何快速准确地预测核酸修饰位点这一问题,并生成便捷化工具,为相关方面的实验科学家提供有效的辅助手段。
关键词:
机器学习、核酸修饰位点、信息融合、支持向量机、神经网络
背景介绍:
核酸修饰位点,指的是发生在生物体内核苷酸上的功能位点。核酸是生物体内重要的遗传物质,核苷和磷酸具体结合为核苷酸。核苷酸具体分为腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)等几种。核苷酸又是组成核酸的基本成分。核酸作为一种大分子化合物,是最基本的生命物质之一。核酸根据化学组成的不同,分为DNA和RNA两大类别:DNA是储存、复制和传递遗传信息的主要物质基础;RNA在蛋白质合成过程中起着重要作用,其中转运核糖核酸,简称tRNA,起着携带和转移活化氨基酸的作用;信使核糖核酸,简称mRNA,是合成蛋白质的模板;核糖体的核糖核酸,简称rRNA,是细胞合成蛋白质的主要场所。
而核酸恰恰就是通过大分子上的结合位点与其他物质结合,从而产生化学反应,发挥生物学功能的。因此,核酸修饰位点对于了解许多生化作用机制具有重要意义。比如M5C、M6A甲基化结合位点,对于DNA转录复制、DNA修复、基因表达调控、胚胎发育等生化功能中,扮演着极其重要的角色。而且,倘若甲基化位点异常,往往意味着疾病的发生。观察实验表明,甲基化位点和癌症等疾病存在着密切的联系。因此,准确深入地了解诸如甲基化位点等核酸修饰位点的功能、分布等信息,对于进一步探秘生物信息学、预防治疗疾病等,具有重要意义。
目前研究现状(方法、成果等):
随着人类基因组计划的开展,海量的DNA、RNA被测序出来,但人们对它们功能、结构的认识非常有限滞后;而且传统的实验检测方法,耗时耗力,检测准确率也不令人满意。本课题就是希望采用最新的机器学习技术,实现对于核酸修饰位点的高通量预测功能,进而为人类认识核酸大分子的功能、了解核酸修饰位点作用机制等做出贡献。目前该领域已经有许多杰出的科研工作者默默奉献,并且取得了辉煌的成就。
