基于BLAST算法实现生物序列比对开题报告

 2022-01-26 11:24:02

1. 研究目的与意义、国内外研究现状(文献综述)

本课题的意义

在生物学的研究过程中,为了确定新测序列的生物属性,经常需要进行序列同源性分析[1]。序列比对是指如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,然后经过序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来[2]。序列存在相似性虽然不代表二者一定有共同进化的祖先,但是序列的相似性越高,其具有相同祖先的可能性就越大。序列比对是生物信息学研究的一个重要工具,它在序列拼接、蛋白质结构预测、蛋白质结构功能分析、系统进化分析、数据库检索以及引物设计等问题的研究中被广泛使用[3]。

通过序列比对人们可以从dna序列中推断出蛋白质分子的结构;通过序列比对人们可以从基因数据库中搜索查找新的序列;通过序列比对人们可以分析生物进化以及推断生物分子的结构和功能信息[4]。从序列的片段测定,拼接,基因的表达分析,到rna和蛋白质的结构功能预测,从大量的序列信息中获取基因结构、功能和进化等知识,物种亲缘树[5]的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

研究目标利用给定的生物序列(可以是自己输入也可以是从文件中读取),经过序列比对算法,然后将其与数据库内的序列进行比对,利用打分函数找出相似性高的序列片段,找出与数据库中最佳局部序列比对结果。

研究内容 实现序列比对时首先要从文件中读取出序列的基本信息,其中包括序列的个数和序列的类型,或者也可以直接输入序列信息,对于输入的序列信息进行相应的处理,转化成相应的格式便于在后面与数据库中的序列进行比对时使用;当要求进行的是在氨基酸数据库中搜索序列同源的核酸序列的时候,需要将核酸序列翻译成可能的氨基酸,然后与氨基酸的数据库进行比对。

整个算法的编写使用的是java语言,其中对序列比对所使用到的数据库的操作使用jdbc编程的方式。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

研究方法、技术路线、试验方法及可行性分析研究方法 1、通过阅读文献学习相关的生物信息学知识,了解序列比对的具体过程和相关的算法的功能,了解打分函数和空位罚分的指定规则和相应的统计学知识; 2、利用java语言对算法进行实现,使用eclipse软件进行编程; 3、对序列比对所需要的数据库可以在ncbi的官方网站进行下载,然后利用jdbc编程方式对数据库进行连接和处理。

4、实现blast算法时,主要参考的是ncbi网站中blast在线序列比对和blast-2.2.31版本,该软件实现了blastp、blastx、blastn、tblastn、tblastx功能,该软件的源代码是基于linux下实现的,我选择在windows环境下通过使用java语言进行编程实现blast算法。

实验方案及技术路线 可行性分析 1)技术可行性 序列比对在国内外已经有相当成熟的理论基础和技术基础。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

特色或创新之处 1.使用动态规划方法找出打分矩阵中最佳路径,即获得序列; 2.将文本文件和fasta文件格式之间的相互转换,更加方便在数据库中查询; 3.将比对的结果显示出来,结果更加直观。

5. 研究计划与进展

研究计划及预期进展 2015年12月-2016年1月,完成对生物信息学的学习,对所需的数据进行收集; 2016年2月,完成图形化界面的设计和对文件的转化; 2016年3月,完成比对的算法和数据库相关操作; 2016年4月,比对结果的统计检验和分析;撰写毕业设计论文,准备答辩。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版