1. 研究目的与意义
基因组数据库(GDB)为人类基因组计划(HGP)保存和处理基因组图谱数据。GDB的目标是构建关于人类基因组的百科全书,除了构建基因组图谱之外,还开发了描述序列水平的基因组内容的方法,包括序列变异和其它对功能和表型的描述。目前GDB中有:人类基因组区域(包括基因、克隆、amplimers PCR 标记、断点breakpoints、细胞遗传标记cytogenetic markers、易碎位点fragile sites、EST序列、综合区域syndromic regions、contigs和重复序列);人类基因组图谱(包括细胞遗传图谱、连接图谱、放射性杂交图谱、content
contig图谱和综合图谱等);人类基因组内的变异(包括突变和多态性,加上等位基因频率数据)。GDB数据库以对象模型来保存数据,提供基于Web的数据对象检索服务,用户可以搜索各种类型的对象,并以图形方式观看基因组图谱。
2. 国内外研究现状分析
基因组数据库基因组数据库是分子生物信息数据库的重要组成部分。基因组数据库内容丰富、名目繁多、格式不一,分布在世界各地的信息中心、测序中心、以及和医学、生物学、农业等有关的研究机构和大学。基因组数据库的主体是模式生物基因组数据库,其中最主要的是由世界各国的人类基因组研究中心、测序中心构建的各种人类基因组数据库。随着资源基因组计划的普遍实施,几十种动物、植物基因组数据库也纷纷上网,如英国roslin研究所的arkdb包括了猪、牛、绵羊、山羊、马等家畜以及鹿、狗、鸡等基因组数据库,美国、英国、日本等国的基因组中心的斑马鱼、罗非鱼(tilapia)、青鳉鱼(medaka)、鲑鱼(salmon)等鱼类基因组数据库。英国谷物网络组织(cropnet)建有玉米、大麦、高粱、菜豆农作物以及苜蓿(alfalfa)、牧草(forage)、玫瑰等基因组数据库。除了模式生物基因组数据库外,基因组信息资源还包括染色体、基因突变、遗传疾病、分类学、比较基因组、基因调控和表达、放射杂交、基因图谱等各种数据库。
gdb由美国johns hopkins大学于1990年建立的gdb是重要的人类基因组数据库,现由加拿大儿童医院生物信息中心负责管理。 gdb数据库用表格方式给出基因组结构数据,包括基因单位、pcr位点、细胞遗传标记est、叠连群(contig)、重复片段等;并可显示基因组图谱,其中包括细胞遗传图、连锁图、放射杂交图、叠连群图、转录图等;并给出等位基因等基因多态性数据库。此外,gdb数据库还包括了与核酸序列数据genbank和embl、遗传疾病数据库omim、文献摘要数据库medline等其它网络信息资源的超文本链接。
gdb数据库是用大型商业软件sybase数据库管理系统开发的,并用java语言编写基因图谱显示程序,为用户提供了很好的界面,缺点是传输速度受到一定限制。gdb数据库是国际合作的成果,其宗旨是为从事基因组研究的生物学家和医护人员提供人类基因组信息资源。其数据来自于世界各国基因组研究的成果,经过注册的用户可以直接向gdb数据库中添加和编辑数据。
3. 研究的基本内容与计划
主要是构建数据库平台,用linux配合php、apache、mysql组建web数据库,通过网页可以动态控制数据库中的内容,实现对数据库的查询、修改、添加、删除、批量导入导出等功
能。
4. 研究创新点
数据库存储基本信息,多数通过后台计算,实现数据库的更新维护简便,通过模糊查询可以找到含有这些段的基因序列。缺点:大量的模糊查询会增加服务器的负载量,减慢查询
速度。
