1. 研究目的与意义(文献综述)
1.1 研究的目的及意义:
人类和动植物的复杂性状都是多基因控制的数量性状,存在基因间的相互作用(上位性)以及基因在不同环境的特异表达(环境互作)[1][5]。最近十几年,随着基因组技术的快速发展,特别是测序技术手段的提高,人类全基因组计划和许多动植物的全基因组测序已经完成,全基因组关联分析已经成为研究复杂性状的重要方法[2][9]。
全基因组关联研究(genome-wide association study,简记为gwas)是一种用来寻找与人类复杂性状疾病或性状相关联的遗传变异的方法[3]。这里的遗传变异主要是指单核苷酸多态性(single nucleotide polymorphism,简记为snp).snp是人类可遗传的变异中最常见的一种,占所有已知多态性的90%以上[4],它在人类基因组中广泛存在,平均每隔100至300个碱基对中就存在一个snp,其总数可达300万个或更多[6][11]。gwas将人类基因组中数以百万计的snps作为标记位点,从目标人群中随机抽取一个较大规模的病例和对照样本利用基因芯片技术进行测序,以获取各样本个体的dna序列的观测数据并归整为各突变位点的基因型数据,然后对全部snps位点逐个地进行统计检验及分析,以期筛选出与复杂疾病有显著关联的遗传位点,为多发性复杂疾病的诊断、预防和安全有效的治疗提供理论依据[7]。
2. 研究的基本内容与方案
2.1目标(开发的系统概述描述)
本课题旨在对算法研究与改进前的研究对比工作,通过研究现目前用于gwas的各类软件文档,理解软件工作原理及背后的数学及生物意义,对软件的输入数据做统一整合处理,对软件输出做统一对比分析,能够达到比较各软件优劣特点的目的。
2.2 基本内容:
3. 研究计划与安排
(1)2016/1/11—2016/1/22:查阅参考文献,理解gwas相关概念与知识;
(2)2016/1/23—2016/3/7:进一步阅读文献,并分析和总结,弄清楚用于gwas研究的各个软件的特点以及输入输出格式;
(3)2016/3/8—2016/4/26:对各个gwas软件的输入做统一化处理,对输出做统一化解释和对比;
4. 参考文献(12篇以上)
参考文献:
[1] 段忠取,朱军. 全基因组关联分析研究进展. 浙江大学学报:农业与生命科学版,41(4):385~393,2015.
[2] 潘东东,李正帮,张维,李启寨. 全基因组关联研究综述. 应用概率统计第三十卷第一期,2014年2月.
