1. 研究目的与意义、国内外研究现状(文献综述)
1. 国内外研究概况
最近十几年,随着基因组技术的快速发展,特别是测序技术手段的提高,人类全基因组计划(hgp)和许多动植物的全基因组测序已经完成,全基因组关联分析(gwas)已经成为研究复杂性状的重要方法。2005年,science杂志首次报道了年龄相关性视网膜黄斑变性gwas结果,在医学界和遗传学界引起了极大的轰动[1],此后gmas方法被广泛应用于人类各种复杂性状的研究中。2006年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的 gwas结果[2];2007年,saxena等多个研究组联合报道了与 2型糖尿病 ( t2d)关联的多个位点,samani等则发表了冠心病gwas结果[3]; 2008年,barrett等通过 gwas发现了 30个与克罗恩病 相关的易感位点[4]; 2009年, weiss等通过gwas发现了与具有高度遗传性的神经发育疾病---自闭症关联的染色体区域[5]。wtccc对约14000个患病人群和约3000个正常人群进行了联合gmas研究,通过病例对照比较检测到24个位点与6种疾病关联[6]。随后,gmas研究已经在身高、体质量、糖尿病等超过500个复杂疾病与性状中检测到关联的6000多个变异位点[7]。
我国学者则通过对 12 000 多名汉族系统性红斑狼疮患者以及健康对照者的gwas发现了 5 个红斑狼疮易感基因, 并确定了 4个新的易感位点[5]。截至 2009 年 10月, 已经陆续报道了关于人类身高、体重、血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的gwas 结果, 累计发表了近万篇论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和 snp变异。此外, 复杂疾病gwas方法学 ( 如研究设计、统计分析、结果的解释 ) 也取得了极大的进步。
2. 研究的基本内容和问题
1.研究内容
根据目前数理统计学的最新发展,在目前较为先进的统计方法中,选取弹性网方法作为全基因组关联分析的参数估计算法,提高运算速度和精确度。
2.研究目标
3. 研究的方法与方案
1.研究方法
根据目前数理统计学的最新发展,在目前较为先进的统计方法中,选取弹性网方法进行参数估计。
2.技术路线
4. 研究创新点
在大数据的背景下,试图解决全基因组关联分析的单标记方法的不足,充分利用全基因组的信息,进行关联分析。为此,提出了本项目的研究。
5. 研究计划与进展
2016.92016.12 学习阶段
(1)查阅文献,研究全基因组关联分析现存的方法。
(2)查阅文献,学习弹性网方法的理论知识。
