利用“ENCODE 计划”数据分析人源细胞转录因子结合DNA的信号强度与转录水平的关系开题报告

 2022-02-08 20:10:42

1. 研究目的与意义、国内外研究现状(文献综述)

生物学的一大核心目标就是了解转录因子如何在不同细胞类型和不同情况下编排出多样的基因表达模式[1]。

转录调控是决定细胞各行为的基础过程,转录因子在决定大量重要细胞性状和有机体性状中起到了关键作用[2]。

由转录因子的数量,结构或者功能的不正常导致的基因表达的异常,与许多疾病相关[3]。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容和问题

(一)本研究的目标为:阐明转录因子与dna的结合信号与转录水平的关系,并尝试对转录因子进行分类。

(二)本研究的内容为:1. 使用人源细胞系hepg2的100个转录因子的chip-seq数据与total rna-seq数据,建立转录因子结合信号和转录水平的相关性关系;2. 利用另一种细胞系mcf-7,对建立的模型进行可靠性检验;3. 利用模型中的相关系数对转录因子进行分类,查找文献,梳理同一类别中的转录因子的相似调控机理,检查各机理与分类结果是否具有一致性;4. 对比分类结果与经典分类结果,尝试筛选出未受关注的重要转录因子。

(三)本研究的拟解决的关键问题为:人源转录因子与dna的结合强度对于转录水平的影响。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与方案

1. 研究方法:相关性分析方法(spearman correlation methods、pearson correlation methods)、聚类分析方法2. 研究方案: 1) 数据下载与初步处理。

a. 分别收集encode中hepg2和mcf-7两种细胞系的chip-seq数据和total rna-seq数据;b. 为满足galaxy网站的数据格式要求,将total rna-seq数据中的第一列gene id替换为该基因在染色体上的位置,并且在5端和3端各延伸2k;2) 建立预测转录因子与基因表达的关系。

a. 利用galaxy网站上的工具,分别将hepg2和mcf-7中的每个chip-seq数据与相应的total rna-seq的重叠区域筛选出来;b. 将对应同一个基因位置的chip-seq数据进行加和,作为该转录因子与该基因位置的结合强度;c. 使用spearman correlation methods计算hepg2中每一种转录因子结合dna强度与下游dna转录的相关系数;3) 相关性关系的检验;a. 比较hepg2和mcf-7两细胞系中相同转录因子的结合强度与基因表达的相关系数的差异;b. 比较hepg2或mcf-7同一细胞系中不同转录因子的结合信号和转录水平的相关系数的差异;运用mcf-7中的chip-seq数据和生成的预测模型,对mcf-7的转录组进行预测,将预测结果与真实rna-seq进行假设检验,确认预测结果的准确度;4) 根据相关系数对转录因子进行分类;a. 将转录因子按照相关系数的符号和显著性,初步分为三类:显著正相关,显著负相关和无关;5) 分析每一类转录因子的调控机理;a. 查阅文献,找出相同类别中的转录因子的共同调控模式;b. 筛选出每一类别中调控机理特别的转录因子。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

1. 本次研究拟利用的转录因子数量较为充足,远多于以往的研究;2. 利用不同的细胞系相互验证,找出共同的转录因子调控模式。

5. 研究计划与进展

2018年1月-3月,完成数据下载,初步处理,分析得到转录因子结合信号的基因表达水平的相关系数;2018年3月-5月,完成对相关系数的检验,对转录因子的分类以及分析每一类转录因子的调控机理的工作。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版