单倍型Hi-C软件的开发与应用

单倍型Hi-C软件的开发与应用

论文摘要

基于染色体构象捕获技术及其衍生技术(如Hi-C)的研究表明,染色质高阶结构在转录调控、DNA复制、早期胚胎发育以及疾病发生等过程中发挥着重要的作用。近年来,人们利用已定相遗传变异来区分二倍体细胞中同源染色体的高阶结构,发现父本染色质高阶结构和母本染色质高阶结构在特定区间或者特定发育阶段存在着显著差异,即染色质高阶结构具有等位效应,并且染色质高阶结构等位效应在调控等位特异性基因表达方面可能起着重要作用。本文将这种使用已定相遗传变异把Hi-C数据区分为父本和母本染色质互作的研究简称为单倍型Hi-C(haplotype-resolved Hi-C)。然而,由于遗传变异数量有限且分布不均衡,单倍型Hi-C的数据利用率较低并且数据偏好很强,因此优化单倍型Hi-C数据处理和结构识别对于提高单倍型染色质高阶结构识别的精度和准确性具有重要意义。本文开发了一种新型单倍型Hi-C软件HiCHap,主要功能包括利用Hi-C读段的所有序列信息来提高单倍型数据利用率,使用两步校正策略分别校正遗传变异分布密度不均衡和Hi-C实验引起的单倍型数据偏好,使用新的识别方法得到单倍型染色质高阶结构。最后本文使用HiCHap软件初步研究了染色质环等位特异性与关键转录因子等位效应之间的关联。首先,HiCHap软件利用了Hi-C读段上所有序列的杂合单核苷酸多态性(SNP)来提高数据利用率。传统Hi-C序列比对通常使用了切割连接位点或迭代切割方法,这个过程中丢弃了部分序列,本文对切割连接位点后的所有序列都进行序列比对,充分利用Hi-C读段上所有序列的杂合SNPs来提高单倍型Hi-C的数据利用率。其次,HiCHap软件使用两步校正策略分别校正了SNP分布密度不均衡和Hi-C实验引起的单倍型数据偏好,并构建了单倍型染色质互作矩阵。由于遗传变异分布密度与单倍型数据利用率之间的关系复杂,HiCHap直接使用该区间单倍型数据利用率来间接衡量遗传变异分布密度的影响,并结合非对称阵策略来对遗传变异分布密度不均衡引起的单倍型Hi-C数据偏好进行第一步校正。接着,将第一步校正后的非对称阵对称化,并使用矩阵平衡算法消除Hi-C实验引起的数据噪声,进行第二步数据偏好校正。经过与传统方法比较,本文校正算法在多个评价指标上都表现良好。再次,以染色质环为例,本文通过调整传统算法识别了单倍型染色质环,并在整合单倍型染色质环和传统非单倍型染色质环的基础上使用二项分布检验了父本染色质环和母本染色质环的差异显著性,识别和筛选等位特异性染色质环。最后,本文使用HiCHap软件分析了等位特异性染色质环与关键转录因子(如CTCF和Cohesin)结合位点等位效应之间的关联,发现等位特异性染色质环上往往也存在着等位特异性转录因子结合位点,并且染色质环等位效应与转录因子的等位效应呈现出一定程度的正相关性,暗示着关键转录因子结合位点的等位效应可能是引起等位特异性染色质环的重要原因之一。

论文目录

  • 摘要
  • Abstract
  • 缩略语表
  • 1 前言
  •   1.1 三维基因组简介
  •   1.2 单倍型三维基因组研究进展
  •   1.3 研究内容与研究意义
  • 2 材料与方法
  •   2.1 数据来源与预处理
  •   2.2 HiCHap的整体工作流程
  •   2.3 HiCHap的数据处理模块
  •   2.4 HiCHap的矩阵构建及校正
  •   2.5 HiCHap的染色质结构解析
  •   2.6 单倍型ChIP-Seq数据处理
  • 3 结果与分析
  •   3.1 单倍型染色质高阶结构
  •   3.2 SNP校正对单倍型Hi-C的影响
  •   3.3 测序深度对单倍型Hi-C的影响
  •   3.4 等位特异性染色质环分析
  • 4 讨论与展望
  • 参考文献
  • 附录
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 罗瀚

    导师: 彭城

    关键词: 单倍型,软件开发,染色质环,等位特异性

    来源: 华中农业大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用

    单位: 华中农业大学

    分类号: Q811.4;TP311.52

    DOI: 10.27158/d.cnki.ghznu.2019.000556

    总页数: 60

    文件大小: 3058K

    下载量: 47

    相关论文文献

    • [1].单倍型分析技术研究进展[J]. 生物工程学报 2018(06)
    • [2].基于叶绿体SSR单倍型分析普通杏演化关系[J]. 植物遗传资源学报 2018(04)
    • [3].角倍蚜细胞色素氧化酶(CO Ⅰ)基因的多样性分析[J]. 生物资源 2018(01)
    • [4].水貂ASIP基因单倍型检测及其皮肤组织mRNA差异表达分析[J]. 中国畜牧兽医 2019(10)
    • [5].绵羊MHC-DQB2 exon3单倍型的构建及其与布鲁氏菌病易感性相关性[J]. 江苏农业科学 2018(10)
    • [6].IL-12B基因多态性及单倍型与克罗恩病的关系研究[J]. 浙江医学 2018(09)
    • [7].南宁市肉牛的Y染色体遗传多样性分析[J]. 中国牛业科学 2019(03)
    • [8].尼罗罗非鱼β_2m基因SNP位点和单倍型与无乳链球菌抗性的关联分析[J]. 水生生物学报 2018(05)
    • [9].关岭牛Y染色体遗传多样性与父系起源研究[J]. 中国牛业科学 2017(06)
    • [10].一个中国汉族皮肤和粘膜多发静脉血管畸形家系的单倍型分析[J]. 遗传 2012(04)
    • [11].小麦转录因子基因TaNAC67参与调控穗长和每穗小穗数[J]. 作物学报 2019(11)
    • [12].单倍型及其在菌物学研究中的应用[J]. 菌物学报 2020(02)
    • [13].异色瓢虫两个单倍体基因型的生物学特性比较[J]. 中国生物防治学报 2019(04)
    • [14].广西汉族人群高血压与瞬时受体电位香草酸亚型1基因多态性/单倍型相关性病例对照研究[J]. 川北医学院学报 2018(02)
    • [15].粳稻分蘖数全基因组关联分析及候选基因的挖掘[J]. 中国农业科学 2020(16)
    • [16].Y-STRs和Y-SNPs综合分析方法在父系家系调查中的应用[J]. 南京医科大学学报(自然科学版) 2019(08)
    • [17].基于线粒体DNA 4个基因/区域的矮小梅花鹿群体结构与起源进化分析[J]. 西北农业学报 2018(12)
    • [18].基于叶绿体DNA单倍型的蒙古沙冬青遗传多样性格局探究[J]. 分子植物育种 2019(04)
    • [19].鸭mtDNA D-loop区部分序列和单倍型多样性分析[J]. 中国畜牧杂志 2014(13)
    • [20].七鳃鳗属3种类的亲缘关系分析[J]. 水产学杂志 2018(06)
    • [21].尼罗罗非鱼NOD1基因SNP位点和单倍型与抗无乳链球菌感染的关联分析[J]. 农业生物技术学报 2018(11)
    • [22].绵羊MSTN基因内含子2和外显子3部分序列的SNP检测和单倍型分析[J]. 中国畜牧杂志 2010(07)
    • [23].唐家河国家级自然保护区中华蜜蜂(Apis cerana cerana)的线粒体遗传多样性分析[J]. 四川农业大学学报 2018(03)

    标签:;  ;  ;  ;  

    单倍型Hi-C软件的开发与应用
    下载Doc文档

    猜你喜欢