动物病毒组学数据分析平台的建立及应用

动物病毒组学数据分析平台的建立及应用

论文摘要

病毒是世界上最丰富多样的微生物群体,其广泛存在于各种生物体及环境中,并且在环境和人类健康中扮演着重要的角色。病毒宏基因组学技术的出现打破了传统分离鉴定方法的瓶颈,加快了人类对病毒研究的步伐。随着测序技术的快速进步及相关费用的逐步降低,宏病毒组学技术已经成为新病毒发现的最为重要的手段之一。在以动物新发疫情监测和预警为主要功能的实验室,数据分析的效率和准确性对疫情早期防控至关重要,而目前以商业公司为依托的宏病毒测序及数据分析模式,无法满足该需求,亟需建立本地的宏病毒数据分析平台,为新发疫情早期预警提供技术支撑。为建立本地化动物宏病毒数据分析平台,本研究首先利用Perl语言程序及MySQL数据库语言建立起标准化且兼容性良好的病毒基因组参考数据库,其包含89个病毒科或属在内的11万多条目前已知的病毒全基因序列。其次,根据宏基因组数据分析流程,建立和部署了测序原始数据质控、数据清洗、序列拼接、序列注释、功能预测以及遗传演化分析等应用程序,构建起了本地宏病毒组数据分析平台。另外,根据动物新病毒发现中对敏感性和特异性的不同需求,建立了两种基因序列注释策略:基于读长序列分析(Assembly-free analysis)和基于重叠序列分析(Assembly-based analysis),前者能提高注释的敏感性,有利于发现低拷贝的病毒基因组序列;后者可提高注释的特异性,保障注释结果的准确性。为验证该平台的应用效果,首先利用数据质控和清洗软件对从安徽省采集的猪群鼻拭子样品及血清样品中获得的宏基因组数据进行了分析和处理,原始测序数据经接头序列及低质量序列去除后分别得到31490033和41208780对读长序列。将得到的读长序列利用MEGAHIT软件进行基因组序列组装,组装后结果显示鼻拭子样品得到415117条重叠序列(contig),血清样品得到81026条重叠序列。随后利用基础病毒基因组数据库和注释软件对组装后的重叠序列进行基因注释,结果显示鼻拭子样品中共计307 contigs被注释到1942条病毒序列,其中48.9%为指环病毒科(Anelloviridae)病毒序列,20.2%为细小病毒科(Parvoviridae)序列,16.2%为圆环病毒科(Circoviridae)序列,11.1%为冠状病毒科(Coronaviridae)序列;此外还包括多种其它病毒,如哺乳动物星状病毒、痘病毒、白血病病毒等;血清样品中共计10012条重叠序列被注释到1376条病毒序列,其中细小病毒科序列占66.5%,指环病毒科序列占29.5%,圆环病毒科序列占1.3%。以上结果说明血清样品和鼻拭子样品中病毒多样性存在差异。此外,实例宏病毒组数据分析发现不同研究策略分析效率略有不同,完成基于读长序列注释分析耗时1.5 d,而基于重叠序列注释分析则耗时3.5 d。以上研究结果表明,本研究成功建立了一个本地化的动物病毒宏基因组数据分析平台,利用该平台可高效、准确地完成动物病毒宏病毒组学数据分析,能满足新发动物病毒病监测和预警的需求,对我国动物疫病防控具有重要意义。

论文目录

  • 摘要
  • abstract
  • 英文缩略表
  • 第一章 引言
  •   1.1 病毒宏基因组学
  •   1.2 病毒宏基因组学分析流程
  •     1.2.1 样品准备
  •     1.2.2 宏基因组测序
  •     1.2.3 数据处理及分析
  •   1.3 病毒宏基因组学的应用
  •     1.3.1 人类健康
  •     1.3.2 环境问题
  •     1.3.3 新病毒发现
  •     1.3.4 疾病预警
  •   1.4 研究的目的及意义
  • 第二章 病毒宏基因组学数据分析平台的建立
  •   2.1 环境搭建
  •     2.1.1 Perl语言环境
  •     2.1.2 关系数据库管理系统
  •   2.2 主要硬件配置及软件应用
  •     2.2.1 硬件配置
  •     2.2.2 软件应用
  •   2.3 研究方法
  •     2.3.1 病毒基因组数据及宿主基因组数据的下载及整理
  •     2.3.2 病毒基因组数据库及宿主基因组数据库的构建
  •     2.3.3 数据的质量控制
  •     2.3.4 数据的预处理
  •     2.3.5 数据过滤后质量控制
  •     2.3.6 读长注释
  •     2.3.7 序列组装及组装效果评价
  •     2.3.8 基因注释
  •     2.3.9 后处理分析
  •   2.4 研究结果
  •     2.4.1 病毒宏基因组数据库
  •     2.4.2 宿主基因组数据库
  •     2.4.3 病毒宏基因组学数据分析平台
  •   2.5 讨论
  • 第三章 病毒宏基因组学分析平台的应用―安徽省猪群宏病毒组分析
  •   3.1 样品处理及测序
  •   3.2 研究方法
  •     3.2.1 原始数据的质量控制
  •     3.2.2 数据的预处理
  •     3.2.3 过滤后宏病毒组数据的质量控制
  •     3.2.4 宏病毒组数据的读长注释
  •     3.2.5 序列拼接及组装效果评价
  •     3.2.6 基因注释
  •     3.2.7 病毒多样性比较分析
  •     3.2.8 不同研究策略比较分析
  •   3.3 研究结果
  •     3.3.1 数据过滤及质量控制
  •     3.3.2 序列拼接及组装效果评价
  •     3.3.3 基因注释
  •     3.3.4 病毒多样性分析
  •     3.3.5 研究策略分析比较
  •   3.4 讨论
  • 第四章 全文结论
  • 参考文献
  • 附录
  •   附录1. Perl与 BioPerl的安装
  •   附录2. MySQL数据库的安装
  •   附录3. 数据分析软件的安装及常用参数
  •   附录4. 病毒基因组数据库包含的病毒科或属
  • 致谢
  • 作者简历
  • 文章来源

    类型: 硕士论文

    作者: 史智宾

    导师: 王靖飞

    关键词: 动物,病毒宏基因组学,数据库,数据分析,病毒多样性

    来源: 中国农业科学院

    年度: 2019

    分类: 基础科学,农业科技

    专业: 生物学,畜牧与动物医学

    单位: 中国农业科学院

    分类号: S852.65

    总页数: 51

    文件大小: 3376K

    下载量: 212

    相关论文文献

    • [1].基于云计算的网络教育数据分析平台研究[J]. 计算机产品与流通 2020(06)
    • [2].大数据分析平台建设与应用研究[J]. 信息与电脑(理论版) 2020(09)
    • [3].基于大数据的智慧交通态势分析平台设计与实现[J]. 广播电视网络 2020(07)
    • [4].大数据情报分析平台在图书馆管理与服务中的应用体会[J]. 兰台内外 2020(25)
    • [5].高校大数据分析平台设计与实现[J]. 信息通信 2020(09)
    • [6].基于大数据智能营销云的游戏运营分析平台的研发[J]. 电子技术与软件工程 2017(23)
    • [7].构建高校大数据分析平台的探索——以上海公安高等专科学校为例[J]. 中国教育信息化 2017(05)
    • [8].基于一卡通数据的校园大数据分析平台的构建与应用[J]. 华中师范大学学报(自然科学版) 2017(S1)
    • [9].国外知名大数据分析平台概览(上)[J]. 中国安防 2017(06)
    • [10].国外知名大数据分析平台概览(下)[J]. 中国安防 2017(07)
    • [11].大数据分析平台建设与应用探析[J]. 科技经济导刊 2017(25)
    • [12].高校大数据分析平台设计与研究[J]. 现代信息科技 2020(01)
    • [13].基于大数据的智能商务分析平台开发和设计[J]. 现代电子技术 2020(05)
    • [14].路况大数据分析平台的设计与实现[J]. 电子技术与软件工程 2020(06)
    • [15].强负荷网络环境下的大型负载分析平台的设计与优化[J]. 现代电子技术 2017(02)
    • [16].企业级安全大数据分析平台[J]. 电信技术 2017(09)
    • [17].学习分析平台告诉你:学生如何参与网上课程[J]. 中国教育网络 2016(08)
    • [18].基于云计算的大数据统一分析平台研究与设计[J]. 广东通信技术 2013(01)
    • [19].论物流统计数据分析平台的构建[J]. 今日南国(理论创新版) 2008(07)
    • [20].基于互联网大数据的招聘数据智能分析平台的设计与实现[J]. 软件 2020(03)
    • [21].基于互联网大数据的招聘数据智能分析平台研究[J]. 科学技术创新 2020(24)
    • [22].煤矿事故风险分析平台的应用研究[J]. 自动化应用 2020(06)
    • [23].铁路安全大数据分析平台研究[J]. 铁路计算机应用 2020(09)
    • [24].关于建设农业大数据分析平台的研究[J]. 市场周刊 2020(09)
    • [25].基于用电大数据的经济分析平台设计研究[J]. 电力大数据 2017(08)
    • [26].关于港口集团财务大数据分析平台的创新性探索[J]. 财会学习 2018(11)
    • [27].大数据分析平台建设与应用综述[J]. 集成技术 2016(02)
    • [28].探究数据分析平台在企业管理中的作用[J]. 计算机光盘软件与应用 2015(01)
    • [29].基于大数据理念构建金融分析平台[J]. 西部金融 2015(09)
    • [30].高职信号与系统课程分析平台的应用[J]. 中国西部科技 2010(27)

    标签:;  ;  ;  ;  ;  

    动物病毒组学数据分析平台的建立及应用
    下载Doc文档

    猜你喜欢