基因组比对论文_刘振羽

导读:本文包含了基因组比对论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:基因组,比对,研磨机,序列,甜菜,样品,同态。

基因组比对论文文献综述

刘振羽[1](2019)在《基于Spark的基因组学数据比对算法的并行化研究与比对平台构建》一文中研究指出近年来,随着高通量测序技术的出现,极大的推动了生物信息领域的发展,基因组序列比对是生物信息数据分析的关键环节。BLAST(Basic Local Alignment Search Tool)作为应用广泛并且具有较高精度的基因序列局部比对算法,它在保持较高精度的前提下可以相对减少任务运行时间。然而,BLAST在比对海量或者较大数据集的高通量基因数据时存在一定的性能瓶颈,比对效率较低。针对BLAST存在的性能瓶颈问题,本文提出一种基于大数据技术内存计算框架Spark的Spark_BLAST分布式并行方法。该方法基于Spark内存计算的优势,对基因序列进行任务识别、划分、计算等。采用Apache YARN资源调度器完成比对任务调度和资源分配,实现了 BLAST算法的分布式并行计算。本实验通过5节点的Spark集群与单机BLAST实验结果进行对比验证,在不改变比对结果精度的情况下,Spark_BLAST的加速比可达4左右,实验结果表明基于Spark的并行化方法可以大大提高BLAST运算效率,缓解其性能瓶颈问题,为生物信息学领域提供一个高效计算的Spark_BLAST比对方法。同时本课题采用大数据技术Hadoop的HDFS作为基因组数据存储文件系统,解决了海量高通量基因组数据可扩展增量存储问题。另外,设计并开发了基于Web端的简洁构建了便捷的图形化界面操作基因比对平台,为生物信息领域研究人员的基因数据比对分析带了极大便利。(本文来源于《内蒙古农业大学》期刊2019-06-01)

段雪倩,沈艳爽,申少奇,孟繁博,刘颖[2](2019)在《豆科抗病基因NBS-LRR进化的多基因组比对分析》一文中研究指出NBS-LRR是植物抗病基因家族中一类重要的基因,根据编码的蛋白质氨基端的保守结构域不同,可分为CC-NBS-LRR和TIR-NBS-LRR两类基因。本研究在10个已测序豆科植物中对NBS-LRR进行序列比对,鉴定了各基因组中两类结构域基因的同源拷贝,发现在蒺藜苜蓿中包含1 207个NBS-LRR基因的同源拷贝,在10个基因组中同源拷贝数最多;并且其中88.2%的NBS-LRR基因是具有CC结构域。基因组同源共线分析,发现全基因组加倍有利于抗病基因拷贝数的扩增,为家族基因序列和功能多样化提供了创新资源。基于NBS-LRR基因系统发育分析,发现抗病基因存在大量串联重复,并基于进化树拓扑结构的变迁揭示抗病基因在不同的基因组中进化速率不同;另外,通过对旁系同源基因对间的核苷酸同义替换率(Ks)比较,进一步证实不同结构的抗病基因进化速率不同;同一结构的抗病基因在不同基因组中进化速率也表现有明显差异,与其他豆科物种相比,大豆抗病基因进化速率一直处于较低水平。研究结果为揭示抗病基因在豆科植物中的进化过程提供了重要的基因组信息学基础,对于在全基因组范围认识泛豆科抗病基因进化具有重要的意义。(本文来源于《分子植物育种》期刊2019年10期)

赵川,赵圣楠,贾忠田,张波,张斌[3](2019)在《实用安全两方计算及其在基因组序列比对中的应用》一文中研究指出安全两方计算(secure two-party computation)是密码学领域中的一个重要研究方向.作为安全多方计算中的一个特殊情形,安全两方计算中参与计算的实体仅为两方.相比于叁方及更多参与方的情况,安全两方计算不仅在理论研究方面更具挑战性,在应用研究方面也具有更加广泛的应用场景.近年来,安全两方计算在实用性方面的研究取得了飞速发展,不仅在通用协议构造的效率上取得了重要突破,而且在涉及数据隐私计算的各个应用领域得到了广泛关注,比如基因组数据的隐私保护等.本文介绍了安全两方计算的基本概念、基本工具等基础知识,简要概述了安全两方计算近年来在实用性方面取得的重要研究成果,并重点介绍了安全两方计算在基因组序列比对中的应用及其研究进展.为了更加清晰地介绍相关研究进展,本文从安全两方计算的两个主要构造方法 (即同态加密和混乱电路)出发,分别给出了基于这两种不同底层工具的研究脉络.此外,本文指出了现阶段基于安全两方计算的基因组序列比对研究中存在的几点不足,并分析了未来可能的研究方向.(本文来源于《密码学报》期刊2019年02期)

邹奕,兴旺,朱尚明,栗媛,齐少玮[4](2018)在《样品不同处理方法提取甜菜基因组DNA的比对研究》一文中研究指出为了提高甜菜基因组DNA的提取效率以及避免提取过程中DNA的降解,通过利用研磨机和锡箔纸两种不同的方法处理样品。结果表明,利用研磨机可以极大地提高研磨样品的效率,样品可以直接放到离心管中、加入缓冲液和钢珠后,直接利用研磨机进行打磨,一次可以处理24个样品;而利用锡箔纸进行研磨样品,既可以直接加液氮进行研磨也可以冷冻后再加液氮进行研磨,样品损失小,DNA无降解。两种方法提取的DNA含量接近,并且提取的DNA均可用于SSR引物的扩增。(本文来源于《中国糖料》期刊2018年04期)

邹奕,朱尚明,栗媛,齐少玮,吴则东[5](2018)在《样品不同处理方法提取甜菜基因组DNA的比对研究》一文中研究指出为了提高甜菜基因组DNA的提取效率以及避免提取过程中DNA的降解,通过利用研磨机和锡箔纸两种不同的方法处理样品。结果表明,利用研磨机可以极大地提高研磨样品的效率,样品可以直接放到离心管中、加入缓冲液和钢珠后,直接利用研磨机进行打磨,一次可以处理24个样品;而利用锡箔纸进行研磨样品,既可以直接加液氮进行研磨也可以冷冻后再加液氮进行研磨,样品损失小,DNA无降解。两种方法提取的DNA含量接近,并且提取的DNA均可用于SSR引物的扩增。(本文来源于《中国作物学会甜菜专业委员会学术会议论文集》期刊2018-05-16)

何忠峭,徐云[6](2018)在《多基因组索引研究及其改进序列比对算法》一文中研究指出目前的多基因组比对算法需要大量时间和内存开销,多基因组索引(MuGI)的比对算法速度较快,但未能利用多基因组重复信息。为此,提出一种改进的MuGI索引比对算法。运用带单核苷酸多态性剪枝的动态种子扩展算法及多基因组的重复信息,提高比对速度。同时采用按需读取索引的内存管理策略,提高算法的空间效率。实验结果表明,改进算法仅需6 GB运行内存,即可在1 092人基因组上进行比对,并且误配阈值为5的比对速度为MuGI算法的3倍左右。(本文来源于《计算机工程》期刊2018年03期)

杨南山[7](2017)在《棉花多基因组的比对图谱构建与功能进化分析》一文中研究指出本课题以棉花为研究对象,以棉花在进化过程中经历的加倍事件为线索,并引入葡萄、可可、拟南芥和西杨作为参考基因组,探索了棉花在进化过程中染色体的进化、基因组的丢失、棉纤维发育相关基因的进化情况,并对棉花在进化过程中的分离时间进行了测定。研究表明,全基因组加倍事件造成了棉花基因组的进化的不对称性,并使棉花基因组大发生了大量的基因丢失、染色体重排等现象,在二倍体棉花中,有约70%的基因丢失,四倍体棉花中,有约50%的基因发生丢失,这种丢失的规模是相当高的,并且丢失过程是随机的,符合指数分布的过程。研究发现,两个二倍体棉花杂交形成异源四倍体棉花的过程中,基因组进化呈现了偏性,即不对称性。研究对物种的分离时间进行了测定,棉花与其亲源物种可可的分离时间是38个百万年前,棉花A与棉花D的分离时间是4个百万年前,而在异源四倍体内部,亚基因组D进化速率高于亚基因组A,也显示了进化的不对称性。研究还得到了涉及棉花、可可、葡萄、拟南芥、西杨的同源共线性比对列表和图谱。本论文利用现有棉纤维发育相关基因与棉属物种和外类群物种进行了同源比对,分别在棉花A基因组、棉花D基因组、棉花AD基因组、葡萄、可可、拟南芥、西杨中发现了192、204、365、84、112、128和176个棉纤维发育相关基因,这些棉纤维发育相关基因可能来自双子叶植物的共同祖先。棉纤维发育相关基因的进化也是不平衡的,在两个二倍体棉花A和D形成异源四倍体棉花AD的过程中,这种不平衡性表现的更为明显。本课题运用多学科的方法对棉花及其外类群物种的基因组进行了比对分析,完善了棉花比较基因组学数据库,相关结果对棉花基因组学的研究具有重要意义。(本文来源于《华北理工大学》期刊2017-05-25)

刘兰兰,郭小芹,吴建勇,郭中敏,陆家海[8](2017)在《寨卡病毒全基因组多序列比对及遗传进化分析》一文中研究指出目的分析寨卡病毒不同毒株分离的时间、地区以及基因型分布,基因序列的相似性,核苷酸的变异及遗传进化趋势,为寨卡的防控提供生物信息学方面的依据。方法应用Bio Edit Sequence Alignmemt Editor软件,DNAStar 7.1及Mega 7.0软件对NCBI-Nucleotide中收录的85条寨卡病毒全基因组核苷酸序列及遗传进化进行分析,探索寨卡的起源及传播过程。结果寨卡病毒组内核苷酸序列最低相似性为94.5%,最高相似性为100%;65株全基因序列中,共有765处碱基发生变异,组内变异率在0.00%~24.44%;在所有的碱基突变中,碱基转换占84.32%,而碱基颠换占15.68%;分离时间、地区相近的菌株,其遗传距离较近。结论寨卡病毒存在较高变异,这些变异可能在寨卡病毒本身的毒力、致病性及传播方式的改变中发挥重要作用。(本文来源于《热带医学杂志》期刊2017年03期)

钟军华,马羊帅,聂丽,杨慧林[9](2017)在《基于全基因组序列比对的枯草芽孢杆菌噬菌体侵染能力分析》一文中研究指出目前,在美国国家生物技术信息中心(NCBI)数据库中已报道数量众多的枯草芽孢杆菌及其噬菌体的全基因组序列,这为我们利用全基因组比对手段研究枯草芽孢杆菌噬菌体的侵染能力提供了数据基础。本研究从NCBI基因组数据库中下载具有完整序列的枯草芽孢杆菌及噬菌体的基因组及相应的蛋白质序列,利用BLAST软件进行基因组序列比对,得出枯草芽孢杆菌与噬菌体之间的关系。通过利用R语言等软件对噬菌体侵染枯草芽孢杆菌的能力进行分析。然后利用Clustalx和Treeview软件构建进化树,得出枯草芽孢杆菌之间的亲缘性关系,最后对枯草芽孢杆菌蛋白质进行COG注释。结果表明:在65株枯草芽孢杆菌噬菌体中,Bacillus_phage_SPBc2和Bacillus_phage_ph IS3501的侵染能力最强,而Bacillus_phage_phi AGATE等3株噬菌体的侵染能力较弱。在37株枯草芽孢杆菌中Bacillus subtilis ATCC 49760的易感性较强,Bacillus subtilis RO-NN-1等8株对枯草芽孢杆菌噬菌体的抗性较强。本研究利用基因组比对的方法对枯草芽孢杆菌噬菌体侵染宿主的能力以及枯草芽孢杆的蛋白质功能进行了分析,为后续进一步研究枯草芽孢杆菌噬菌体侵染能力及其蛋白质功能提供参考。(本文来源于《基因组学与应用生物学》期刊2017年02期)

高昭良[10](2016)在《一种基于最大基因组比对法的地理要素匹配相似度算法》一文中研究指出地理要素同名匹配是地理空间信息数据库实现要素级更新维护的基础,它对于提高地理空间信息现势性与应用水平具有重要的理论和实践意义。本文针对目前空间数据库变化特征进行了深入分析,并在此基础上,针对空间数据库快速更新需求,从几何视角提出了一种基于最大基因组比对法的地理要素匹配相似度算法,在空间信息数据库更新过程中验证了该匹配算法的可行性。(本文来源于《城市勘测》期刊2016年06期)

基因组比对论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

NBS-LRR是植物抗病基因家族中一类重要的基因,根据编码的蛋白质氨基端的保守结构域不同,可分为CC-NBS-LRR和TIR-NBS-LRR两类基因。本研究在10个已测序豆科植物中对NBS-LRR进行序列比对,鉴定了各基因组中两类结构域基因的同源拷贝,发现在蒺藜苜蓿中包含1 207个NBS-LRR基因的同源拷贝,在10个基因组中同源拷贝数最多;并且其中88.2%的NBS-LRR基因是具有CC结构域。基因组同源共线分析,发现全基因组加倍有利于抗病基因拷贝数的扩增,为家族基因序列和功能多样化提供了创新资源。基于NBS-LRR基因系统发育分析,发现抗病基因存在大量串联重复,并基于进化树拓扑结构的变迁揭示抗病基因在不同的基因组中进化速率不同;另外,通过对旁系同源基因对间的核苷酸同义替换率(Ks)比较,进一步证实不同结构的抗病基因进化速率不同;同一结构的抗病基因在不同基因组中进化速率也表现有明显差异,与其他豆科物种相比,大豆抗病基因进化速率一直处于较低水平。研究结果为揭示抗病基因在豆科植物中的进化过程提供了重要的基因组信息学基础,对于在全基因组范围认识泛豆科抗病基因进化具有重要的意义。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

基因组比对论文参考文献

[1].刘振羽.基于Spark的基因组学数据比对算法的并行化研究与比对平台构建[D].内蒙古农业大学.2019

[2].段雪倩,沈艳爽,申少奇,孟繁博,刘颖.豆科抗病基因NBS-LRR进化的多基因组比对分析[J].分子植物育种.2019

[3].赵川,赵圣楠,贾忠田,张波,张斌.实用安全两方计算及其在基因组序列比对中的应用[J].密码学报.2019

[4].邹奕,兴旺,朱尚明,栗媛,齐少玮.样品不同处理方法提取甜菜基因组DNA的比对研究[J].中国糖料.2018

[5].邹奕,朱尚明,栗媛,齐少玮,吴则东.样品不同处理方法提取甜菜基因组DNA的比对研究[C].中国作物学会甜菜专业委员会学术会议论文集.2018

[6].何忠峭,徐云.多基因组索引研究及其改进序列比对算法[J].计算机工程.2018

[7].杨南山.棉花多基因组的比对图谱构建与功能进化分析[D].华北理工大学.2017

[8].刘兰兰,郭小芹,吴建勇,郭中敏,陆家海.寨卡病毒全基因组多序列比对及遗传进化分析[J].热带医学杂志.2017

[9].钟军华,马羊帅,聂丽,杨慧林.基于全基因组序列比对的枯草芽孢杆菌噬菌体侵染能力分析[J].基因组学与应用生物学.2017

[10].高昭良.一种基于最大基因组比对法的地理要素匹配相似度算法[J].城市勘测.2016

论文知识图

:28株屎肠球菌全基因序列比对以菌株...敏感和抗性品系中公有和特有的测序序列...蓝塘猪Kit基因内含子10序列测序质量评估图个结核分枝杆菌全基因组序列对比图与其他物种响应赤霉素相关GID1蛋...

标签:;  ;  ;  ;  ;  ;  ;  

基因组比对论文_刘振羽
下载Doc文档

猜你喜欢