文本数据库论文_张仕学

导读:本文包含了文本数据库论文开题报告文献综述、选题提纲参考文献及外文文献翻译，主要关键词:文本,数据库,主题词,知识,规则,数据,表征。

文本数据库论文文献综述

张仕学^[1]（2018）在《大型文本数据库中分布式数据去重备份方法》一文中研究指出数据去重可删除备份过程中的冗余数据,节约存储资源与与网络带宽,是目前数据存储领域研究的重点问题。针对传统方法去重率和吞吐量低的问题,提出一种新的大型文本数据库中分布式数据去重备份方法。介绍了大型文本数据库中分布式数据去重方法基本思想,通过文件管理部分对数据片组中的扶贫数据进行查询和统计,给出数据片组路由策略,分析了数据预取过程。通过最终权值完成对数据块的排列,以恢复时间与恢复成本达到最小化为目的设计适应度函数。通过改进遗传方法对大型文本数据库中分布式扶贫数据进行备份。实验结果表明,所提方法有很高的去重率和吞吐量,且成本低,恢复速度快。(本文来源于《科学技术与工程》期刊2018年04期）

喻刚^[2]（2013）在《文本数据库在嵌入式PC中的应用》一文中研究指出在嵌入式产品中或通用计算机中,常有大量数据需要存储,因为硬件资源有限,或者因为兼容性的原因,不能安装大型数据库。笔者在实际应用中,采用文本文件来存储数据。本文将介绍这一方法的使用过程,对于衡器中的其他系统开发也有借鉴作用。(本文来源于《衡器》期刊2013年07期）

贾桂军,董玉民,蔡文艺^[3]（2010）在《基于PHP+文本数据库的简易数据查询系统设计与实现》一文中研究指出文章从实际应用出发,在UNUX服务器的WEB环境下,利用PHP+文本数据库,设计一个简易的数据查询系统。此系统可应用于各类数据的WEB实时在线查询,具有广泛的运用价值。(本文来源于《Proceedings of 2010 International Conference on Future Information Technology and Management Engineering (FITME 2010) Volume 3》期刊2010-10-09）

陈舜飞^[4]（2009）在《文本数据库的表征和排序的研究》一文中研究指出分布式文本检索方法能够有效的提高文本检索范围和检索速度。元搜索方法是一种重要的分布式的文本检索的方法。它是建立在许多已有的搜索引擎服务之上的一种搜索引擎。它本身并不像普通的搜索引擎一样有自身的数据库,而只是维护它所组成它的成员搜索引擎的参数信息。当一个搜索到来是,元搜索引擎本身并不处理,而是按照各个成员引擎的搜索格式做相应的转换之后再分发到各个成员搜索引擎,各个成员搜索引擎返回搜索结果之后,元搜索引擎将进行搜索结果合并形成全局的搜索结果呈现给用户。由于网络上有太多的搜索引擎,但并不是所有搜索引擎中都有用户所需要的资料。如果元搜索引擎对所有的搜索引擎都发请求,那么就会造成响应速度缓慢,因此需要有所选择的对搜索引擎发送搜索请求,对哪些数据库发送请求就成为决定搜索结果好坏的重要因素。文本数据库的表征和排序就是用于帮助元搜索引擎决定如何选择搜索数据库。本文就是针对此问题进行研究。本文首先介绍了元搜索引擎技术中数据库选取步骤的重要性和意义,深入分析了基于查询的样本文本数据库的表征方法和多层文本数据库表征方法,并且重点研究了在元搜索引擎中用于数据库排序的修正最大归一权重法。并在修正最大归一权重法的基础上,指出其存在的缺陷并且讨论了其可能的改进方法,包括了:无用词表的调整;加入了反馈(feedback)的修正最大归一权重法;加入了相关词和近义词;改进了词组合算法。并通过实验比较了改进后的方法和修正最大归一权重法并证明了改进的方法比原先的方法更为有效。(本文来源于《重庆大学》期刊2009-04-01）

张晗,任志国,张健,崔雷^[5]（2008）在《基于主题词关联规则的医学文本数据库数据挖掘的尝试》一文中研究指出利用关联规则算法,对PubMed数据库中有关两种消化系统疾病和两个相应的检查方法的主题词和副主题词组配模式进行分析,抽取出与之有关的、有效的语义关系搭配模式,并以文献和教科书为标准对结果进行检验,从而为文献检索和建立知识库提供依据。(本文来源于《医学信息学杂志》期刊2008年01期）

王永恒,杨树强,贾焰^[6]（2007）在《海量文本数据库中的高效并行频繁项集挖掘方法》一文中研究指出针对大规模文本数据库中频繁项集挖掘的特殊要求,本文提出了一种新的并行挖掘算法parFIM。parFIM以一种简单的数据结构H-Struct为基础,对数据进行纵向划分从而实现并行挖掘。算法同时考虑了去除短模式和减少重复模式。实验结果表明,parFIM能够很好地适用于大规模文本数据库中的频繁项集挖掘任务。(本文来源于《计算机工程与科学》期刊2007年09期）

张晗,路振宇,崔雷^[7]（2006）在《利用关联规则对医学文本数据库进行知识抽取的尝试——以四种抗肿瘤药为例》一文中研究指出利用关联规则算法,对PubMed数据库中的4种抗肿瘤药物主题词和副主题词组配模式进行分析,并以文献和教科书标准,抽取出与这四类药有关的、有效的语义关系搭配模式,从而为文献检索和建立知识库提供依据。(本文来源于《现代图书情报技术》期刊2006年09期）

王永恒,贾焰,杨树强^[8]（2006）在《大规模文本数据库中的短文分类方法》一文中研究指出信息技术的飞速发展造成了大量的文本数据累积,其中很大一部分是短文本数据。文本分类技术对于从这些海量短文中自动获取知识具有重要意义。但是由于短文中的关键词出现次数少,而且带标签的训练样本又通常数量很少,现有的一般文本挖掘算法很难得到可接受的准确度。一些基于语义的分类方法获得了较好的准确度但又由于其低效性而无法适用于海量数据。文本提出了一个新颖的短文分类算法。该算法基于文本语义特征图,并使用类似kNN的方法进行分类。实验表明该算法在对海量短文进行分类时,其准确度和性能超过其它的算法。(本文来源于《计算机工程与应用》期刊2006年22期）

赵鹏^[9]（2005）在《一种基于压缩的全文本数据库倒排索引方法》一文中研究指出文本信息数量的飞速增长给传统的信息检索技术带来了新的挑战。在目前有关信息检索技术的研究中,全文本数据库上的索引压缩技术是一项新的研究领域。这种技术能够使得查找文本具有更快的速度,并且能够节省磁盘空间,所以该技术具有较高的理论研究意义和良好的应用前景。提出了一个基于数据压缩的全文本数据库倒排索引结构,并在此结构上设计出了一些查找算法来获得更好的查找性。(本文来源于《黑龙江大学自然科学学报》期刊2005年03期）

楚绪格^[10]（2005）在《基于神经网的文本数据库挖掘》一文中研究指出由于网页上的文档自然分布在许多文本数据库中,有效的文档搜索过程需要将最可能为查询者提供相关文档的文本数据库分辨出来,然后搜索分辨出来的文本数据库。本文中,我们提出了一种基于神经网单元的有效文件搜索方法。首先,提供一个神经网单元,它能够从用户的相关反馈中学习基本的文本数据库。将神经网单元用基于BP网的学习机制充分训练,若提供一个查询,它能够找出与相关文档有关的文本数据库,并高效地搜索这些文档。为了能够利用大规模文本数据库来验证这种方法,我们提出了神经网单元的层次组织,它可以将总的训练时间降低到可接受的水平。最后,我们通过与传统着名的方法相比较来评价这种方法的性能。(本文来源于《兰州理工大学》期刊2005-04-01）

文本数据库论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

在嵌入式产品中或通用计算机中,常有大量数据需要存储,因为硬件资源有限,或者因为兼容性的原因,不能安装大型数据库。笔者在实际应用中,采用文本文件来存储数据。本文将介绍这一方法的使用过程,对于衡器中的其他系统开发也有借鉴作用。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本数据库论文参考文献

[1].张仕学.大型文本数据库中分布式数据去重备份方法[J].科学技术与工程.2018

[2].喻刚.文本数据库在嵌入式PC中的应用[J].衡器.2013

[3].贾桂军,董玉民,蔡文艺.基于PHP+文本数据库的简易数据查询系统设计与实现[C].Proceedingsof2010InternationalConferenceonFutureInformationTechnologyandManagementEngineering(FITME2010)Volume3.2010

[4].陈舜飞.文本数据库的表征和排序的研究[D].重庆大学.2009

[5].张晗,任志国,张健,崔雷.基于主题词关联规则的医学文本数据库数据挖掘的尝试[J].医学信息学杂志.2008

[6].王永恒,杨树强,贾焰.海量文本数据库中的高效并行频繁项集挖掘方法[J].计算机工程与科学.2007

[7].张晗,路振宇,崔雷.利用关联规则对医学文本数据库进行知识抽取的尝试——以四种抗肿瘤药为例[J].现代图书情报技术.2006

[8].王永恒,贾焰,杨树强.大规模文本数据库中的短文分类方法[J].计算机工程与应用.2006

[9].赵鹏.一种基于压缩的全文本数据库倒排索引方法[J].黑龙江大学自然科学学报.2005

[10].楚绪格.基于神经网的文本数据库挖掘[D].兰州理工大学.2005