基于深度学习的植物知识图谱的构建

基于深度学习的植物知识图谱的构建

论文摘要

随着信息技术的快速发展,特别是人工智能技术的广泛应用,如何处理网络中海量的数据,向用户提供易理解的知识成为研究的热点。知识图谱对实现数据到知识的转化有重要作用,其目的是对真实世界中存在的实体、概念及其关联关系进行描述。在林业领域,知识图谱可在语义检索、数据挖掘、预测分析、智能问答和决策支持等应用场景下发挥重要作用。本文在植物信息领域,研究基于多种数据源构建植物知识图谱的方法,在知识图谱的构建、命名实体识别和基于知识图谱的语义检索等方面展开工作。分析了领域知识图谱的构建过程,并阐述了涉及的关键技术。总结了中国植物志文本的特点,研究如何在其上进行属性命名实体的识别,提出了基于深度神经网络的命名实体识别方法。研究了植物信息相关的数据源,充分利用行业网站和百科网站的信息。利用不同数据源的信息构建植物知识图谱,将其应用于语义检索问题,结合可视化技术构建了基于植物知识图谱的语义检索系统。植物知识图谱作为林业领域知识图谱构建的尝试,可为用户提供智能、直观的语义检索。未来可在此基础上进一步融合其他林业知识,作为智慧林业发展的知识支撑,服务于林业领域的语义检索、知识推理和决策支持等应用。

论文目录

  • 摘要
  • ABSTRACT
  • 1 引言
  •   1.1 研究背景及意义
  •   1.2 国内外研究现状
  •     1.2.1 通用知识图谱的构建
  •     1.2.2 领域知识图谱的构建
  •     1.2.3 开放知识图谱项目
  •   1.3 研究内容和创新点
  •     1.3.1 研究内容
  •     1.3.2 创新点
  •   1.4 论文的组织结构
  • 2 知识图谱相关理论和技术
  •   2.1 知识图谱的定义
  •   2.2 通用知识图谱和领域知识图谱
  •   2.3 领域知识图谱的构建过程和难点
  •     2.3.1 领域知识图谱的构建过程
  •     2.3.2 中文知识图谱构建的难点
  •   2.4 知识图谱构建的关键技术
  •     2.4.1 实体识别
  •     2.4.2 实体消歧
  •     2.4.3 关系抽取
  •     2.4.4 知识推理
  •     2.4.5 知识存储
  •     2.4.6 知识表示
  •   2.5 本章小结
  • 3 植物属性文本的命名实体识别算法
  •   3.1 命名实体任务概述
  •     3.1.1 背景
  •     3.1.2 基于规则的方法
  •     3.1.3 基于统计机器学习的方法
  •     3.1.4 基于深度学习的方法
  •   3.2 植物属性文本数据集的构建
  •     3.2.1 植物属性文本分析
  •     3.2.2 数据集构建
  •   3.3 算法整体框架
  •     3.3.1 基于BiLSTM的特征提取模块
  •     3.3.2 基于CNN的特征提取模块
  •     3.3.3 基于CRF的标注模块
  •   3.4 实验结果与分析
  •     3.4.1 评价指标
  •     3.4.2 基于句子特征表示的结果分析
  •     3.4.3 基于训练参数的结果分析
  •     3.4.4 基于多种模型的结果分析
  •   3.5 本章小结
  • 4 植物知识图谱的构建
  •   4.1 数据源的选择
  •     4.1.1 中国植物志
  •     4.1.2 中国林业信息网
  •     4.1.3 百度百科
  •   4.2 概念体系结构定义
  •   4.3 实体信息获取
  •     4.3.1 结构化数据
  •     4.3.2 半结构化数据
  •     4.3.3 非结构化数据
  •   4.4 实体关系获取
  •   4.5 多数据源的知识融合
  •     4.5.1 知识融合
  •     4.5.2 植物知识图谱的存储
  •   4.6 本章小结
  • 5 基于植物知识图谱的语义检索系统
  •   5.1 语义检索概述
  •   5.2 基于植物知识图谱的语义检索
  •     5.2.1 基于植物知识图谱的语义检索过程
  •     5.2.2 实体匹配过程
  •     5.2.3 问句理解过程
  •     5.2.4 基于植物知识图谱的语义检索示例
  •   5.3 知识图谱的可视化
  •   5.4 本章小结
  • 6 研究总结和展望
  •   6.1 研究工作总结
  •   6.2 展望
  • 参考文献
  • 个人简介
  • 导师简介
  • 获得成果目录
  • 致谢
  • 文章来源

    类型: 硕士论文

    作者: 檀稳

    导师: 李冬梅

    关键词: 知识图谱,深度学习,命名实体识别,语义检索

    来源: 北京林业大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 生物学,计算机软件及计算机应用,自动化技术

    单位: 北京林业大学

    分类号: TP391.1;TP18;Q94

    DOI: 10.26949/d.cnki.gblyu.2019.000740

    总页数: 65

    文件大小: 6030K

    下载量: 505

    相关论文文献

    • [1].融入语言模型和注意力机制的临床电子病历命名实体识别[J]. 计算机科学 2020(03)
    • [2].特定领域的命名实体识别方法的研究[J]. 电脑知识与技术 2020(08)
    • [3].基于迁移表示学习的军事命名实体识别[J]. 指挥信息系统与技术 2020(02)
    • [4].多神经网络协作的军事领域命名实体识别[J]. 清华大学学报(自然科学版) 2020(08)
    • [5].在线中文命名实体识别平台研究[J]. 江苏科技信息 2020(15)
    • [6].基于机器阅读理解的中文命名实体识别方法[J]. 模式识别与人工智能 2020(07)
    • [7].命名实体识别研究综述[J]. 情报学报 2018(03)
    • [8].面向中文微博命名实体识别的对比研究[J]. 湖北民族学院学报(自然科学版) 2017(01)
    • [9].基于词典匹配的蒙古文命名实体识别研究[J]. 中央民族大学学报(哲学社会科学版) 2017(03)
    • [10].中文在线健康社区中的医疗命名实体识别方法研究[J]. 信息系统学报 2017(02)
    • [11].桥梁检测领域命名实体识别[J]. 数字技术与应用 2020(01)
    • [12].基于迁移学习的维吾尔语命名实体识别[J]. 东北师大学报(自然科学版) 2020(02)
    • [13].用于社交媒体的中文命名实体识别[J]. 中文信息学报 2020(08)
    • [14].一种面向时政新闻的命名实体识别方法[J]. 北京信息科技大学学报(自然科学版) 2018(06)
    • [15].命名实体识别方法研究进展[J]. 现代计算机(专业版) 2018(35)
    • [16].基于多注意力的中文命名实体识别[J]. 信息与电脑(理论版) 2019(09)
    • [17].中文命名实体识别模型对比分析[J]. 现代计算机 2019(14)
    • [18].基于注意力机制的命名实体识别模型研究——以军事文本为例[J]. 计算机科学 2019(S1)
    • [19].基于深度学习的军事命名实体识别方法[J]. 装甲兵工程学院学报 2018(04)
    • [20].基于深度学习的医疗命名实体识别[J]. 计算技术与自动化 2017(01)
    • [21].命名实体识别综述[J]. 现代计算机(专业版) 2016(03)
    • [22].基于本体的产品命名实体识别研究[J]. 武汉理工大学学报(信息与管理工程版) 2011(06)
    • [23].藏语命名实体识别研究[J]. 西北民族大学学报(自然科学版) 2010(03)
    • [24].基于条件随机域的生物命名实体识别[J]. 计算机工程 2009(22)
    • [25].基于最大熵模型的中文命名实体识别研究[J]. 科技信息(学术研究) 2008(30)
    • [26].基于准循环神经网络的中文命名实体识别[J]. 计算机工程与设计 2020(07)
    • [27].融合空洞卷积神经网络与层次注意力机制的中文命名实体识别[J]. 中文信息学报 2020(08)
    • [28].反馈式K近邻语义迁移学习的领域命名实体识别[J]. 智能系统学报 2019(04)
    • [29].基于深度学习的作战文书命名实体识别[J]. 指挥控制与仿真 2019(04)
    • [30].基于Attention-BiLSTM的中文命名实体识别[J]. 湖南工业大学学报 2019(05)

    标签:;  ;  ;  ;  

    基于深度学习的植物知识图谱的构建
    下载Doc文档

    猜你喜欢