基于改进蜻蜓算法的生物医学数据特征选择方法研究

基于改进蜻蜓算法的生物医学数据特征选择方法研究

论文摘要

随着人类社会的不断进步,生命健康逐渐成为了人类生存发展的重要需求。而各种类型的疾病是影响人类生命健康的首要因素。随着基因组测序技术的日渐完善,大量有价值数据被积累下来。对这些数据的有效挖掘与分析,可有效推动临床诊断工作的进一步发展。基因表达数据通常拥有少量的数据样本,但却包含着大量的冗余信息。面对如此大规模数据,不仅医疗人员很难在短时间内对数据进行有效分析,即使通过数据分析算法对数据进行处理,过多冗余信息也容易导致算法产生过度拟合,从而误导医疗人员的诊断。特征选择方法作为数据预处理的有效方法,被广泛应用到医学数据的处理工作当中。作为一种高效的数据降维技术,特征选择在医学领域获得了广泛关注,已被成功的应用到疾病数据诊断工作当中。其中,基于Wrapper的特征选择方法因为具有更高的分类精度和灵活性成为了研究的热点内容。该方法的性能主要受到搜索算法的影响,不同的搜索算法对结果的影响也有所不同。蜻蜓算法作为一种新兴的搜索算法,已经被广泛应用到参数优化、全局寻优等问题当中。本文对蜻蜓算法的特征选择策略进行了改进,并将其应用到帕金森、肺癌、白血病等疾病数据的预测诊断工作当中,主要研究成果如下:(1)提出了一种基于改进蜻蜓算法的帕金森疾病特征选择策略。针对目前已经累积的帕金森疾病的相关数据,本文提出了一种基于改进蜻蜓算法(Improve Binary Dragonfly Algorithm,IBDA)的特征选择策略。通过该方法对帕金森数据的特征进行分析和筛选,有助于对潜在帕金森病人的快速诊断和治疗。该方法首先利用DE算法对Logical回归序列产生的初始种群进行更新,选取最佳个体作为BDA更新的初始种群,通过BDA算法的平行、聚合、分离、觅食和避敌五种行为来进一步求解。此外,在迭代过程中采取精英策略来保持种群的优良性,利用Levy飞行避免求解陷入局部最优。实验数据来自UCI上公开的帕金森数据集,并从多个指标比较了IBDA、WOA、BALO和GA等其他特征选择算法的性能,实验结果表明提出的IBDA算法在帕金森疾病特征选择上具有更好的性能。(2)提出了一种基于优化蜻蜓算法的高维疾病数据特征选择策略。高维疾病数据的冗余问题一直是医疗诊断工作中亟待解决的重要问题之一,但通过特征选择技术可有效处理该问题。本文主要针对白血病、肺癌等高危疾病进行特征选择操作,通过选取有效的疾病特征来帮助医疗人员进行早期的诊断工作。该方法主要在蜻蜓算法的基础上加入精英策略保证最优解传递的同时,又加入了模拟退火算法,有效提高了算法的收敛速度和预测精度,增强了算法的搜索性能。本次实验将该方法与一些经典的方法,如信息增益、卡方检测、Relief、GA算法和MPSO算法分别进行了大量的比较实验,实验结果表明,该方法在高维数据处理工作中具有一定的参考意义。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  •   1.1 课题研究背景和意义
  •   1.2 国内外相关研究现状
  •     1.2.1 特征选择
  •     1.2.2 智能算法
  •   1.3 本文主要工作
  •   1.4 本文章节安排
  • 2 相关研究
  •   2.1 特征选择
  •     2.1.1 特征子集搜索
  •     2.1.2 特征子集评价
  •   2.2 特征选择方法分类
  •     2.2.1 过滤式
  •     2.2.2 封装式
  •     2.2.3 嵌入式
  • 3 基于改进蜻蜓算法的帕金森疾病特征选择方法研究
  •   3.1 引言
  •   3.2 蜻蜓算法基本原理
  •     3.2.1 蜻蜓算法的来源及基本概念
  •     3.2.2 二进制蜻蜓算法的基本流程
  •   3.3 基于改进蜻蜓算法的帕金森疾病特征选择
  •     3.3.1 初始化
  •     3.3.2 目标函数计算
  •     3.3.3 搜索机制
  •   3.4 实验结果与分析
  •     3.4.1 帕金森数据集描述
  •     3.4.2 评价指标
  •     3.4.3 结果分析
  •   3.5 本章小结
  • 4 基于改进蜻蜓算法的高维疾病数据的特征选择方法研究
  •   4.1 引言
  •   4.2 基于改进蜻蜓算法的高维疾病数据的特征选择
  •     4.2.1 初始化
  •     4.2.2 目标函数计算
  •     4.2.3 搜索机制
  •   4.3 实验结果与分析
  •     4.3.1 数据描述
  •     4.3.2 参数设置
  •     4.3.3 结果分析
  •   4.4 本章小结
  • 5 总结和展望
  •   5.1 总结
  •   5.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间的科研成果
  • 文章来源

    类型: 硕士论文

    作者: 郑金格

    导师: 阎朝坤

    关键词: 特征选择,二进制蜻蜓算法,飞行,差分进化算法,模拟退火

    来源: 河南大学

    年度: 2019

    分类: 基础科学,医药卫生科技,信息科技

    专业: 生物学,生物医学工程,自动化技术

    单位: 河南大学

    分类号: R318;TP18

    总页数: 72

    文件大小: 2805K

    下载量: 139

    相关论文文献

    • [1].基于进化计算的特征选择方法研究概述[J]. 郑州大学学报(工学版) 2020(01)
    • [2].基于众包学习的交互式特征选择方法[J]. 中国科学:信息科学 2020(06)
    • [3].信用评级模型的特征选择方法研究[J]. 数学的实践与认识 2020(13)
    • [4].一种融合蚁群算法和随机森林的特征选择方法[J]. 计算机科学 2019(S2)
    • [5].采用机器学习的聚类模型特征选择方法比较[J]. 华侨大学学报(自然科学版) 2017(01)
    • [6].基于局部判别约束的半监督特征选择方法[J]. 模式识别与人工智能 2017(01)
    • [7].基于联合表示值的特征选择方法[J]. 南京邮电大学学报(自然科学版) 2017(01)
    • [8].面向跨领域情感分类的特征选择方法[J]. 模式识别与人工智能 2013(11)
    • [9].面向二类区分能力的干扰熵特征选择方法[J]. 计算机应用 2020(03)
    • [10].基于最大信息系数与冗余分摊的特征选择方法[J]. 计算机工程 2020(08)
    • [11].网络异常流量特征选择方法研究[J]. 新乡学院学报 2020(09)
    • [12].面向多类不均衡网络流量的特征选择方法[J]. 计算机应用研究 2017(02)
    • [13].混合自适应引力搜索优化的特征选择方法[J]. 计算机工程与应用 2017(12)
    • [14].一种新的有监督特征选择方法[J]. 陕西理工大学学报(自然科学版) 2017(04)
    • [15].基于概率分布的硬件木马检测特征选择方法[J]. 火力与指挥控制 2017(09)
    • [16].基于稀疏图表示的特征选择方法研究[J]. 计算机工程与科学 2015(12)
    • [17].网页分类中特征选择方法的研究[J]. 电子设计工程 2016(05)
    • [18].基于加权式特征选择方法的分子筛定向合成预测[J]. 化工管理 2013(24)
    • [19].面向排序学习的锦标赛排序特征选择方法[J]. 计算机技术与发展 2014(02)
    • [20].特征选择方法综述[J]. 控制与决策 2012(02)
    • [21].一种面向非平衡数据的邻居词特征选择方法[J]. 小型微型计算机系统 2008(12)
    • [22].文本聚类中的特征选择方法[J]. 吉首大学学报(自然科学版) 2008(02)
    • [23].段落及类别分布的特征选择方法[J]. 小型微型计算机系统 2018(01)
    • [24].基于多种相关性度量的特征选择方法研究[J]. 小型微型计算机系统 2017(04)
    • [25].面向函数型数据的快速特征选择方法[J]. 模式识别与人工智能 2017(09)
    • [26].基于二进制烟花算法的特征选择方法[J]. 情报学报 2017(03)
    • [27].基于分布偏斜训练集的特征选择方法研究[J]. 情报理论与实践 2015(04)
    • [28].联合多流形结构和自表示的特征选择方法[J]. 计算机科学 2020(S2)
    • [29].一种基于权重的文本特征选择方法[J]. 计算机科学 2012(07)
    • [30].基于特征贡献度的特征选择方法在文本分类中应用[J]. 大连理工大学学报 2011(04)

    标签:;  ;  ;  ;  ;  

    基于改进蜻蜓算法的生物医学数据特征选择方法研究
    下载Doc文档

    猜你喜欢