基于多径向基神经网络的多任务优化研究

基于多径向基神经网络的多任务优化研究

论文摘要

目前在利用贝叶斯优化框架解决昂贵优化问题(即适应度估计计算成本特别高的问题)时,最常用的代理模型就是高斯过程模型,主要是因为它能够提供适应度值的估计(目标函数值的预测平均值)以及不确定性的估计(目标函数值的预测方差)。然而,当训练样本的数量增加时,高斯过程中协方差矩阵的计算量会变得非常大(()3O N,N为训练数据数量),用于构造高斯过程的计算时间可能变得过长。另一方面,通过在不同任务之间共享信息,同时学习多个存在相关性的任务可以避免每个任务从头开始学习,且利用任务之间的相关信息可以促使每个任务更好的学习数据特征。因此,多任务学习的研究非常具有意义。然而,现有的多任务学习方法大多都是通对网络的损失函数添加约束项来对网络中的权值进行约束处理,并使用该约束项来表示任务之间各种可能的关系,所以,各个任务的网络结构并没有改变。本文通过分析现有的多任务学习网络结构,将多个任务的网络联合起来进行学习,通过在网络中增加相关性层,提出了两种新型的多任务学习网络结构。论文的主要工作有以下几点:(1)研究了径向基函数(Radial basic function,RBF)神经网络,并根据其局部逼近特性和学习速度快等特点将其应用于贝叶斯优化框架,取代常用的高斯过程模型,从而避免高斯模型中复杂的协方差函数计算问题。(2)本文提出了基于RBF的多任务学习网络模型,并将提出的多任务RBF网络模型应用于贝叶斯优化框架。相较于传统多任务学习网络,我们提出的网络模型包含相关性学习层。通过采集函数在每一次迭代中根据不同的任务选择出一些新的候选点,并根据不同模型的数据集特性,选择性的对候选点进行评估,快速扩展训练集的数据量,数据量的增加将更有利于模型的训练。(3)针对于不同的应用,提出了两种多任务学习结构,一种是单输入多输出的多任务RBF学习网络(The multi-task learning network with single-input-multiple-output based on radial basic function,SIMO-MT-RBF),另一种是多输入多输出的多任务RBF学习网络(The multi-task learning network with multi-input-multiple-output based on radial basic function,MIMO-MT-RBF)模式,其中,对于MIMO-MT-RBF网络模型,我们提出了两种不同的训练方式。(4)在多个基准问题上对提出的多任务学习模型进行实验,与基于单任务学习模型的贝叶斯优化算法,以及基于高斯过程的贝叶斯优化算法进行实验对比,在几种情况下的实验研究都表明,我们所提出多任务学习框架能获得更好的性能表现。(5)将提出的算法应用于复杂神经网络超参数优化问题,并与基于单任务学习的贝叶斯优化算法的结果进行比较,实验结果表明本文提出的多任务学习网络模型能够让多个任务之间的信息共享,并且可以学习到任务之间的相关性,从而找到使神经网络准确率较高的超参数组合。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  •   1.1 研究背景和意义
  •   1.2 研究现状
  •     1.2.1 多任务学习研究现状
  •     1.2.2 贝叶斯优化研究现状
  •     1.2.3 RBF神经网络研究现状
  •   1.3 论文的主要贡献
  •   1.4 论文的结构安排
  • 第2章 相关技术概述
  •   2.1 多任务学习
  •     2.1.1 共享隐藏层的多任务学习
  •     2.1.2 基于参数软共享的多任务学习
  •   2.2 RBF神经网络
  •     2.2.1 RBF神经网络结构
  •     2.2.2 中心点的选择策略
  •   2.3 贝叶斯优化算法
  •     2.3.1 贝叶斯优化整体框架
  •     2.3.2 采集函数
  •   2.4 本章小结
  • 第3章 单输入多输出的多任务学习网络
  •   3.1 引言
  •   3.2 SIMO-MT-RBF网络
  •     3.2.1 SIMO-MT-RBF网络结构
  •     3.2.2 RBF神经网络的参数确定
  •     3.2.3 网络的训练过程
  •     3.2.4 网络的预测过程
  •   3.3 基于SIMO-MT-RBF模型的贝叶斯优化算法
  •     3.3.1 多RBF网络模型结构
  •     3.3.2 候选点的选择策略
  •     3.3.3 加点策略
  •   3.4 实验
  •     3.4.1 测试函数
  •     3.4.2 测试函数添加噪声
  •   3.5 本章小结
  • 第4章 多输入多输出的多任务学习网络
  •   4.1 引言
  •   4.2 MIMO-MT-RBF网络结构
  •   4.3 网络的训练过程
  •     4.3.1 整体更新策略
  •     4.3.2 局部更新策略
  •   4.4 网络的预测过程
  •   4.5 基于MIMO-MT-RBF模型的贝叶斯优化算法
  •     4.5.1 候选点的评估及加点策略
  •     4.5.2 算法流程图
  •   4.6 实验
  •     4.6.1 测试函数
  •     4.6.2 测试函数添加噪声
  •   4.7 本章小结
  • 第5章 超参数优化的应用
  •   5.1 超参数概念及研究现状
  •   5.2 超参数优化实验
  •   5.3 本章小结
  • 第6章 总结与展望
  •   6.1 全文工作总结
  •   6.2 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间的研究成果
  • 文章来源

    类型: 硕士论文

    作者: 陈娇

    导师: 骆剑平

    关键词: 神经网络,任务相关性,多任务学习,网络结构

    来源: 深圳大学

    年度: 2019

    分类: 基础科学,信息科技

    专业: 数学,自动化技术

    单位: 深圳大学

    分类号: O224;TP183

    DOI: 10.27321/d.cnki.gszdu.2019.000012

    总页数: 67

    文件大小: 3167K

    下载量: 36

    相关论文文献

    • [1].径向基神经网络在地铁沉降预测当中的应用[J]. 科技资讯 2017(20)
    • [2].基于改进径向基神经网络的推力补偿算法[J]. 电子工业专用设备 2020(04)
    • [3].基于模糊径向基神经网络的失眠古文献症药研究[J]. 中国医药科学 2017(23)
    • [4].基于径向基神经网络的交通出行预测[J]. 兰州交通大学学报 2018(02)
    • [5].基于粒子群优化算法的径向基神经网络[J]. 榆林学院学报 2018(04)
    • [6].共识径向基神经网络应用于近红外光谱法测定三七中总黄酮[J]. 理化检验(化学分册) 2016(06)
    • [7].基于径向基神经网络的人民币汇率预测[J]. 电脑开发与应用 2009(03)
    • [8].基于径向基神经网络的数字馆藏质量评价研究[J]. 情报理论与实践 2009(05)
    • [9].径向基神经网络的汇率预测模型研究[J]. 计算机工程与应用 2009(24)
    • [10].基于改进粒子群-径向基神经网络模型的短期电力负荷预测[J]. 电网技术 2009(17)
    • [11].基于径向基神经网络的侦察目标意图识别研究[J]. 舰船电子工程 2018(10)
    • [12].基于径向基神经网络农机数量预测的研究[J]. 中国农机化学报 2013(02)
    • [13].影响径向基神经网络分类性能的因素[J]. 吉林大学学报(信息科学版) 2009(02)
    • [14].灰色径向基神经网络技术在水文预报中的应用[J]. 东北水利水电 2016(03)
    • [15].基于径向基神经网络模型的耐压壳6σ设计[J]. 上海交通大学学报 2014(04)
    • [16].基于径向基神经网络的水饱和含氧量的数据拟合[J]. 河南教育学院学报(自然科学版) 2011(03)
    • [17].基于小波包变换和径向基神经网络技术的汽车后桥总成故障诊断研究[J]. 机械 2010(10)
    • [18].基于多尺度分割和径向基神经网络的极化SAR影像分类[J]. 测绘与空间地理信息 2019(01)
    • [19].基于径向基神经网络的污水管网堵塞诊断方法[J]. 天津科技大学学报 2019(04)
    • [20].基于径向基神经网络的机械加工自适应参数研究[J]. 现代工业经济和信息化 2017(14)
    • [21].基于多元二次径向基神经网络的偏微分求解方法[J]. 数学的实践与认识 2014(07)
    • [22].基于径向基神经网络的设备运行状态新信息加权预测模型研究[J]. 制造业自动化 2011(07)
    • [23].基于径向基神经网络的速度滤波器[J]. 计算机工程与设计 2008(04)
    • [24].记忆径向基神经网络在冷轧液压自动位置系统的优化控制[J]. 计量学报 2016(01)
    • [25].基于改进的粒子群径向基神经网络的目标识别[J]. 计算机应用 2018(S1)
    • [26].神经网络方法在医学统计预测中的应用[J]. 南京中医药大学学报(社会科学版) 2017(01)
    • [27].基于径向基神经网络的数控加工自适应加工系统研究[J]. 数字技术与应用 2017(04)
    • [28].径向基神经网络的联合作战方案评估仿真[J]. 火力与指挥控制 2013(01)
    • [29].基于径向基神经网络改进算法优化锅炉燃烧效率[J]. 计算机应用 2013(06)
    • [30].基于径向基神经网络的有限元模型修正研究[J]. 武汉科技大学学报 2011(02)

    标签:;  ;  ;  ;  

    基于多径向基神经网络的多任务优化研究
    下载Doc文档

    猜你喜欢