多分类器组合论文_邓立

导读:本文包含了多分类器组合论文开题报告文献综述、选题提纲参考文献及外文文献翻译,主要关键词:组合,网页,算法,邻域,参量,特征,阈值。

多分类器组合论文文献综述

邓立[1](2019)在《基于多特征和组合分类器的网页分类》一文中研究指出网络上有着丰富的信息资源,并且随着时间的推移,网上的信息量爆炸式地增长。网页的分类有助于网页信息检索和管理,如开发和维护网页目录、改进搜索引擎质量、过滤网页内容等。网页是一种半结构化的数据,不同网页的内容和结构不太一样,且网页上有广告、版权声明等信息,这给网页的分类带来了挑战。本文研究网页分类方法,以提高网页分类的性能。首先,提出一种融合文本和结构特征的网页分类方法。采用树状分布的HTML标签表示网页的结构,遍历HTML标签构建向量表示网页结构特征。通过向量转化工具word2vec将<title>、<meta>等关键标签中的文本转化为向量表示文本特征,将文本特征和结构特征两种不同的特征以向量的形式融合起来,对网页进行分类。实验结果表明,融合文本和结构特征的网页分类方法更加全面和有效,取得了比单一特征更好的分类效果。其次,提出一种基于置信度的组合分类器的方法,然后基于文本和结构特征的融合以及分类器的组合构建网页分类系统。不同分类器有不同的特点,多个分类器的组合可以实现分类器性能的互补。我们计算一组样本的分类准确率作为相应分类结果的置信度,接着基于置信度采用投票、比较大小等决策策略,组合多个子分类器,得出组合分类器的分类结果。基于特征融合和分类器组合的网页分类系统包括数据采集与处理模块、特征提取与向量化模块、子分类器分类模块和组合分类模块。在Amazon数据集、7-web-genres数据集、DMOZ数据集中进行实验,网页分类的准确率分别达到94.2%、95.4%、95.7%,提出的网页分类方法相比同类网页分类方法准确率更高。第叁,提出一种移动端网页的分类方法。移动端设备小屏、竖屏的设计使得移动端网页呈现列表式的简单结构,网页内容多以信息流的形式出现,重要的信息出现在前面。针对移动端网页的这些特征,我们提出采用信息流定位的算法,提取主旨信息、头部信息和信息流信息进行分类。采集移动端网页进行实验,结果表明,我们提出的移动端网页分类方法准确率达到97.2%。(本文来源于《浙江大学》期刊2019-07-01)

吴挡平,张忠林,曹婷婷[2](2019)在《基于Stacking策略的稳定性分类器组合模型研究》一文中研究指出针对Bagging、AdaBoost等通用的集成算法对于稳定性分类算法集成效果不是很好的问题,提出了基于Stacking策略的稳定性分类器组合算法.该算法通过构造一个两层的迭加式框架结构,融合数据降维技术处理两层分类器的输入特征,对4种稳定性分类器(LDA、GLM、SVM、KNN)进行组合学习.利用UCI数据集测试算法的性能.实验结果表明:相比一些集成算法(RF、Bagging、C50、AdaBoost),基于Stacking策略稳定性分类器组合模型可以获得更高的分类准确率.同时也为二分类的分类模型提供了一个可行的参考方法.(本文来源于《小型微型计算机系统》期刊2019年05期)

陈汤,崔玉莲,冯辅周,吴春志[3](2019)在《基于多组合分类器的汽车变速箱故障诊断》一文中研究指出针对于汽车变速箱故障特征信号微弱,且难以对故障类型识别问题,提出了基于多组合分类器的故障诊断方法。首先该方法将原始振动信号采用经验模态分解(Empirical Mode Decomposition,EMD)、变分模态分解(Variational Mode Decomposition,VMD)以及提升小波变换(Lifting Wavelet Transform,LWT)进行分解得到多个分量信号,再在对每个分量信号求取特征参量组成特征向量集,输入到K近邻分类器(k-Nearest Neighbor,kNN)、逻辑回归分类器(Logical Regression Multi-Classification,LRMC)以及随机森林分类器(Random Forest,RF)中,以此判断故障类型。最后经过汽车变速箱故障模拟试验台的数据验证,经过分类器性能评价指标验证,基于LWT-RF模型的故障诊断方法具有最高的准确率、精确率、F1-score。(本文来源于《时代汽车》期刊2019年07期)

王怀警,谭炳香,王晓慧,房秀凤,李世明[4](2019)在《多分类器组合森林类型精细分类》一文中研究指出针对高光谱遥感数据树种识别精度不高,现有多分类器组合策略难以避免人为因素干扰的问题,利用自适应权值模型组合2种机器学习算法,有效改善森林类型精细识别精度。研究综合利用影像的光谱和纹理特征、地形特征及森林类型外业调查样本数据,采用分层分类的策略,分别利用支撑向量机(support vector machine,SVM)和随机森林算法(random forest classifier,RFC)对森林类型进行精细识别;为进一步提高森林类型识别精度,采用自适应权值组合模型综合2种分类器,并采用分层随机抽样的独立检验样本进行精度验证。结果表明,自适应权值组合模型可综合不同分类器的优势,避免人为因素干扰且提高识别精度和稳定性,对高分五号(GF-5)星载高光谱遥感数据应用具有借鉴意义和参考价值。(本文来源于《遥感信息》期刊2019年02期)

盛雅兰[5](2019)在《基于组合分类器的肾病风险预测的应用研究》一文中研究指出在中国特色社会主义新时代,提高人们的生活水平、保障人民就医便捷和增长人均寿命时间的关键不仅在于医疗队伍的强大还在于医疗技术的发展与创新。研究一个可靠实用且性能良好的肾病风险预测系统,对疾病的早期预防控制的具有十分现实的意义。风险预测是一个较为复杂的决策性过程,在单分类器预测性能不够好的基础上,选择用组合分类器的方法进行风险预测。组合分类器能有效的提高风险预测系统的应用泛化能力,近几年也得到了众多学者们的广泛关注。在收集了近12806条肾病原始数据,经过数据预处理和数据规范后,共选取了10000条有效数据,建立了肾病风险预测数据库的基础上。应用支持向量机算法(SVM)、BP神经网络分类算法(BP)、决策树分类算法(C4.5)、贝叶斯分类算法(Bayes)等四个单分类器算法的建模研究后,利用Adaboost、Bagging、Stacking等组合分类器的算法对数据进行进一步的分类预测。证实了在肾病数据基础上,组合分类器的性能要比单个分类器的性能好。所做主要工作如下:1、介绍了肾病风险预测的产生的背景、实用价值和应用前景,研究了肾病风险预测在国内外研究现状和主要研究内容。2、研究了机器学习的主要方法,主要有支持向量机分类算法、C4.5决策树分类算法、朴素贝叶斯分类算法、BP神经网络分类算法、Adaboost算法、Bagging算法、Stacking算法,分别对算法概念、算法原理、算法步骤和典型应用进行了阐述。3、对收集的肾病数据进行清洗、特征选取、特征降维、对肾病检查值的单位及取值范围进行规范。建设肾病风险预测系统,具备对数据的基本操作功能和模型建立与风险预测功能。4、对模型进行对比评价,通过风险预测系统结果分析,验证已有的肾病风险预测理论,探索发现新的肾病风险预测结论,指导进一步实验研究和临床诊疗。(本文来源于《南京中医药大学》期刊2019-03-21)

曹书豪,许成哲[6](2019)在《基于分类器组合的心电信号身份识别算法研究》一文中研究指出本文针对基于分类器组合的ECG信号进行了身份识别算法的研究,通过无基准点的方法来提取QRS波形,HOAC、DWT、PCA特征提取和分类器组合算法相结合的方法,该算法对身份识别的准确率进行提高。通过对比实验得出,在组合规则中,中值规则和乘法组合形式的分类器的效果最好,相比通过单一特征提取的分类效果更好,分类的错误率也较比同类论文有了一定程度上的降低。实验验证,本文研究的的号身份识别算法分类识别精度高,而且实现更加容易,为今后基于ECG身份识别的研究提供了良好的支持。(本文来源于《山东工业技术》期刊2019年06期)

余华,叶超[7](2019)在《基于SVM和GMM组合分类器的谎言识别方法》一文中研究指出对于执法机关和其他的政府机构来说,谎言检测正变得不可缺少。运用哥伦比亚语音数据库,通过机器学习的方法区分谎言和真话。我们通过对语音特征时域和频域的划分,提出SVM组合分类器的方法,并与单个分类器进行对比试验。结果表明组合分类器的识别率较单个提升了2%。同时,在跨性别的谎言检测实验中分类器也表现出了较好的识别率。(本文来源于《电子器件》期刊2019年01期)

李静,刘潇,王效俐[8](2019)在《邻域粗糙集融合网格搜索组合分类器的理财决策知识获取研究》一文中研究指出【目的】为提高金融机构理财决策知识获取的效率和有效性,提出邻域粗糙集融合网格搜索组合分类器的理财决策知识获取模型。【方法】建立理财决策知识获取系统框架,采用邻域粗糙集方法对决策系统进行知识约简,采用SMOTE过采样方法消除数据的不平衡性,采用网格搜索方法搜索组合分类器的最优参数。通过模型的训练和测试,对约简组合进行评估和优选,选出最佳约简;最后,通过约简获取决策系统的规则知识,存入组织知识库,完成知识获取。【结果】采用4521条真实理财数据进行实证分析,测试集购买类样本准确率(Sensitivity)达到83.55%,未购买类样本准确率(Specificity)达到80.74%, AUC值达到0.8214。【局限】未针对保险、消费贷款等其他类型的营销数据进行验证。【结论】邻域粗糙集融合网格搜索组合分类器的分类模型能够有效提高理财决策系统的整体分类能力,识别和获取关键客户知识,提高金融机构理财产品决策的效益和效率。(本文来源于《数据分析与知识发现》期刊2019年01期)

李涛,张景肖[9](2019)在《基于BT-SVM模型组合的动态加权多分类算法研究》一文中研究指出在AI领域中,备受关注的一个问题是如何获得更好的分类,尤其是对于多分类的情形。目前,针对多分类算法已取得了大量的研究成果,很多较为高效的多分类算法也已应用到实践中,而对于多分类算法的研究仍然备受关注。以BT-SVM为基分类器,提出一种带阈值的新型动态加权多分类器集成的方法,并通过模拟和实证分析验证该算法的有效性,研究表明该算法对于平衡和非平衡数据的分类效果表现得都比较优良。(本文来源于《统计与信息论坛》期刊2019年01期)

王迪,万鲁河,陈烁[10](2018)在《基于多分类器组合的湿地类型信息提取》一文中研究指出针对如何提高遥感影像分类精度等问题,该文选取覆盖友好自然保护区的Landsat_5TM遥感影像为数据源,提出了将多个分类器进行组合的遥感影像分类方法.该方法将熵权法引入到湿地遥感分类研究中,选取最大似然、支持向量机(SVM)、神经网络(NN) 3种分类器作为子分类器,利用熵权法确定组合分类器的组合规则,采用多分类器组合的方法对友好自然保护区进行湿地类型信息提取,以提高湿地的分类精度.结果表明:与单一分类器相比,多分类器组合的遥感影像分类方法能够有效的提高分类精度.(本文来源于《哈尔滨师范大学自然科学学报》期刊2018年05期)

多分类器组合论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对Bagging、AdaBoost等通用的集成算法对于稳定性分类算法集成效果不是很好的问题,提出了基于Stacking策略的稳定性分类器组合算法.该算法通过构造一个两层的迭加式框架结构,融合数据降维技术处理两层分类器的输入特征,对4种稳定性分类器(LDA、GLM、SVM、KNN)进行组合学习.利用UCI数据集测试算法的性能.实验结果表明:相比一些集成算法(RF、Bagging、C50、AdaBoost),基于Stacking策略稳定性分类器组合模型可以获得更高的分类准确率.同时也为二分类的分类模型提供了一个可行的参考方法.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多分类器组合论文参考文献

[1].邓立.基于多特征和组合分类器的网页分类[D].浙江大学.2019

[2].吴挡平,张忠林,曹婷婷.基于Stacking策略的稳定性分类器组合模型研究[J].小型微型计算机系统.2019

[3].陈汤,崔玉莲,冯辅周,吴春志.基于多组合分类器的汽车变速箱故障诊断[J].时代汽车.2019

[4].王怀警,谭炳香,王晓慧,房秀凤,李世明.多分类器组合森林类型精细分类[J].遥感信息.2019

[5].盛雅兰.基于组合分类器的肾病风险预测的应用研究[D].南京中医药大学.2019

[6].曹书豪,许成哲.基于分类器组合的心电信号身份识别算法研究[J].山东工业技术.2019

[7].余华,叶超.基于SVM和GMM组合分类器的谎言识别方法[J].电子器件.2019

[8].李静,刘潇,王效俐.邻域粗糙集融合网格搜索组合分类器的理财决策知识获取研究[J].数据分析与知识发现.2019

[9].李涛,张景肖.基于BT-SVM模型组合的动态加权多分类算法研究[J].统计与信息论坛.2019

[10].王迪,万鲁河,陈烁.基于多分类器组合的湿地类型信息提取[J].哈尔滨师范大学自然科学学报.2018

论文知识图

模糊积分的多分类器组合模型多分类器组合方法界面多层多分类器组合示意图一5多分类器组合系统流程图多分类器组合词性标注方法系统...一1多分类器组合界面

标签:;  ;  ;  ;  ;  ;  ;  

多分类器组合论文_邓立
下载Doc文档

猜你喜欢