Canopy和K-means聚类算法在公交IC卡数据分析中的应用研究

Canopy和K-means聚类算法在公交IC卡数据分析中的应用研究

论文摘要

通过收集南通市市区公交线路名称和站点名称,在不依赖GPS定位数据的基础上,采用Canopy和K-means聚类算法分析乘客上车时间序列,从而建立乘客上车站点的理论模型,并在Hadoop平台上用MapReduce框架实现算法的并行化。最后,以南通公交IC刷卡记录为例,用Canopy算法和K-means算法对IC卡刷卡记录进行分析。实验表明,在Hadoop平台,用Canopy和K-means算法分析公交IC卡数据运行稳定、可靠,具有很好的聚类效果。

论文目录

  • 1 国内外关于公交IC卡的研究
  • 2 数据预处理
  • 3 聚类算法
  •   3.1 K-means算法
  •   3.2 Canopy算法
  •   3.3 K-means和Canopy算法在Hadoop平台下的实现过程
  •   3.4 乘客上车站点判断
  • 4 实验结果
  •   4.1 实验环境
  •   4.2 实验结果
  • 5 结语
  • 文章来源

    类型: 期刊论文

    作者: 杨健兵

    关键词: 聚类

    来源: 无线互联科技 2019年11期

    年度: 2019

    分类: 信息科技,工程科技Ⅱ辑

    专业: 公路与水路运输,计算机软件及计算机应用

    单位: 南通科技职业学院

    基金: 南通市科技资助项目,项目名称:BP神经网络技术在智能公交IC卡中的应用研究,项目编号:MS12017026-4

    分类号: TP311.13;U495

    页码: 125-128

    总页数: 4

    文件大小: 1573K

    下载量: 117

    相关论文文献

    标签:;  

    Canopy和K-means聚类算法在公交IC卡数据分析中的应用研究
    下载Doc文档

    猜你喜欢