首页|期刊简介|投稿指南|分类索引|刊文选读|订阅指南|资料|样刊邮寄查询|常见问题解答|联系我们
许智宏,王怡峥,王利琴,等. 基于Hive的海量公交客流起讫点挖掘方法[J]. 科学技术与工程, 2020, 20(20): 8300-8309.
XU Zhi-hong,WANG Yi-zheng,et al.A Methodology of Massive Bus Passenger Origin-Destination Mining Based on Hive[J].Science Technology and Engineering,2020,20(20):8300-8309.
基于Hive的海量公交客流起讫点挖掘方法
A Methodology of Massive Bus Passenger Origin-Destination Mining Based on Hive
投稿时间:2019-08-29  修订日期:2020-04-17
DOI:
中文关键词:  客流  起讫点  下车站点  Hive  OD
英文关键词:passenger flow  origin-destination  alighting station  Hive  OD
基金项目:天津市科技计划项目(No.14ZCDGSF00124)、天津市自然科学基金项目(No.16JCYBJC15600)
           
作者单位
许智宏 河北工业大学 人工智能与数据科学学院
王怡峥 河北工业大学 人工智能与数据科学学院
王利琴 河北工业大学 人工智能与数据科学学院
董永峰 河北工业大学 人工智能与数据科学学院
摘要点击次数: 12
全文下载次数: 3
中文摘要:
      目前OD挖掘方法普遍存在无法并行分析多条线路、低效率、预测率不足的问题。考虑到Hive在海量数据上的查询性能优势,基于Hive实现了OD挖掘,克服了上述问题。基于时间阈值匹配上车站点,失配记录基于站点上客数再次匹配。基于表连接的出行链算法预测下车站点,预测失败的记录基于概率进行两次预测。以石家庄2018年1月1日至2018年3月27日的IC卡刷卡数据和调度数据进行OD挖掘,在清洗后的11,312,505条出行记录中挖掘出11,270,037条OD记录,预测率达到99.6%,出行与吸引校验质量较高,Hive并行调优开启后耗时17829.04s。可见该方法满足生产环境中离线挖掘OD的业务需求。
英文摘要:
      The current OD mining method has some ubiquitous problem that unable to analyze multiple lines in parallel, low efficiency, and low prediction rate. Considering the query performance advantages of Hive on massive data, OD mining based on Hive overcomes the problems above. The time threshold was used to match the boarding station, the failed matched record will be matched again base on the number of boarding passenger. Trip-chaining method base on table joining was used to match alighting station, the failed predicted record will be matched twice base on probability. The IC card consumption data and the scheduling data in Shijiazhuang city from January 1, 2018, to March 27, 2018, were used to do OD mining, 11,270,037 OD records were mined from cleaned 11,312,505 trip records. The matching rate reached 99.6%, with the high quality of travel and attraction checking results. Spend 17829.04s on running this method with Hive parallel on. The results show that the method satisfies the business requirements of offline OD mining in a production environment.
查看全文  查看/发表评论  下载PDF阅读器
关闭
你是第31637700位访问者
版权所有:科学技术与工程编辑部
主管:中国科学技术协会    主办:中国技术经济学会
Tel:(010)62118920 E-mail:stae@vip.163.com
京ICP备05035734号-4
技术支持:本系统由北京勤云科技发展有限公司设计

京公网安备 11010802029091号