面向不均衡数据集的在线式异质媒体网络事件发现
DOI:
作者:
作者单位:

软件学院 南阳师范学院 河南 南阳; 计算机学院 北京工业大学 多媒体与智能软件技术北京市重点实验室,南阳师范学院 计算机与信息技术学院,河南 南阳,计算机学院 北京工业大学 多媒体与智能软件技术北京市重点实验室,软件学院 南阳师范学院 河南 南阳

作者简介:

通讯作者:

中图分类号:

TP393

基金项目:

国家自然科学重点项目(613300194),河南省科技计划项目(142300410044),河南省教育厅科学技术研究重点项目(14A520057,15B520022),南阳师范学院校级项目(QN2015025)


Heterogeneous Media Online Web Event Detection For Imbalanced Datasets
Author:
Affiliation:

Beijing Municipal Key Laboratory of Multimedia and Intelligent Software Technology,College of software,Nanyang normal University,Henan Nanyang

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着互联网的发展,网络数据呈现出异质数据多、文本标签化、数据不均衡等特点,这使得传统的基于长文本在线式网络事件的方法逐渐失效。本文采用改进的Single Pass方法进行在线式异质媒体网络事件发现:首先,通过分析网络数据中的不均衡性,重新设计相似度计算公式;其次,设计滑动时间窗口来提高Single Pass的算法效率。最后我们在Flickr的SED2014数据集上开展实验,实验结果表明,本文提出的算法具有有效性和实用性。

    Abstract:

    With the development of Internet, the web data has present the characteristics of heterogeneous, text tagging and imbalanced data, which leads to the failure of the traditional online event detection method based on long text. In this paper, we adopt the improved Single Pass Algorithm to detect online heterogeneous media web events. On one hand, we redesign the similarity calculation formula based on the imbalanced data. On the other hand, we design the slice-windows to improve single pass algorithm runtime. The result on SED2014 dataset shows the effectiveness and practicality of our algorithm.

    参考文献
    相似文献
    引证文献
引用本文

赵学武,张新刚,柴鹰,等. 面向不均衡数据集的在线式异质媒体网络事件发现[J]. 科学技术与工程, 2016, 16(16): .
ZHAO Xue-wu,张新刚,CHAI Ying, et al. Heterogeneous Media Online Web Event Detection For Imbalanced Datasets[J]. Science Technology and Engineering,2016,16(16).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-01-11
  • 最后修改日期:2016-05-27
  • 录用日期:2016-03-18
  • 在线发布日期: 2016-06-15
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注