改进的PrefixSpan算法在Web挖掘中的应用
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP391

基金项目:

广东省自然科学基金项目(5006102)


Application of Improved PrefixSpan Algorithm in Web Mining
Author:
Affiliation:

Fund Project:

Natural Science Foundation of Guangdong Province(5006102)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对PrefixSpan算法不足,本文采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘。

    Abstract:

    Taking account of insufficiency of PrefixSpan algorithm, which is widely applied to data mining, this paper trys to optimize the algorithm by reducing frequency of exchanging between the memory and the external memory in the Prefix part, and reducing the size of the projection database by discarding the non-frequent items which created in the process of sequence patterns mining. The result of test demonstrates that the operating efficiency is enhanced more than 35%. The conclusion comes to shows that the improved algorithm is applicable to the Web Mining.

    参考文献
    相似文献
    引证文献
引用本文

谢清森,杨天奇. 改进的PrefixSpan算法在Web挖掘中的应用[J]. 科学技术与工程, 2009, 9(23): .
XIEQINGSEN, YANG Tianqi. Application of Improved PrefixSpan Algorithm in Web Mining[J]. Science Technology and Engineering,2009,9(23).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2009-06-30
  • 最后修改日期:2009-07-01
  • 录用日期:2009-07-03
  • 在线发布日期: 2009-12-01
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注