基于概念树的主题爬取技术研究
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP393.03

基金项目:

教育部科研基金(200146)资助


Research on Focused Crawling Technology Based on the Concept Tree
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出了一种新型主题爬取方法。采用概念树构造主题层次图,赋予待爬取URL对象以层次语义信息,按照语义相关性与重要性选择待爬取URL对象,搜索属于特定语义相关主题的重要Web文档的WWW子集。

    Abstract:

    A new method of focused crawling is presented. A diagram of topic levels is built using the concept tree. URL objects to be crawled are endowed with semantic information about topic levels by the diagram and selected according to the semantic relevance and importance. It searches only the important subset of the WWW that pertains to a specific topic of semantic relevance

    参考文献
    相似文献
    引证文献
引用本文

曾义聪 杨贯中 刘柯. 基于概念树的主题爬取技术研究[J]. 科学技术与工程, 2005, (12): 785-790796.
ZENG Yicong, YANG Guanzhong, LIU Ke. Research on Focused Crawling Technology Based on the Concept Tree[J]. Science Technology and Engineering,2005,(12):785-790796.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注