面向稀疏数据集的聚类算法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP301.6

基金项目:

四川省科技厅科技支撑项目(18ZDYF3256)、四川省教育厅科研资助项目(18ZB0126).


Clustering Algorithm for Sparse Data Set
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在聚类过程中数据可能呈现稀疏性,如果仍用传统的欧式距离作为聚类指标,那么聚类的质量和效率将会受到严重的影响。受到信息论中KL散度的启发,本论文采用基于KL散度的相似性度量方法,先描述数据的整体分布,进而对数据进行聚类。这种方法可以利用簇中元素提供的信息来度量不同簇之间的相互关系,克传统欧式距离的缺点,提升算法准确度。最后通过一个实验验证本算法的有效性。

    Abstract:

    [Abstract] Data may be sparse in clustering process. If the traditional Euclidean distance is still used as clustering index, the quality and efficiency of clustering will be seriously affected. Inspired by KL divergence in information theory, similarity measurement method based on KL divergence is used in this paper to describe the overall dis-tribution of data, and then cluster the data. The information provided by the elements can be used in the cluster to measure the relationship between different clusters, overcome the shortcomings of traditional Euclidean distance and improve the accuracy of the algorithm. Finally, an experiment is carried out to verify the effectiveness of the algorithm.

    参考文献
    相似文献
    引证文献
引用本文

赵玉明,舒红平,魏培阳,等. 面向稀疏数据集的聚类算法[J]. 科学技术与工程, 2020, 20(2): 659-663.
Zhao Yuming, Shu Hongping, Wei Peiyang, et al. Clustering Algorithm for Sparse Data Set[J]. Science Technology and Engineering,2020,20(2):659-663.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-02-20
  • 最后修改日期:2019-06-10
  • 录用日期:2019-05-05
  • 在线发布日期: 2020-04-16
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注