基于多语义文本表示的自适应模糊聚类算法
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP301.6

基金项目:

国家市场监督管理总局技术保障专项项目(2021YJ005) 浙江省教育厅科研项目(Y201738417)


Adaptive fuzzy clustering algorithm based on multi-semantic text representation
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    由于词语的多语义问题和传统的文本表示与聚类过程相互独立的问题,导致文本聚类准确率较低。针对上述问题提出一种基于多语义文本表示的自适应模糊C-均值(Multi-semanticSrepresentationSbasedSadaptiveSfuzzySC-means, MSR-AFCM)聚类算法。通过将词语软聚类划分成多个词簇构建多个语义空间,将语义空间个数作为文本初始聚类数目,利用词语的语义隶属度计算每个文本属于文本空间的语义隶属度,并以此为对隶属度进行初始化。在算法运行过程中,根据更新的文本语义隶属度和文本分布状况,逐步剔除冗余的文本空间,以达到优化聚类数目的目标。实验结果表明,MSR-AFCM算法相较于传统的聚类算法有更高的准确率和兰德系数,验证了算法的有效性。

    Abstract:

    STheSmulti-semanticSproblemSofSwords,StogetherSwithStheSproblemSofSindependenceSbetweenStheStraditionalStextSrepresentationSandStheSclusteringSprocess,SleadsStoStheSlowSPrecisionSofStextSclustering.STo solve the above problems,SaSmulti-semanticrepresentationSbasedSadaptiveSfuzzySC-meansS(MSR-AFCM)SclusteringSalgorithmSisSproposed.SToSbeSspecific,SmultipleSsemanticSspacesSareSconstructedSbySdividingStheSsoftSclusteringSofSwordsSintoSseveralSwordSclusters.SThen,StheSnumberSofStheSsemanticSspacesSisStakenSasStheSinitialSnumberSofStextSclustering.SNext,StheSsemanticSmembershipSdegreeSofSeachStextSbelongingStoStheStextSspaceSisScalculatedSbySutilizingStheSsemanticSmembershipSdegreeSofStheSwords,SandSthenStheSmembershipSdegreeSisSinitializedSaccordingly.SDuringStheSrunningSofStheSalgorithm,StheSredundantStextSspacesSareSgraduallySeliminatedSbasedSonStheSupdatedStextSsemanticSmembershipSdegreeSandStextSdistribution,SsoSasStoSachieveStheSgoalSofSoptimizingStheSnumberSofStextSclustering.STheSexperimentalSresultsSshowSthatSMSR-AFCMSalgorithmSshowsShigherSPrecisionSandSRand indexScomparedSwithStraditionalSclusteringSalgorithm,SwhichSverifiesStheSeffectivenessSofSthisSalgorithm.

    参考文献
    相似文献
    引证文献
引用本文

刘雅萱,武娇,顾兴全,等. 基于多语义文本表示的自适应模糊聚类算法[J]. 科学技术与工程, 2023, 23(11): 4709-4717.
Liu Yaxuan, Wu Jiao, Gu Xingquan, et al. Adaptive fuzzy clustering algorithm based on multi-semantic text representation[J]. Science Technology and Engineering,2023,23(11):4709-4717.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-08-07
  • 最后修改日期:2023-03-30
  • 录用日期:2022-12-02
  • 在线发布日期: 2023-05-10
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注