基于遗传算法的文本特征选择
DOI:
作者:
作者单位:

1.中国人民公安大学;2.中国人民公安大学信息技术与网络安全学院

作者简介:

通讯作者:

中图分类号:

TP391.1

基金项目:


Text Feature Selection Based on Genetic Algorithm
Author:
Affiliation:

People’s Public Security University of China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    文本特征选择是自然语言处理中的关键问题,针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法TF-IDF的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程度地贴合后续的文本分类算法,在保证文本分类精确度的同时,降低特征维度以缩减预测时间。实验显示,该算法与单一的过滤式文本特征选择算法相比,能够有效减少所选文本特征数量(即降低特征维度),能有效提高文本的分类能力。

    Abstract:

    Text feature selection is a key issue in natural language processing. Due to the high-dimensional and sparsity of text features, based on the filter feature selection algorithm TF-IDF, the genetic algorithm was used to optimize the text features. To maximize the fit of the subsequent text classification algorithm, while not effecting the accuracy of the text classification, reduce the feature dimension to reduce the prediction time. Experiments show that compared with a single filtered text feature selection algorithm, the algorithm can effectively reduce the number of selected text features (reduce the feature dimension) and effectively improve the text classification ability.

    参考文献
    相似文献
    引证文献
引用本文

刘成锴,王斌君,吴勇. 基于遗传算法的文本特征选择[J]. 科学技术与工程, 2019, 19(33): 302-307.
liuchengkai,,wuyong. Text Feature Selection Based on Genetic Algorithm[J]. Science Technology and Engineering,2019,19(33):302-307.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-04-17
  • 最后修改日期:2019-07-04
  • 录用日期:2019-07-08
  • 在线发布日期: 2019-12-06
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注