一种基于粗糙集的微博文本特征选择方法
DOI:
作者:
作者单位:

湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007

作者简介:

通讯作者:

中图分类号:

TP3

基金项目:

国家自然科学基金资助项目(61170102),湖南省自然科学基金资助项目(10JJ3002),国家社科基金资助项目(12BYY045),教育部人文社会科学研究青年基金资助项目(09YJCZH019);国家自然科学基金项目(面上项目,重点项目,重大项目)


Micro Blog Text Feature Selection Based on Rough Set
Author:
Affiliation:

Institute of Computer and Communication, Hunan University of Technology,Institute of Computer and Communication, Hunan University of Technology,Institute of Computer and Communication, Hunan University of Technology

Fund Project:

The National Natural Science Foundation of China (General Program, Key Program, Major Research Plan)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    本文对中文微博中主客观分类特征的选取进行了研究,通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征,对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,本文提出的方法能达到较好的分类效果。

    Abstract:

    Abstract In this paper, the feature selection of subjective and objective classification of Chinese micro blog has been studied. For the features in Chinese micro blog, the combination of lexicon and statistics is used to extract candidate features. By this method, eight candidate features are extracted. And a feature selection algorithm based on rough sets and probability-weighted is proposed. Using the algorithm, six features are selected. The experiment result shows that these features selected by the algorithm achieve good result in subjective and objective classification of Chinese micro blog.

    参考文献
    相似文献
    引证文献
引用本文

杜锐,朱艳辉,邓程,等. 一种基于粗糙集的微博文本特征选择方法[J]. 科学技术与工程, 2013, 13(33): .
durui, Zhuyanhui, Dengcheng, et al. Micro Blog Text Feature Selection Based on Rough Set[J]. Science Technology and Engineering,2013,13(33).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-07-14
  • 最后修改日期:2013-07-14
  • 录用日期:2013-08-14
  • 在线发布日期: 2013-10-22
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注