基于分类精度和相关性的随机森林算法改进研究
DOI:
作者:
作者单位:

太原理工大学,太原理工大学,太原理工大学

作者简介:

通讯作者:

中图分类号:

TP3

基金项目:

国家高技术研究发展计划(863计划);山西省国际科技合作项目


Research on Improvement of Random Forests Algorithm Based on Classification Accuracy and Correlation
Author:
Affiliation:

Tai Yuan University of Technology,,Tai Yuan University of Technology

Fund Project:

The National High Technology Research and Development Program of China (863 Program); Shanxi International Scientific and Technological Cooperation Project

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。

    Abstract:

    In order to improve the classification accuracy of random forests algorithm, the decision trees in the random forest model are first sorted according to the AUC value of the classification performance evaluation index. And then the trees with high AUC value is selected to calculate the similarity matrix. Finally the decision tree is clustered according to the similarity matrix. So a new random forest model is generated by selecting the tree with the highest AUC value from each category and to achieve the goal of improving the accuracy of random forests algorithm. Experiments on UCI datasets show that the improved random forest algorithm has improved the highest classification accuracy of 2.91%.

    参考文献
    相似文献
    引证文献
引用本文

王日升,谢红薇,安建成. 基于分类精度和相关性的随机森林算法改进研究[J]. 科学技术与工程, 2017, 17(20): .
Wang Ri Sheng,,An Jian Cheng. Research on Improvement of Random Forests Algorithm Based on Classification Accuracy and Correlation[J]. Science Technology and Engineering,2017,17(20).

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-01-05
  • 最后修改日期:2017-02-28
  • 录用日期:2017-03-16
  • 在线发布日期: 2017-07-17
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注