基于样本冗余控制的材料属性机器学习预测模型
DOI:
作者:
作者单位:

贵州大学

作者简介:

通讯作者:

中图分类号:

TP391.7

基金项目:

国家自然科学基金项目(51741101),黔科合平台人才[2018]5781号


Redundant control of material property prediction by machine learning
Author:
Affiliation:

Guizhou University

Fund Project:

National Natural Science Foundation of China(51741101);Qian Kehe Platform Talents [2018] 5781

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,本文提出了一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此,本文提出降低冗余度是评估材料性能预测模型的必要步骤。

    Abstract:

    In current research on material property prediction based on machine learning, all data samples obtained by the database are usually used, and the prediction model is trained by calculating its high-dimensional vector representation. However, the high redundancy of the material database samples leads to a strong bias and over-fitting of the trained models. To this end, this paper proposes an algorithm to eliminate redundant samples in the data set, select representative samples from the data set; predict the material properties by using multiple machine learning algorithms and compare them, the results show that if the benchmark data set is not implemented Redundant control, even for random raw data sets, can yield good predictive performance metrics due to highly redundant samples; the study also found that using representative samples for training can actually help train higher generalization capabilities and more Predictive model. Therefore, this paper proposes that reducing redundancy is a necessary step in evaluating the material performance prediction model.

    参考文献
    相似文献
    引证文献
引用本文

李想,李少波,但雅波,等. 基于样本冗余控制的材料属性机器学习预测模型[J]. 科学技术与工程, 2019, 19(34): 278-283.
lixaing,,,et al. Redundant control of material property prediction by machine learning[J]. Science Technology and Engineering,2019,19(34):278-283.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-04-30
  • 最后修改日期:2019-07-09
  • 录用日期:2019-07-10
  • 在线发布日期: 2020-01-08
  • 出版日期:
×
律回春渐,新元肇启|《科学技术与工程》编辑部恭祝新岁!
亟待确认版面费归属稿件,敬请作者关注