基于LDA模型的装备故障数据分类方法研究

2018年08月09日 22:03来源于:科技视界

转子故障数据分类方法的研究和实验台测试信息系统开发.pdf文档全文...

张伟 李东

【摘 要】本文针对现有使用人力分类装备故障数据效率和准确率较低的问题,根据故障数据种类繁杂,主题明确的特点,提出并使用LDA模型对故障数据自动分类,达到较高效率及准确率。

【关键词】LDA模型;方法;研究

中图分类号: TJ760 文献标识码: A 文章编号: 2095-2457(2018)11-0185-002

DOI:10.19694/j.cnki.issn2095-2457.2018.11.081

【Abstract】In view of the problem that the efficiency and accuracy of the breakdown data of manpower classification equipment are low, this paper proposes and uses the LDA model to classify the fault data automatically according to the miscellaneous types of fault data and the characteristic of the subject, so as to achieve high efficiency and accuracy.

【Key words】Research on LDA model method

0 引言

对装备故障信息进行准确的分类与收集是装备信息化建设的重要一环。科技是第一生产力,武器装备的先进水平是现代战争的第一战斗力。随着大数据时代的来临,军队对信息化建设提出了更高的要求,各种装备信息云数据库的建立被提上了议程。装备故障信息是反映装备质量性能的第一手资料,是装备信息云数据库的重要组成部分,对装备故障信息进行准确地分类则是建立装备信息云的关键一步。

装备的故障信息种类繁杂,但含有明确的主题。以坦克的故障信息为例,坦克是集机械、电子、液压、液力、光学、计算机及网络等技术的综合的复杂武器系统,包含成百上千的工厂的产品[1],坦克的故障信息设计上万个零件,十分繁杂。因此坦克的每条信息都可以归类到固定的系统中,每条信息都具有各自的主题。

目前我军采用的人工分类方法存在诸多弊端。我军坦克故障信息的收集者往往来自于一线的装备使用人员,由于其对装备结构组成及维修方法缺乏必要的认知,因此提供的信息缺乏规范,多为含有关键字描述性的信息,例如:驾驶员任务终端黑屏、在行驶过程中车速到45码左右开始抖动特别厉害、驾驶室任务终端不供电、车通一号盒电路板烧坏等等。这类信息的分类与收集主要是通过专业人员进行的,但由于数据量较大,人力有限,因此人力分类效率很低,且故障信息繁杂,技术人员各自专业比较集中,缺乏对各个领域熟知的全面人才,因此分类的准确率较低。

LDA主题模型适合于对坦克故障信息分类,相较于其他算法具有明显优势,在本文实验中达到良好的效果。LDA算法善于处理文本分类、生成问题,其提取关键字处理方法忽略了坦克故障信息中的不规范因素,其提出了主题分布与词分布的概念,适合处理“主题鲜明”的装备故障数据。

pLSA模型是LDA模型的前身,由Hoffmm于1999年在论文Probilistic Latent Swmantic Analysis中他提出,pLSA模型是一种文档主题生成模型,它将文档中词汇的生成理解为文档对主题模型的生成以及主题对词汇模型的生成,具有两层贝叶斯网络,pLSA模型的建立完全基于文档数据,因此在训练样本量不够丰富或者分布不够均匀的情况下,容易出现过拟合的问题。

1 模型建立与求解

1.1 模型建立

1.2.2 gibbs采样

gibbs采用属于随机模拟抽样算法的一种,模拟的核心是对一个分布进行抽样,gibbs采样需要选取概率向量的一个维度,给定其他维度的变量值采样当前维度的值,不断迭代,直到收敛输出待估计的参数。

4 结语

本文以坦克故障数据为例,建立LDA模型并对其分类,取得了良好的效果。说明LDA模型在装备类数据分类上具有较强的优势。隨着文档数据集、主题集的进一步完善,相信LDA模型能在分类的准确率上获得较大提升。

【参考文献】

[1]闫清东,张连第,赵毓芹.坦克构造与设计,北京理工大学出版社,2006.5.

[2]David M Blei,Andrew Y Ng,Michael I Jordan.Latent Dirichlet Allocation:TOwards a Deeper Understanding:neural information processing system,2002.

 
免责声明:

     本文仅代表作者/企业观点,与【名品家电网】无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,仅供读者参考,并自行核实相关内容。

     【名品家电网】刊载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

      如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行;新闻纠错: lwl#youngchina.cn

关键词: 文章 模型 故障