基于不完全信息的轴承故障聚类识别方法论文

时间：2021-06-27 14:00:41 论文范文我要投稿

关于基于不完全信息的轴承故障聚类识别方法论文

　　引言

关于基于不完全信息的轴承故障聚类识别方法论文

　　谷物联合收获机能够高效完成农作物的收割、脱粒、分离、清选及秸秆处理等一系列任务，是现代农业生产中常见的一种大型自动化设备。其中，轴承部件在该设备的传动、行走和控制等装置中被大量地使用，是一类影响设备运行状态的重要部件。尤其在脱粒装置上用到的滚筒轴承，不仅影响脱粒的效果，而且由于在恶劣工况下工作，属于设备中的易损件。因此，有效监测滚筒轴承部件的运行状态，对联合收获机的正常运行具有重要意义。目前，轴承故障诊断的一个重要方法是通过识别其组成部件( 滚动体、保持架、内圈、外圈)之间相互碰撞而产生的特征频率来完成识别;但在实际监测过程中，得到的振动信号中并非总是可以找到对应的特征频率，而是表现为时有时无的情况。造成这一情况的原因主要有两方面:①传感器只能在轴承表面获取信号，整个联合收获机设备中存在的干扰信号也比较大，使得特征频率对应的信号时常被淹没;②轴承中的滚动体在运行过程中容易发生滑失，使得与其余部件碰撞而产生的特征频率缺失，使得特征频率不显著的信号片段难以被识别，从而影响了整体的诊断效果。

　　信号中特征频率显著的片段实际是可以用来帮助提高整体诊断效果的。因为其对应的故障状态易于判别，从而可将它们作为状态已知的先验信息，然后与未知状态的信号片段混合，再利用常见的频域特征来进行识别，这是一种半监督的聚类或分类方法，目前已有一些学者进行了相应的探索和研究。毕锦烟等人提出一种半监督模糊核聚类算法用于齿轮轻微点蚀故障的检测。徐超等人则提出一种半监督模糊聚类算法用于发动机磨损故障的检测。他们均是直接对目标函数进行改造，但特征空间中各个特征对数据识别的作用通常是不一的，不能很好利用距离机制来评价样本的相似程度。为此，提出了一种基于不完全信息的.聚类方法( Clustering Approachbased on Partial Information，CAPI) 用于轴承故障的识别。该方法在两方面利用了已知样本的信息:①利用已知样本对特征空间进行变换，从而实现距离机制的学习，以便更好地评价各个样本之间的相似程度;②利用近邻原则先对已知样本进行扩充，再将扩充后的已知样本用于目标函数的设计。最后，在某型小麦联合收获机滚筒轴承的滚珠轻微损伤故障及滚珠损伤和外圈损伤复合故障的识别中，验证了所提方法的有效性。

　　1、基于先验信息的距离学习方法

　　将监测得到的信号分为若干段，每段信号即对应一个样本，假设一共有n 个样，C 类状态。其中，第i个类有nil个已知样本、niu个未知样本。CAPI 首先对数据集X 中的已知样本进行相关成分分析，得到变换矩阵W，从而将所有样本取值进行转换，即xnew ，j =Wxj，xj = (xj 1，xj 2，…，xjd)，d 为特征总数。其具体步骤如下:1)计算第i 个类已知样本的均值vil，则vil = 1nilΣnilj = 1xij(1)2)计算各类已知样本对应的协方差矩阵Cor，有Cor = 1CΣCi = 1Σnilj = 1(xij - vil) (xij - vil)T (2)3)计算变换矩阵W，则W = Cor-12(3)变换矩阵是一个将有用特征显现的过程。它给一些特征赋予大的权重，因为这些特征对类的区分有重要作用;而在其余特征上样本取值的变化主要是由于各类内部取值波动引起的，对类的区分并无贡献，则赋予小的权重。

　　2、改进的半监督聚类算法

　　改进的半监督聚类算法是在转换后的特征空间下进行的，它在目标函数中融入了已知样本的约束，还在求解过程中利用粒子群算法克服了K 均值聚类易陷入局部极值的缺点。

　　2. 1 近邻扩展策略

　　近邻扩展策略是根据相邻样本的状态很可能相同的原理设计的。其具体操作步骤为:

　　1)对于数据集Xnew中的每一个已知状态的样本，按照欧式距离的取值找出其k 个近邻样本;

　　2)若近邻样本y 本身即为已知样本，则不做任何操作;

　　3)否则，若近邻样本y 只是一个已知样本的近邻，则令其所属的类标号与已知样本的类标号相同;

　　4)若近邻样本y 同时是多个已知样本的近邻，则计算各个已知样本与近邻样本y 的欧式距离，找出其中最小距离对应的已知样本，记为x* ，近邻样本y 的类标号，即与x* 的类标号相同。通过近邻扩展策略，使得已知样本的信息得以尽可能地被发掘，从而加强已知信息对聚类结果的影响。

　　2. 2 目标函数惩罚机制的设计

　　由于已知部分样本的类别标记，本文在设计的目标函数中引入了惩罚机制。若已知样本被错误的划为其它类别，则增大目标函数值，否则不影响函数取值。又由于近邻扩展策略中得到的已知样本具有一定的不可靠性，为了规避该风险，若扩展所得已知样本被错误划分时，则依据k 近邻的次序给出不同程度的惩罚。设计的目标函数为J =ΣCi = 1Σnj = 1uij ‖xnew，ij - vi‖2 +ΣCi = 1 Σnj = 1，xnew，ij∈LuijD1(xnew，ij) + (4)ΣCi = 1 Σnj = 1，xnew，ij∈KLuij2 -kD1(xnew，ij)其中，uij取值为1 或0，表示第j 个样本是否被划分到第i 个类;vi为第i 个类的中心;L 表示未扩展时已知样本构成的集合;KL 为扩展过程中产生的已知样本构成的集合。当样本属于集合L 且被错误划分时，D1(xnew ，ij)取值为1，否则取值为0;当样本属于集合UL 时，D1(xnew ，ij)按相同方式取值。其中，k 值表示样本xnew ，ij在近邻扩展策略中所对应的近邻顺序。若为最近邻，则k 值为1，次近邻则为2，依次增大。

　　每次迭代后所有样本的划分按照欧式距离最近的原则进行，则uij =1 若‖xnew，ij - vi‖2 ≤ ‖xnew，pj - vp‖2，{ p = 1，2，. . . ，C 0(5)其它各类中心向量的更新为vi =Σn j=1uijxnew，ijΣnj = 1uij(6)

　　2. 3 基于粒子群算法的聚类过程实现利用粒子群算法来优化所提目标函数，并采用聚类中心的实数编码方式，个体zi = ( zi 1，zi 2，…，zim)。其中，m 为总的编码长度，取值为m = Cd，即每d 个基因位对应一个类的中心向量，一共有C 个类。个体zi中每个基因位的取值均为0 和1 之间的实数，所以在计算前所有样本均要归一化到0，1 范围内。粒子群算法的算子为vect+1ij = wIvectij + c1 r1(z*ij - ztij) + c2 r2(ztgj - ztij)zt+1ij = ztij + vect+1ij(7)其中，vecijt表示个体zi在基因为j 上的速度;t 表示代数;zi* 表示个体zi在其进化历史中所发现的目标函数值最小时所对应的个体;zgt 表示目前种群中已发现的目标函数值最小的个体，wI为惯性权重;c1、c2、r1和r2则为权重系数。此外，为了抑制种群早熟和提高种群的多样性，本文采用了每间隔一定代数t0即选择一定比例的较差个体并重新生成。其具体操作方式为:将种群按照目标函数取值降序排列，选取前q 个个体，令其每个基因位的取值在0，1 之间随机生成。

　　基于上述改进，CAPI 的运行流程为:

　　1)将正常工况下样本标记为已知样本，并找出监测信号中特征频率显著的样本，对应到相应故障状态中，也标记为已知样本，而剩余样本则为未知样本;

　　2)利用所有已知样本进行相关成分分析，从而将所有样本在特征空间中进行转换;

　　3)将已知样本进行近邻扩展;

　　4)对扩展后的样本进行基于粒子群算法的聚类，目标函数值最小个体对应的即为聚类的最终结果，根据未知样本和扩展所得已知样本被划分的聚类标号，即得到它们对应的故障状态。

　　3、实验结果与分析

　　实验采用雷沃谷神4LZ - 2. 5E 系列自走小麦联合收获机为研究对象，测试其滚筒轴承径向的振动加速度信号。一共测试了3 种状态:正常状态、滚珠有轻微凹坑的状态及外圈和滚珠均有轻微凹坑的状态。每种状态均得到了60 个样本，正常状态在设备早期使用过程中获得，全部为已知的样本;而后两种状态通过包络谱分析，找出特征频率显著的样本分别有22个和29 个，即为已知样本，其余则为未知样本。两种故障状态中未知样本的时域和频域图。这些样本在时域信号中难以区分，而在频域信号中尽管缺乏特征频率，但其频谱仍然存在一些不同。所以提出的7 个频域特征来构建相应的特征空间，用以识别未知样本。这7 个频域特征具体是平均频率、波形穿过时域信号平均值的平均频度、波形的稳定系数、变异系数、频域偏斜度、峭度和均方根比。

　　为了更好地说明所提各项改进的性能，本文设置了3 个对比算法，分别为:

　　1)先对数据进行主成分分析，然后按照贡献率超过85%的标准构建新的投影空间，再对其按照本文所提目标函数和粒子群方法来进行聚类，该方法称为PCACA;

　　2)目标函数中不加入关于已知样本的惩罚项，其余保持和CAPI 方法一致，称为CAPI1;

　　3)不进行已知样本的近邻扩展，其余保持和CAPI方法一致，称为CAPI2。

　　本文将所有算法中所需参数设置为:近邻扩展策略中的k 值设为1，种群大小为50，一共进化80 代，惯性权重设为0. 79，c1为2，c2为1. 6，r1和r2为0 和1 之间的随机数，速度vec 的最大和最小值为2. 1 和- 2.1，每隔10 代选取目标函数值最差的5 个个体重新随机生成。表1 给出了各种算法将所有样本进行分类的正确率和虚警率(正常样本判为故障样本的比率)，以及将未知样本分类的漏报率(未知故障样本判别为正常样本的比率) 和误报率( 将未知故障样本的故障类型判别为其它故障类型的比率)。

　　CAPI 具有最高的正确率，其正确率相比其它3 种算法分别提高了2. 78%、7. 22%和5. 55%。CAPI 还具有最低的虚警率、漏报率及误报率，其与另外3 种算法相比，虚警率、漏报率和误报率最多降低了2. 22%、5. 79% 和5. 80%，并且CAPI 所得虚警的样本个数为0。CAPI 与PCACA 的对比结果表明:基于已知样本信息的特征空间转换方法比无监督的PCA 方法更有效力:而CAPI 与CAPI1、CAPI2 的对比结果说明:本文对目标函数的改进及提出的近邻扩展策略对未知样本的正确识别有显著的促进作用。

　　4、结论

　　提出了一种针对联合收获机滚筒轴承故障的半监督聚类识别方法。其中，在先验信息的利用中，提出了两种具体实现方式，分别为用已知样本对数据特征空间进行变换和对目标函数进行改造，还提出在样本利用中可借助近邻概念扩充已知样本的数量。所提方法的有效性在小麦联合收获机的轴承故障识别实验中得以验证。它们对提高故障识别的正确率，降低虚警率、漏报率和误报率具有重要作用。同时，实验结果表明:基于相关成分分析的特征空间重构方法显著提高了算法的性能，为半监督聚类算法中已知信息的利用提供了一条有效的途径。

【基于不完全信息的轴承故障聚类识别方法论文】相关文章：

连通聚类星识别方法11-12

基于克隆聚类的特征提取与多传感器故障诊断10-03

轴承的寿命与故障 -管理资料01-01

基于潜在语义标引的文本聚类研究10-07

滚动轴承故障轨边声学检测技术的论文02-04

基于灰色聚类的机场跑道侵入人为风险综合评价浅析论文02-18

基于ANSYS的弹性轴承设计方法07-29

车用轴承故障检修4例08-28

基于差空间的MPCA人脸识别方法07-31