基于支持向量机回归树的内燃机振动信号趋势预测
来源:微智科技网
第37卷第5期 2015年5月 舰船科学技术 Vo1.37,No.5 SHIP SCIENCE AND TECHNOLOGY May,2015 基于支持向量机回归树的内燃机振动信号趋势预测 万祥兰 ,范明君 (1.湖北工业大学理学院,湖北武汉430068;2.海军装备部武汉局,湖北武汉430063) 摘 要: 针对标准回归树建立在统计分析基础上所存在的缺陷,提出一种基于支持向量机的回归树预测模 型。首先,根据原始振动信号趋势序列构建回归树;然后,针对回归树上包含样本数过少的节点,利用支持向量机,建 立能够反映重要变量与响应变量之间映射关系的回归模型。仿真结果表明:即便由于设备出现异常,导致振动信号趋 势序列出现非平稳、突变情况,该方法也能准确地预测,性能优于标准分析方法,具有一定的工程实用性。 关键词: 支持向量机;回归树;趋势预测;Cao方法 中图分类号:TP18;TH17 文献标识码:A 文章编号:1672—7649(2015)05—0067—03 doi:10.3404/j.issn.1672—7649.2015.05.013 The trend prediction of engine vibration signals based on SVM—-RT WAN Xiang.1an ,FAN Ming.jun (1.School of Science,Hubei University of Technology,Wuhan 430068,China; 2.Wuhan Department of Chinese Naval Armament,Wuhan 430063,China) Abstract: For the disadvantage of standard regression trees which was based on the statistic analysis, a regression trees prediction model based on support vector machine was proposed.Firstly,the regression trees was established through original vibration signal trend series.Then,for the regression trees nodes in which the sample number was too small,support vector machine was employed to establish regression model which can describe mapping relationship of the important variables to the response variables.The simulation results indicate the proposed method not only can accurately predict non-stationary and sudden change of vibration signals when equipment works abnormally,and the performance outperforms the standard techniques,which illustrates its project practicability. Key words: support vector machine;regression trees;trend prediction;Cao S method 0 引 言 趋势预测是指在获得当前时刻设备运行状态评 估信息的基础上,利用各种推理算法对系统未来某 占训练集数目很少一部分,由于SVM不能选择合 适的样本输入,使得标准SVM训练算法无法获得 令人满意的训练速度。相反,回归树(RT)是基 于统计理论的非参数识别技术 ,它可以根据分 支规则自动地将所有输入数据分配到每一个节点 时刻的状态进行评估。因此,趋势预测作为故障诊 断中一个重要环节倍受重视。支持向量机(SVM) 上。但是,每一叶节点上的输出值只能以这个节 点上所包含样本的平均值来表示;而且,如果某 一近年来逐渐成为人工智能领域的一个研究热点,在 许多实际应用中表现出了优于传统回归技术的预测 能力¨ 。不足之处是:支持向量决定了支持向量 机回归 。实际应用中,通常样本的规模都很大, 且在绝大多数情况下,训练集中的支持向量数目只 收稿日期:2014—12—15;修回日期:2014—12—24 节点上包含的样本数太少的话,预测结果就失 去了统计意义上的可信度。机械设备在多数时间 内能够保持平稳运行,所以如果训练样本选择不 当或者即使所选样本中包含由于故障引起的突变 作者简介:万祥兰(1976一),女,硕士,主要从事高等数学、应用数学教学及工程数学算法与数据分析处理等研究。 ・68・ 舰船科学技术 第37卷 数据,根据建立回归树的评价标准,如果某一节 点上包含的样本数过少或者样本过于分散,那么 3 SVM—RT算法设计 具体步骤如下: 1)根据训练样本建立回归树预测模型; 2)假设一个预测样本被划分到叶节点 。,而且 t。属于第2类叶节点,返回到上一级根节点,假设 t 和t 由t 而成,t。由 而成。分别计算 t,,t 和t,所包含样本响应变量标准差D。,D2和D ; n 』n 将从新划分,但恰恰这类小概率事件就落在这样 的节点上,因此标准的回归树预测模型很难准确 预测到这种突然的变化情况。 为了解决上述问题,本文提出将支持向量机应 用到回归树模型中,利用时间序列建立回归树预测 模型,对回归树上包含样本数量少、样本差异程度 大的节点,将其所包含的样本作为工作子集,进行 支持向量机回归。 1 时间序列的构造 设时间序列{ (1), (2),…, (Ⅳ)},时间 序列预测即是根据时间序列的历史数据{ (t), (t一1),…, (t—m+1)}预测未来t+Jr时刻的 值 (t+丁),即寻找 (t+7-)与历史数据{ (t), (t—1),…, (t—m+1)}之间的关系。参数f 是预测步数,m为嵌入维数,因为振动时间序列 具有非平稳,非线性特点 ,本文借鉴混沌时间 序列重构相空间中确定嵌入维数的Cao方法…来 确定嵌入维数m。 2 回归树基本理论 定义£是由( 。,Y。),…,( ,Y )组成的n维学 习样本集,其中 =( ¨…, )是由一组变量 构成的向量,而Y ∈R是与 有关的响应变量。回 归树结构通过依次把学习样本按照一定规则成 两部分而建立起来。如图l所示,其中t.表示根节 点,由全部学习样本组成;t ,t ,t ,t。,t 表示叶节 点,即不再往下分的节点。在图1中,节点t:和t 由t。按一定的规则而成,t 和t 由t 而成。 如果从节点ti到节点t 之间有一条自上而下的通路 连接,则称t 是tj的父节点,tj是t 的子结点。t ,t , t。,t 都是t:的子结点。 ( ) /g(与) 图1 回归树模型 Fig.1 Regression tree model 3)定义离散率SDR= 2,1-1I ,当SDR越 小,说明t 和t 包含的两类样本差别越大,设A为 离散率的最大值,如果SDR<A,说明根据拆 分规则,节点t。被有效地拆分成2个相异的子集£: 和t ;如果SDR>A,说明2个子集之间存在一定的 相似性。用 表示样本完全同质的节点,并将这些 样本作为支持向量机回归的训练样本。因此,如果 SDR<A,则T=t,。如果不能满足上述条件,则从 新选取划分规则,对节点t 进行划分,直到满足条 件为止; 4)将节点 和它所有子节点上的拆分变量作 为重要变量,例如,在图1中,如果t 被认为是节 点 ,那么重要的变量就包括 和 ;如果节点t 被认为是节点 ,那么重要的变量就只有 ,因为 没有与其他变量相关的。这些重要变量将 作为支持向量机输入变量部分; 5)将节点 所包含样本的响应变量和重要变 量组成训练样本,本文采用占一支持向量回归机 (8一SVR)进行回归,具体算法推倒可参阅文献 [4],建立能够反映重要变量与响应变量之间映射 关系的回归模型。 4 应用实例仿真 4.1试验方法 对某柴油机的运行情况进行监测,并连续记录 柴油机振动加速度信号,每隔5 h提取一个振动的 峰峰值,从而组成一个单变量时间序列,如图1所 示,共500个数据。在这个序列中,连续选取前 300个点作为训练样本,剩余的200个点作为测试 样本。采用样本的相对误差PE和平均绝对百分误 差MAPE作为模型性能的评价指标,即 阳=I IV. l 1xl0 册 i’ = 1 lI y I【 。 式中:Ⅳ为检测数据集中样本个数;Y 为真实值;夕 第5期 万祥兰,等:基于支持向量机回归树的内燃机振动信号趋势预测 .・69・ 目疆 遮 — 蜷 为预测值。 4.2 SVR—RT与RT预测模型的对比研究 本文使用2种方法分别进行预测并进行比较, 一是基于SVM的RT预测模型;二是不使用SVM直 接使用RT预测模型。仿真结果如图2所示。 样本 (a)l~250组数据 样本 (b)250 ̄300组数据 图2不同模型的训练结果 Fig.2 Training results of different models 从图2(a)中可以看出,对于训练样本的前250 组数据而言,RT预测值曲线、SVM—RT预测值曲线 与真实值曲线基本重合,这主要是由于这些样本都是 在柴油机正常运转情况下测得的,振动信号也相对平 稳,所以2种方法对预测的结果没有太大影响,说明 2种方法对平稳时间序列都有较强的学习能力;但是 对于前250组训练样本,RT模型MAPE=0.016 7, 而SVM—RT模型MAPE=0.008 4,从中可以看出, 由于本文方法主要是针对RT模型对突变点预测精度 不足进行改进,所以即使是在平稳时间序列中,也存 在相对的突变和不平稳,在此情况下,由于采用了改 进算法,预测精度还是有所提高。 如图2(b)所示,训练样本中,第250~300之间 的时间序列有明显的非平稳特性,在某些样本点处出 现振动加速度急剧变大或者变小,对于这类非平稳振 动信号,采用本文的预测模型,不仅能对在257—294 之间的平稳时间序列作出准确的预测,而且通过对原 始样本的学习,仍然可以预测到振动信号非平稳的变 化趋势,例如样本251、257和297的振动数据明显 与其他样本的值相差很大,但是通过训练,尽管训练 结果与真实值不能完全的吻合,但仍然能够反映振动 信号突然变化的趋势;同样是采用相同的训练样本, 采用RT预测模型的训练结果如图2(b)中点线所 示,在振动信号为平稳的时间段内,仍然可以得到满 意的学习效果,但是当时间序列中出现非平稳的现象 时,原始的RT模型就很难准确的预测到这种突然的 变化趋势,即使预测到了这种变化趋势,例如第254 和第255样本的真实值分别为49.410 3 m/s 和 196.896 3 m/s ,训练结果分别为60.452 9 m/s 和 80.707 7 m/s ,从训练结果上看,虽然预测到了在5 h之后,有振动加剧的趋势,但是真实的变化幅度和 通过预测得到的变化幅度分别为147 m/s 和20 m/s , 预测结果要远远小于真实结果,导致对柴油机的运转 情况作出错误判断。 5 结 语 针对回归树模型是建立在统计理论基础之上所 带来了种种局限性,本文提出一种将支持向量机的 结构风险最小化原则和适合小样本学习与回归树能 够提取重要变量并且对输入空间能够进行自适应划 分的特点相结合的SVM—RT预测模型,通过采用 支持向量机理论,建立能够反映回归树上失去统计 意义节点上的重要变量与所包含样本响应变量之间 映射关系的回归模型。仿真结果表明:改进算法无 论是在训练精度还是泛化能力方面,都明显优于标 准的回归树预测模型。 参考文献: [1] FENG L,YAO Y,JIN B.Research on credit scoring model with SVM for network management[J].Journal of Computational Information System,2012(6):3567—3574. [2]THISSEN U,BRAKEL R V,WEIJER A P D,et a1.Using suppo ̄vector machines for time series prediction[J]. Chemometrics and Intelligent Laboratory Systems,20 1 3,69 (1—2):35—49. [3] 杨俊燕,张优云,赵荣珍.支持向量机在机械设备振动信 号趋势预测中的应用[J].西安交通大学学报,2005,39 (9):950—953. [4] 邓乃扬,田英杰.数据挖掘中的新方法——支持向量机 [M].北京:科学出版社,2004. [5] BREIMAN L,FRIEDMAN J H,OLSHEN R A,et a1. Classification and regression trees[M].Monterey,Calif, USA:Wadsworth,Inc.,1984. [6] 石博强.机械故障诊断的分形方法[M].北京:冶金工业 出版社,2001. [7] CAO Liang—yue.Practical method for determining the min- imum embedding dimension of a scalar time series[J]. Physica D,2012,110:43—50.