27 06 2018

千亿娱乐老虎机并行EEMD算法及其在局部放电信号特征提取中的应用

  集合经验模态分解(EEMD)用于波形信号分析时面临计算和数据双重密集型问题,本文在Spark计算平台下设计实现了两种不同结构的并行EEMD算法,并用于局部放电信号的特征提取。与现有EEMD算法相比,节约了特征提取过程的耗时,计算效率更高。

  时序波形信号是电力设备监测数据中常见的表现形式,如局部放电信号、振动信号等,占有的数据量较大,是评估电力设备状态的重要依据。大量时序波形信号的特征提取面临计算和数据双重密集型问题,处理效率低下,严重限制了特征提取方法的实际应用。

  时序波形信号是电力设备状态评估的重要依据之一,EEMD算法具有自适应特性,非常适合于非线性非平稳时序波形信号的分析。然而,逐步提高的采样频率和日益增长的数据量使得EEMD算法面临计算和数据双重密集型挑战。本文基于Spark内存计算平台进行了EEMD算法的并行优化研究,有效提高了EEMD算法的计算效率,节约了局部放电信号特征提取过程的耗时,所提并行方法能够推广用于任何以EEMD为基础的应用场景。

  EEMD需要对原信号重复加白噪声并进行EMD,最终汇总分解结果求平均值。若将对原信号进行一次加噪并EMD的过程称为一次分解试验(Trial),则EEMD的每次分解试验是独立的。另外,还可以将长信号分割成多个子段(Epoch)分别进行EEMD后再合并结果。因此,EEMD算法存在两种层面的并行性,分别简称为Trial级并行和Epoch级并行。本文在Spark计算平台下设计并实现了Epoch级并行EEMD与Trial级并行EEMD这两种并行EEMD算法,并用于构造局部放电信号的特征值。Epoch级并行EEMD如图1所示,原信号在分段后的EEMD过程是可以并行的,但在这过程之前的信号分段与延拓以及之后的裁切IMF拼接合并过程是无法并行的。

  信号分段方式如图2所示。分段数目越大,千亿国际娱乐网Epoch级并行的并行粒度越细,因而并行度会越高。但同时为了减小分段误差而延拓的总长度也会越长,引入分段、千亿国际娱乐网延拓信号的分解、裁切合并结果等额外运算也会更大,会影响整体并行性能,因此分段数目需要折中选择。

  Trial级并行EEMD如图3所示,原信号在加白噪声后形成不同的染噪信号,然后对这些染噪信号执行EMD处理,最后将各染噪信号的分解结果逐个累加并求平均可得到最终的分解结果。显而易见,该过程是一个典型的Map-Reduce过程,Map阶段可以得到并行处理。

  在Trial级并行中,并行度与Trial次数有关,若EEMD一共需要进行Ne次Trial,则并行度最大能达到Ne。但并行度并非越大越好,并行度越大,并行系统需要付出的子任务管理开销则越大,在汇总时从各子任务收集结果时造成的通信代价也会越大,这时可以将Ne次Trial进行划分来减小并行度。跟Epoch级并行相比,Trial级并行的最大优势是其分解结果与串行方式的结果是等效的。

  Epoch级并行EEMD适用于较长的波形信号,但结果存在误差,而Trial级并行EEMD与原算法的结果一致,但对内存的需求量更大,较适合于数据量不大的波形信号。所提并行EEMD算法有效提高了局部放电波形信号的特征提取效率。

  研究团队还研究了基于Storm和机器学习方法的大规模电力设备在线监测数据的流式处理及在线并行故障诊断技术,请参见其他文献。

  朱永利:华北电力大学教授、博士生导师、教育部首批“新世纪优秀人才”、国务院“政府特殊津贴”和“全国优秀留学回国人员”获得者。现任中国电机工程学会高级会员、中国计算机学会高级会员、河北省计算机学会副理事长、河北省人工智能学会副理事长。主持国家自然科学基金项目4项、省部级科技项目2项和电力企业科技项目30余项。作为第一完成人获省部级科技奖励4项;发表学术SCI和EI论文100余篇,其中,国际期刊SCI 10余篇(其中3篇第一作者论文为国际顶尖期刊IEEE Transactions论文);撰写专著1部;主编“十二五”国家级规划教材1部。

  他率领的研究团队长期致力于输变电设备状态的网络化监测、人工智能在电力系统中的应用和电力大数据分析的研究。