
LZ77电力数据压缩算法.该算法针对电力系统数据周期性的特点,选择合适的小波基,依据其多分辨率分析特性,将电力数据信号变换到小波域,使信号分解为低频分量和高频分量.对具有重要价值的低频信息使用 LZ77 压缩算法进行无损压缩,对高频分量进行阈值量化处理。
背景介绍
电力系统的采样数据对分析电网运行状态、故障诊断、状态评估具有重要意义,保证这些电能量数据实时、准确地传递到调度中心,主要的方法是对数据进行压缩.
目前电力系统使用的数据压缩方法分为传统压缩算法和变换域的压缩方法.传统的压缩算法包含自适应霍夫曼编码、算术编码、LZ系列编码等压缩算法。
本文针对电力数据的特点以及小波变换后保留系数之间的相关性,提出一种应用整数小波变换的LZ77电能质量数据压缩算法.
该算法依据整数小波变换的多分辨率分析特性,将原始电能量数据变换到小波域,对低频系数进行数据变换后用 LZ77 压缩算法处理,对高频系数选取门限进行阈值量化处理,得到相对更小的压缩比。
应用提升格式的小波滤波器组
1经典小波滤波器组的提升原理
Sweldens 提出的提升算法是一种简明有效地构造小波的方法 ,它经过分裂、预测以及更新 3 个步骤 ,逐步构建具有良好性质的小波.使用提升算法构建的小波不仅拥有经典小波的多分辨率分析特性、占用存储空间小等优点,并且在相同数据长度下,提升算法构建的小波使速度提高将近1倍。
因此,本文用提升算法实现经典小波滤波器组,并将之应用于实践.
若要使用提升算法实现经典小波滤波器组,建立提升算法构建的小波变换和经典小波滤波器组间的联系,首先要得到小波滤波器组的多相矩阵形式:

式(1),(2)中(h,g)和(h,g)是两组滤波器组.假设(Sj-1 2l+1,Sj-1 2l)分别表示j-1 尺度系数的奇数、偶数部分,(e ,o) 表示滤波器的偶数和奇数部分的系数 ,(dj ,Sj ) 代表j 级的小波系数与尺度,小波变换的分解合成矩阵形式可表示为式(3),(4),即对式 (1),(2)进行多相位矩阵因子分解,得到

对 he(z)和 ho(z)进行多相位矩阵因子分解 ,得到

式(5)中 K 为刻度因子,(si(z),ti(z))两个罗朗多项式在之后分别用于构造第二代小波变换中的预测算子和更新算子. 然后引入新矩阵 P0 (z)以推出 P(z)的因子分解实现形式 ,

将式 (1)和式(7)代入式 (6) 得到与 h (z) 互补的滤波器 g0(z),再根据式(5)计算P0(z) :

将式(8)代入式(7)确定g6(z),并由式(6)和式(7)计算原始提升系数Sm(z):

联立式 (6),(8),(9)得到式 (1),(2)经典小波的提升格式为

至此,经典小波变换利用因子分解方法完成了传统卷积模式的提升.以 Bior4.4小波滤波器组为例,其提升实现正变换公式为

式 中 :α = - 1 .586 134 34 ,β = 1 .079 636 78 ,γ = - 0 .052 980 12 ,ε = - 0 .882 911 08 ,δ = 0 .443 506 85 ,η=1.576 123 75,K =-1.149 604 40.
2整数小波变换
提升原理在小波变换领域中的扩展使用,使小波的构造和应用有了更大的灵活性.利用提升算法构造的整数小波变换改善了经典小波变换中浮点型不适合卷积运算的问题,更好地实现了原始数据的重构.
如Bior4.4双正交小波滤波器使用提升算法因子分解后,使用 Amir Said提出的S+P变换或类似的方式构造其小波变换的整数形式.
忽略归一化因子,在提升算法的基础上加入取整步骤实现整数小波变换,即在预测算子si(z)和更新算子ti(z)中加上算子 ,将提升过的小波变换转换为整数小波变换.以ior4.4小波提升实现式 (13)为例,其整数小波变换实现方式是 dl=dl + ,式(14),(15)的实现方式可以依次类推,其中为取整操作.
3小波基选择
虽然对电力采集数据的压缩能够通过小波分解将原始数据中的不同数据分开,但是并不是所有的小波基函数都适用于电力数据的压缩.
本文对比小波的正交性、对称性以及消失矩等方面选取 Daubechies小波、双正交小波以及对称小波3种适合数据压缩的小波基,并通过数据对3类小波基在压缩中的性能效果进行对比,其仿真实验的统计结果如图1,2所示.
以 Bior4.4、Sym4和 Db4为小波基,在考虑压缩比和误差情况下,对 54 kHz 采样率下的正常数据做压缩,通用阈值公式
取100,得到小波基的压缩效果,其中小波分解层数n为4层,ecr 和EERP 分别为压缩比和能量恢复系数.
CR从图1可以看出,3种小波基的压缩比在分解层数为4层时最低;从图2可以看出,3种小波基在分解4 层后误差基本保持不变;各小波基压缩效果比较见表 1。
从表1可以看出,在分解层数为 4 层时,Bior4.4小波基的压缩比为6.972 4%,能量恢复系数为99.5024,略强于Db4和Sym4,对于光滑信号,双正交小波函数比Db小波函数系的逼近能力更好,而逼近能力越强,压缩比就越高.并且在进行小波变换时由于Bior4.4 的对称性更好,相位失真小,所以重构信号时畸变也小 .


LZ77压缩算法
用小波分解和阈值处理电力数据后,大部分变为不被纳入存储数据的0,并且由于含有重要信息的低频分量是正弦信号,其数据是不断重复的、具有周期性的数据,而LZ77压缩算法是利用数据的重复结构信息压缩数据,适合这类数据 .
LZ77 算法是应用字典模型的经典压缩算法,它的动态字典由字典窗口和先行缓冲区体现.
LZ77将进入先行缓冲区的数据与字典窗口的数据进行比较,如有匹配则按规定的格式代码表示输入的数据,而经过匹配,编码的数据流成为字典的一部分.
数据压缩实验与讨论
1压缩效果评价标准
对于压缩效果的性能评价标准,本文定义了相应的衡量指标:
(1)压缩比是压缩后的数据容量Nc 与原始数据容量N的比值.

(2)能量恢复系数是评价压缩算法恢复能力的参数.

(3)均方误差是误差评价标准 .

式中: (n)为原始数据,^(n)为重构数据.
2实验结果与分析
用整数小波变换对采样数据进行压缩,其效果与小波基的选择、小波分解层数、高频分量阈值的设置有关.
实验中阈值系数都设为0.9,小于这个量化阈值的小波分量将被置零,采用提升后的 Bior 4.4小波选取合适的小波分解层数来验证该算法的正确性和有效性.
原始数据采用如图3所示的电能量数据,该数据对50Hz工频信号进行A相电压采样,采样频率为54 kHz,共采集 5 个周波,共计 5400个点 .
图 4 为重构后的电压数据,图 5 为原始电压数据与重构数据的差值 ,电压数据的压缩结果见表2,其中n为 Bior 4.4 小波的分解层数 ,eCR1 是应用量化阈值的整体压缩比 ,eCR2是 LZ77算法对低频系数的压缩比,eCR是算法的整体压缩比,eERP能量恢复系数;eMSE为均方误差值.


电压数据的压缩结果见表2.
从表2可以看出,随着小波分解层次的加深,低频分量的压缩比和算法整体压缩比随之减少,但是随着分解层数的加大,高层尺度系数的数量开始逐半减少,用于重构数据的特征信号也相应减少,均方误差随之增大,减弱了算法的有效性,因此压缩比和均方误差是相互制约的.
考虑到电力系统实时性和准确性的要求,所以小波分解层数不宜过高,均方误差不宜过大,本文选择 Bior4.4小波,分解层数为4.
原始电能量数据进行整数小波变换后,对高频分量进行阈值量化处理,对低频分量进行数据变换后再用 LZ77算法压缩,不仅达到了10.76%的整体压缩比,且压缩后的数据保留了98.971%的频谱能量 ,均方误差为 2.078% ,压缩效果良好 .
结论
(1)在小波变换的基础上,针对其浮点型数据做卷积运算耗时过多的问题,应用提升算法构造整数小波变换,使压缩速度提高;
(2)通过电能质量数据的压缩比和能量恢复系数评判标准选择适合电能质量数据压缩的小波基;
(3)对实际的电压数据进行仿真,比较分析各分解层数的压缩效果,双正交提升小波 Bior4.4的分解层数为4层时,电能质量数据的压缩与重构的效果良好,实用价值高.
(来源:《西安工程大学学报》第32卷第3期)
仅供学习和交流,版权归原机构所有
瓦特和比特
“瓦特和比特”致力于打造国内最专业有趣的能源电力&数据分析学习社区,集结能源行业优秀的业务专家和数据分析大咖,为数据分析从业者和能源从业者提供一种全新的能源电力&数据分析交流方式。
案例|电力系统基于大数据的短期负荷预测
从大数据分析角度,探讨电力设备状态检测与评估
小瓦君提示:关注“瓦特和比特”,学习最新的电力数据技能,为你热爱的工作打开新的视野~同时也欢迎从事不同岗位的电力人,公众号留言,跟小瓦君一起分享你的“电力人生”😊
瓦特和比特
有趣的分析在等你长按扫码可关注

