1.一种大数据环境下基于深度学习的AGC实时控制策略,其特征在于包括如下步骤,步骤1,生成优良的混合大数据控制数据集,包括:步骤1.1,数据还原:对年度电网完成AGC指令的执行周期时间进行统计,得到不同AGC下令值区间内对应的执行周期,完成时间的正态分布,并在此基础上根据现行的PI控制策略的原则,对现有的ACE数据进行计算,得到控制前的ACE数据;
步骤1.2,三种控制策略离线混合控制:第一轮运用基于离散傅里叶变换方法的AGC控制策略,控制完后不合格的考核点其对应的控制周期再由PI控制进行第二轮计算,在第二轮的基础上在进行第三轮的最优控制,经过这三轮控制后,初步得到半年的海量控制数据;
步骤1.3,均衡特性法筛选数据:对于步骤1.2中产生的海量控制数据进行统计,在每天
144个考核点中,筛选出至少出现2个经PI控制和2个经最优控制达到合格的天数,共同构成优良的混合大数据控制数据集;
步骤2,数据预处理,包括:
步骤2.1,数据标准化处理:对步骤1的生成优良的混合大数据控制数据集进行处理,连续数据采用零‑均值规范化处理,非连续数据采用独热编码处理;
步骤2.2,转换成有监督学习数据集:通过滑块窗口采样方法选择符合条件的数据,并对选择出来的数据加以叠加生成三维数据,然后将标准化处理过后的多变量时间序列数据集转化成能输入长短期记忆网络的有监督学习数据集;
步骤3,使用LSTM网络进行AGC控制,包括:步骤3.1,网络模型构建:用一个三分类网络来确定当前AGC机组是否要进入加减速操作,用两个回归网络分别计算加减速状态时的总调节功率;
步骤3.2,LSTM网络参数设置与函数选择:对三个LSTM网络,三分类网络选择三层LSTM网络,Softmax函数作为输出层激活函数,交叉熵损失函数作为目标函数;两个回归网络选择两层LSTM网络,均方误差函数作为目标函数;
步骤3.3,LSTM网络训练:分别将三个不同的数据集输入到对应的LSTM网络中进行训练,当网络出现过拟合的现象时停止训练,保存网络参数,共训练出三个LSTM网络;
步骤4,根据AGC的控制要求进行控制性能评估:用训练完成的三个LSTM网络组成基于LSTM网络的AGC实时控制策略,并从日均合格点数、下令次数和正负调节量等AGC控制指标将基于LSTM网络的AGC实时控制策略与PI控制和基于DFT方法的AGC控制策略的控制结果进行全面的对比。
2.根据权利要求1所述的大数据环境下基于深度学习的AGC实时控制策略,其特征在于,所述步骤1.1中,对现有的ACE数据进行反向还原计算的步骤为:a)对某年度电网完成AGC指令的执行周期时间进行统计,得到不同AGC下令值区间内对应的执行周期完成时间的正态分布,并选取概率分布最大的值为该下令值区间的AGC执行周期完成时间,并对执行周期完成时间进行分解,得到机组指令延迟时间、加减速时间与指令保持时间;
b)根据当前ACE计算0时刻下令值PR0:PR0=PP0+PI0+PCPS0;
其中PR0、PP0、PI0和PCPS0分别为0时刻的AGC下令值、比例分量、积分分量和CPS分量;
c)根据步骤a)可得到下令值PR0对应的执行周期完成时间为te,指令延迟时间td、加减速时间ta与指令保持时间tk,并且te=td+ta+tk;
d)根据PI控制策略与完成执行周期时间情况,计算出执行周期完成时间te内每个采样时刻AGC机组出力
i
e)根据执行周期完成时间te内的实际ACE与步骤d)得到的AGC出力PR 计算得到原始YACE:
3.根据权利要求1所述的大数据环境下基于深度学习的AGC实时控制策略,其特征在于,所述步骤2.1中,连续数据采用零‑均值规范化处理的方法为:属于连续数据类型的是频率偏差Δf、区域控制偏差ACE、CPS1和CPS2这四个输入变量以及回归网络中的区域总调节功率这一输出变量,连续数据采用数据平均值和方差进行零‑均值规范化处理,经过处理后的数据的均值为0,标准差为1,转化公式为:式中mean和σ分别为变量的均值和标准差。
4.根据权利要求1所述的大数据环境下基于深度学习的AGC实时控制策略,其特征在于,所述步骤2.1中,非连续数据采用独热编码处理的方法为:属于非连续数据类型的是分类网络中加减速状态量这一输出变量,状态量包括状态‑
1、状态0和状态1,采用独热编码之后无需再次进行标准化处理,状态‑1编码后对应100,状态0编码后对应010,状态1编码后对应001。
5.根据权利要求1所述的大数据环境下基于深度学习的AGC实时控制策略,其特征在于,步骤2.2中,通过滑块窗口采样方法选择符合条件的数据的方法为:用序列长度×特征量大小的滑动窗口在时间序列数据中每隔20个采样点框选出一个二维数据,该二维数据有一个当前输出变量作为标签,将带着标签的二维数据叠加得到输入LSTM循环神经网络中的三维数据;
对于分类网络,每隔20个采样点框选出一个二维数据,其输出标签为独热编码之后的状态量;对于加减速回归网络,滑动窗口每隔20个采样点移动选取二维数据,仅选取作为标签的区域总调节功率对应增减的数据,来叠加生成三维数据集。