1.一种基于搜索引擎指数的电力负荷预测方法,其特征在于,其包括以下步骤:S1,确定至少一个与预设地区电力负荷相关的搜索引擎关键词;
S2,获取所述关键词在预定历史时间段内的搜索引擎指数;
S3,获取相同历史时间段内所述预设地区的电力负荷数据;
S4,使用Spearman秩相关检验分析所述预设地区的电力负荷与搜索引擎指数的关系,剔除相关系数低于预设阈值的搜索关键词;
S5,构造基于马尔科夫链的广义加性模型,对搜索引擎指数的时间序列数据进行分解;
S6,构建搜索引擎指数时间序列的趋势项函数;
S7,构建搜索引擎指数时间序列的季节性函数;
S8,构建搜索引擎指数时间序列的节假日效应函数;
S9,对与所述预设地区相关的多个搜索引擎关键词进行主成分分析,得出涵盖多维搜索引擎指数的线性组合;
S10,获取相同历史时间段内所述预设地区的天气数据,并使用基于粒子群优化算法的长短期记忆神经网络对未来时间段的天气数据进行预测,得到天气数据预测值;
S11,基于所述趋势项函数、所述季节性函数以及所述节假日效应函数,使用长短期记忆神经网络分别对搜索引擎指数的趋势项、季节项和节假日项进行预测,将所述趋势项、季节项和节假日项相加得到搜索引擎指数的外推预测值;
S12,基于果蝇优化算法的广义回归神经网络构建电力负荷数据预测模型,将所述历史时间段内所述预设地区的电力负荷数据、所述多维搜索引擎指数的线性组合、所述历史时间段内所述预设地区的天气数据作为所述电力负荷数据预测模型的训练集;用所述搜索引擎指数的外推预测值以及所述天气数据预测值作为输入量,对未来时间段的电力负荷数据进行预测。
2.根据权利要求1所述的方法,其特征在于,所述Spearman秩相关检验的表达式为:其中,ρs表示Spearman等级系数,U表示进行检验的电力负荷和搜索引擎指数数据的组数, 表示第u组数据中电力负荷和搜索引擎指数数据的变量等级的差的平方,对于Spearman等级系数小于预设阈值的搜索关键词进行剔除。
3.根据权利要求1所述的方法,其特征在于,构造基于马尔科夫链的广义加性模型,对搜索引擎指数的时间序列数据进行分解,包括:所述搜索引擎指数的时间序列数据的分解表达式为:Y=Q+Z+J+∈ (2)式(2)中,Y为总的搜索引擎指数;Q为趋势项,是一个表征搜索引擎指数发展趋势的非周期性单调函数;Z为周期项,表征搜索引擎指数时间序列的周期性特征;J为预设时间点影响项,可以根据具体情况设置,在其上搜索引擎指数会有阶跃式波动的离散时间点,表征节假日对搜索引擎指数时间序列的影响;∈为误差项;
对搜索引擎指数的时间序列数据进行分解,具体包括:用马尔科夫链拟合随机序列{xt:t=1,2,…}的状态概率表达为式(3):pii=p{Xt=j} (3)式(3)中,pii为转移矩阵,p表示满足后续表达式的概率,Xt为离散空间中的时间序列,j为预测方法序号,t为预测时段;
状态概率分布的表达式为式(4)(5):Pt=[Pt1,Pt2,…,Ptv] (4)式(4)中,pt为t时刻的转移概率矩阵,Ptv为系统由状态t转化为状态v的概率;v是一个为表示系统状态序号而引入的符号;式(5)中, 为Ptj的估计值,s为可能发生转移的总次数,T为拟合时段,N为预测方法的种类;
随机序列的一步转移概率矩阵的估计表达式为:B=CG+E (6)式(6)中,B为随机序列的估计矩阵,C为输入变量矩阵,G为随机序列的一步转移概率矩阵,E为误差矩阵,B=[P2,P3,…,PT],C=[P1,P2,…,PT‑1];
E的估计的表达式为:
‑1
E=(B‑CG)(B‑αG)/(T‑1)=[BB‑BC(CC) CB]/(T‑1) (7)式(7)中,α为转移概率矩阵系数;
状态概率的预测公式为(8)(9):Pt=GPt‑1 (8)式(9)中, 为负荷预测值的估计值,Pj为组合预测模型中各个对应模型的权重值,yj为i时刻负荷预测值。
4.根据权利要求1所述的方法,其特征在于,构建搜索引擎指数时间序列的趋势项函数,包括:
对逻辑回归函数进行修正,得到适用于搜索引擎指数的回归增长函数表达式为:其中,Q(t)为趋势项函数,A表示曲线的最大渐近值,c表示曲线的增长率,m表示曲线的中点,h表示时间;
进一步扩展成动态函数:
其中,A(t)为曲线最大渐近值函数,δ、γ为增长率的变化量,a(t)为匹配维度的向量。
5.根据权利要求1所述的方法,其特征在于,构建搜索引擎指数时间序列的季节性函数,包括:
特别地,当时间周期为年时,转为:其中,G表示相加项的个数,Z(t)表示季节性函数,M表示时间序列的周期,an、bn分别为余弦函数和正弦函数的幅度。
6.根据权利要求1所述的方法,其特征在于,构建搜索引擎指数时间序列的节假日效应函数包括:
使用指示函数,设置一个参数用以限定所选节假日对搜索引擎指数的影响及适用范围,在这个影响及适用范畴中,进一步细分为前影响范围和后影响范围,节假日效应函数表达为:
V(t)=[1(t∈D1),...,1(t∈DL)] (14)F(t)=V(t)k (15)其中,D1,…,DL表示以第1到L个节假日为中心的邻域时间段,V(t)为回归矩阵;k为节假日影响范围参数,F(t)为节假日效应矩阵。
7.根据权利要求1所述的方法,其特征在于,对与预测对象地点相关的多个搜索引擎关键词进行主成分分析,得出涵盖多维搜索引擎信息的线性组合,对所选的搜索关键词的搜索指数进行中心化,此过程的表达式为(Λ)
其中,x表示搜索关键词的平均搜索指数,x 表示搜索引擎指数时间序列中第Λ个数据,b为该搜索引擎指数出现的频数;
计算表征指数特征的协方差矩阵,协方差矩阵的表达式为:T
H=ψψ (17)式(17)中,H为协方差矩阵,ψ为n维随机变量;
对式(17)的协方差矩阵进行特征值分解;
指定一个降维后的主成分比重阈值介于0到1之间,定义特征值数量参数η,则η的表达式满足:
其中,λi为协方差矩阵的第i个特征值;
特征值需要满足式(19):
λ1≥λ2≥…≥λi (19)取出最大的η个特征值对应的特征向量(ρ1,ρ2,…,ρη),将上述特征向量标准化后,组成特征向量矩阵;
(i) (i) T (i)
对样本集中的每一个样本x ,转化为新的样本z =Wx ;W为样本转移矩阵;
(1) (2) (i)
得到输出样本集U=(z ,z ,...z )。
8.根据权利要求1所述的方法,其特征在于,所述粒子群优化算法的速度更新公式为:粒子群优化算法的位置更新公式为:式(21)中w为惯性权重,μ1和μ2为学习因子,r1和r2为两个分布在[0,1]之间相互独立的随机数, 和 分别为在第S次迭代中,第α个粒子在第β维上的速度分量、位置分量、个体最优值和群体全局最优值;
负荷预测模型参数寻优的惯性权重表达为式(22):式(22)中,w(t)为负荷预测模型参数寻优的惯性权重,wmax和wmin分别为惯性权重的最大值和最小值;e为当前迭代次数;emax为最大迭代次数;
基于标准柯西累积分布的扰动函数,其表达式为:式(23)中,F(xm)表示扰动函数,xm为扰动函数的自变量;
粒子群整体凝聚度的表达式为式(24):式(24)中,coh为粒子群整体凝聚度, 表示第S次迭代中,第α个粒子在第β维上位置的平均值;
计算所有粒子的个体最优值pbest的平均值avg_pbest到当前最优值pbest在第β维上的距离χ(β)为:
自适应变异调节变量xm(j)定义为:式(27)中,xm(β)为自适应变异调节变量,λ为一常数,rmax为各维间的最大距离;
自适应柯西变异操作更新方程为:*
gbest=gbest+F(xm) (28)*
式(28)中,gbest为更新后的群体全局最优值;
长短期记忆神经网络基本单元的状态更新方程组表达为式(29)‑(34):ft=σ(Γf·[ht‑1,xt]+Ξφ) (29)φt=σ(Γi·[ht‑1,xt]+Ξφ) (30)at=tanh(Γc·[ht‑1,xt]+Ξc) (31)Ct=f*Ct‑1+φt*at (32)ot=σ(Γo·[ht‑1,xt]+Ξo) (33)ht=or*tanh(Ct) (34)式(29)‑(34)中,xt和ht分别表示输入向量和输出向量,f、φ、o分别表示遗忘门、输入门和输出门,Ct与Ct‑1分别表示上一时刻与当前单元状态,ht‑1与ht分别表示上一时刻与当前隐藏层单元的输出,σ表示sigmoid激活函数,tanh表示正切函数,Γ和Ξ表示权重矩阵和偏差向量。
9.根据权利要求1所述的方法,其特征在于,所述广义回归神经网络的模式层神经元传递函数为:
式(35)中,Υ为模式层神经元传递函数,Ω为网络输入变量;Ωl为第l个神经元对应的学习样本;σ为权值;
求和层对所有模式层神经元的输出进行算术求和,计算公式为:式(36)中,L为神经元总个数;
当连接函数为1,传递函数为:其中,SD为传递函数;
GRNN每个模式的单元输出为:其中,Yi为样本观测值,δ为平滑参数。
10.根据权利要求1所述的方法,其特征在于,将广义回归神经网络构建在果蝇优化算法的基础上,对果蝇位置(Xaris Yaris)进行随机初始化:Xaris=rand Yaris=rand (39)其中,Xaris、Yaris为果蝇未知的横纵坐标,rand代指随机数;
更新各子种群果蝇位置:
其中XjM、YjM为果蝇个体新的位置,Xaxis、Yaxis为更新前果蝇位置的横坐标和纵坐标;式(41)中,w表示惯性权重,Rmax、Rmin为定义域上下限,D为控制参数,maxgen为最大迭代次数,gen表示当前迭代次数;
各子种群果蝇到原点的距离表达式:其中,SjM为味道浓度判断值,DistjM为果蝇个体距离原点的距离,XjM、YjM、ZjM为果蝇位置在三维空间中的坐标;
各子种群果蝇个体适应度表达式为:SmelljM=Function(SjM) (43)其中,SmelljM为味道浓度值,Function为味道浓度判断函数;
计算总群局部最优位置和适应度值:其中,Smellbest为最佳味道浓度值,BestIndex为该果蝇群体中味道浓度最高的果蝇,BestSmell为最佳味道浓度值对应的果蝇位置。