欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020113195126
申请人: 广西大学
专利类型:发明专利
专利状态:已下证
专利领域: 发电、变电或配电
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,该方法将分布式结构和可拓展量子深宽度学习方法相结合,通过各区域电压控制器间的信息交流以实现对全网电压的实时控制,能在满足电压控制精度的情况下降低对通信技术的要求,减轻控制器的计算负担并保持各区域电力系统信息的隐私性;所提方法在使用过程中的主要步骤为:

步骤(1):将训练数据输入到可拓展量子深宽度神经网络中进行训练;

步骤(2):用训练好的可拓展量子深宽度神经网络拟合可拓展量子深宽度学习方法的四个网络,并使用训练数据对可拓展量子深宽度学习方法进行训练;

步骤(3):通过分布式结构实现电力系统电压的实时全局最优控制。

2.如权利要求1所述的一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,所述步骤(1)中将可拓展量子深宽度神经网络的输入随机分配到深度部分和宽度部分,并引入量子力学中的密度矩阵ρ以更准确地描述输入数据的状态,以此达到最优输入数据分配的目的,所提方法的输入数据分配方式为式中,X1为深度部分的输入数据;X2为宽度部分的输入数据;X为可拓展量子深宽度神经网络的输入;λ为分布因数,取值范围为[0,1];ρ为密度矩阵,可由下式计算式中,|ψi>和pi分别表示量子态的纯态和该纯态相应的概率;

最后,可以得到可拓展量子深宽度神经网络的输出Y为式中,Y表示可拓展量子深宽度神经网络的输出;Y1和Y2分别表示深度部分和宽度部分L L‑1

的输出;f(g)表示激活函数;W1为深度部分第L层的权值矩阵;a 表示第(L‑1)层隐含层的L n m

输出;b表示第L层的偏差值矩阵;Z =[Z1,K,Zn]表示所有的特征节点矩阵;H =[H1,K,Hm]表示所有的增强节点矩阵;W2表示宽度部分的连接权重矩阵。

3.如权利要求1所述的一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,所述步骤(2)中提出的可拓展量子深宽度学习方法使用可拓展量子深宽度神经网络对深度确定性策略梯度方法结构中的四个网络分别进行拟合,并使用参数θ对各个网络分别进行参数化;动作网络主要用来生成一个确定性的动作策略以生成确定的动作,而评价网络主要用来模拟真实的价值函数Q以指导动作策略的更新;智能体的动作a由策略函数μ

π确定;已知环境的瞬时状态st、智能体的动作at和由参数化的动作当前网络θ生成的确定性动作策略μ,可得价值函数Q为式中,E[g]表示期望值;r(st,at)表示在状态st和动作at下获得的奖励;γ表示贝尔曼方程中的折扣因子;Ψ表示与状态st+1和奖励rt相对应的期望值分布;

Q Q

价值函数Q由评价当前网络θ近似表示,评价当前网络θ的损失为贝尔曼方程等号两边的差值,该损失可以表示为

Q ψ

式中,L(θ)表示价值函数Q的损失值;E[g]表示期望值;ρ表示状态st在当前确定性策Q

略ψ下的分布;ψ表示当前确定性动作策略;Ψ表示奖励rt对应的期望值分布;Q(st,at|θ)表Q

示评价当前网络θ在状态st和动作at下的价值函数;yt可表示为Q

yt=r(st,at)+γQ(st+1,μ(st+1)|θ)Q

式中,r(st,at)表示在状态st和动作at下获得的奖励值;Q(st+1,μ(st+1)|θ)表示评价当Q

前网络θ在状态st+1和动作μ(st+1)下的价值函数;

动作网络通过评价网络提供的时序差分误差更新策略,策略的梯度更新可表示为ψ

式中, 表示策略的梯度值;E[g]表示期望值;ρ表示状态st在当前确定性策略ψ下Q

的分布; 表示评价当前网络θ在状态st和动作μ(st)下的价值函数梯μ

度值; 表示动作当前网络θ在状态st下的动作梯度值;

在完成一次训练过程之后,需要对目标网络进行软更新,软更新过程如下Q' Q Q'

θ ←τθ+(1‑τ)θ

μ' μ μ'

θ ←τθ+(1‑τ)θ

Q Q' μ μ'

式中,θ、θ 、θ和θ 分别表示评价当前网络、评价目标网络、动作当前网络和动作目标网络;τ表示一个[0,1]内的数值很小的常数。

4.如权利要求所述的一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,所述步骤(3)中的分布式结构将电力系统划分为N个区域电力系统,并为每个区域电力系统都配备了一个区域电压控制器,每个区域电压控制器分别负责指导相应区域的一级电压控制器发生电压控制动作;经过各区域电压控制器的多次交流和快速调整,电力系统各条区域间联络线均达成一致性协议,实现电力系统电压的全局最优控制;一致性协议为式中,ui表示第i条区域间联络线的电压值;Ki和Kij为常数反馈增益矩阵;x表示区域内的所有可控变量;i和j分别表示第i个和第j个区域电力系统;N表示划分的区域电力系统的数量。