1.一种风力发电机组变桨距控制方法,其特征在于,该方法包括:将强化学习和滑模变结构控制结合起来,采用滑动模态控制器完成对风电机组桨距角的基本控制,运用Actor-Critic强化学习补偿寻优算法,用来自适应补偿扰动、摄动和系统未建模部分对整体性能的影响,达到优化控制的目的,弥补传统方法基于模型的不足;
通过测量风力机转速反馈与参照速度得出转速偏差,经过状态转换后,作为滑动模态控制器的输入量,控制器根据偏差发出桨距角控制量命令,取滑模面为:s(x)=c1x1+x2,c1为滑模参数,x1,x2为系统状态,设计准滑动模态控制器为:
其中
其中 kβ
为增益系数,ωe为电磁角速度,NP为发电机转子的极对数,ρ为空气的密度,Cp为风能利用系数,B是发电机的摩擦系数,J是风轮发电机整体转动惯量,R为风力机叶片半径,ν为风速,τβ为桨距角响应时间常数,β为实际桨距角,Δ为边界层,λ为叶尖速比,K为系数。
2.根据权利要求1的风力发电机组变桨距控制方法,其特征在于包括:算法结构由两部分组成:动作(Actor)网络和评价(Critic)网络;
Actor-Critic算法中使用RBF网络来逼近动作函数和评价函数,隐层节点基函数使用高斯型核函数,第j个节点的输出为:T
cij=[c1j,c2j]
m为隐层神经元个数,cij为第j个节点的中心向量,bj为宽度,x(t)为网络的输入向量,t为时间;
控制输出由Actor和随机扰动构成,m个节点到Actor和Critic的输出分别定义如下:wa,wc分别为隐层到输出层Actor和Critic的权值;
V(t)为值函数,也就是未来折扣奖赏和,是当前动作对未来环境影响的预测评价信号,V(t)越大表明学习效果越好。
3.根据权利要求1的风力发电机组变桨距控制方法,其特征在于包括:针对系统反馈只有转速的情况将强化信号r(t)设置如下:r(t)=k1r1(t)+k2r2(t)
*
r1(t)为误差信号,r2(t)为误差变化率信号,e(t)是误差,wr是风机转速,wr 是参考转速;k1,k2分别为误差和误差变化率强化信号系数,ε为容许误差带,t为时间;
此种定义的强化信号既可以体现当前的动作是否符合设计要求,还可以与邻近动作进行对比进而修改行为策略。
4.根据权利要求1的风力发电机组变桨距控制方法,其控制系统学习步骤如下:Step1结合风电机组各项特性系数,初始化滑模变结构控制和强化学习各项参数;
Step2利用传感器采得风机转速值,控制系统分别计算滑模变结构控制和强化学习控制输出的控制信号;
Step3将叠加的控制信号作用到桨距角执行机构中;
Step4继续采得风机转速值,得到下一时刻状态变量;
Step5控制器根据内部算法对自身参数进行更新,优化结构;
Step6判断当前控制器是否满足控制要求;
Step7如果满足则控制器学习完毕,否则继续运行Step2;
控制器根据不同的外界环境,通过迭代在线调整控制器参数,实现系统的不断优化。