1.一种磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,包括如下步骤:
S1、构建磁饱和同步发电机稳态运行时内部变量与目标响应值的关系模型;
S2、根据内部变量与目标响应值的关系模型定义计算空间,并在设计空间内构建初始种群;
S3、基于强化学习模型,并动态选择小生境方法划分初始种群,得到当前代子种群和当前代子种群对应的小生境方法;
S4、基于强化学习模型和当前代子种群对应的小生境方法对当前代子种群中的个体进行差分进化,得到当前代子代个体一一对应的适应值和适应值评价总次数;
S5、判断适应值评价总次数是否等于预设值,若是则进入步骤S6,否则返回步骤S3;
S6、将当前子代个体中适应值为零的子代个体作为磁饱和同步发电机稳态运行时内部变量与目标响应值的关系模型的根,完成磁饱和同步发电机稳态运行时内部变量的求解。
2.根据权利要求1所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S2中构建初始种群的表达式如下:其中,xi,j表示初始种群中的个体,xj表示计算空间的下限,randj表示0到1区间的随机数,·表示乘运算, 表示计算空间的上限。
3.根据权利要求1所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S3包括如下步骤:
S31、基于强化学习模型,定义种群多样性的状态、小生境方法和奖励值,并构建种群多样性的状态与小生境方法关系模型;
S32、基于状态与小生境方法关系模型划分初始种群,得到若干代子种群;
S33、利用密度聚类算法比较第p代子种群的数量与第p‑1代子种群数量,得到第p代子种群奖励Rp+1;
S34、根据第p代子种群奖励Rp+1对种群多样性的状态与小生境方法关系模型更新,得到第p代子种群多样性的状态与小生境方法关系模型;
S35、利用第p代子种群多样性的状态与小生境方法关系模型和Softmax模型,得到第p代子种群对应的小生境方法;
S36、判断是否能继续划分种群,若是则将p代子种群的数量作为第p‑1代子种群的数量,并返回步骤S33,否则进入步骤S37;
S37、将第p代子种群作为当前代子种群,并将第p代子种群对应的小生境方法作为当前代子种群对应的小生境方法。
4.根据权利要求3所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S31中种群多样性的状态与小生境方法关系模型的表达式如下:其中,Q(s,a)表示种群多样性奖励值,a表示种群多样性的小生境方法,s表示种群多样性的状态,crowding表示邻域拥挤小生境方法,speciation表示邻域物种小生境方法,Better表示种群多样性为更好状态,Inferior表示种群多样性为更差状态。
5.根据权利要求3所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S34中第p代子种群多样性的状态与小生境方法关系模型表达式如下:其中,Q(sps,apa)表示第p代子种群多样性奖励值,sps表示第p代子种群多样性的状态,apa表示第p代子种群多样性的小生境方法,crowding表示邻域拥挤小生境方法,speciation表示邻域物种小生境方法,Better表示种群多样性为更好状态,Inferior表示种群多样性为更差状态,α和γ分别表示学习率和折扣率,Rp+1表示第p代子种群奖励,Q(sps+1,apa)表示第p代子种群获得的总积累奖励, 表示取最大值,←表示赋值运算,diversity(iter‑
1)表示第p‑1代子种群的数量,diversity(iter)表示第p代子种群的数量。
6.根据权利要求3所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S35中的Softmax模型表达式如下:其中,π(sps,apa)表示邻域拥挤小生境方法和邻域物种小生境方法的分段概率值,Q(sps,apa)表示第p代子种群多样性奖励值,T表示控制参数。
7.根据权利要求1所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S4包括如下步骤:
S41、基于强化学习模型和各代子种群对应的小生境方法,定义当前代子种群中个体的状态、进化方法和奖励值,并构建个体的状态与进化方法关系模型;
S42、通过交叉操作,得到若干子代个体和各子代个体对应的适应值;
S43、通过比较第t代子代个体的适应值与第t‑1代子代个体的适应值,得到第t代子代个体奖励Rt+1;
S44、根据第t代子代个体奖励Rt+1对个体的状态与进化方法关系模型更新,得到第t代子代个体状态与进化方法关系模型;
S45、获取当前适应值评价总次数;
S46、判断是否能继续进行子代划分,若是则将第t代子代个体作为第t‑1代子代个体并返回步骤S43,否则进入步骤S47;
S47、将第t代子代个体的适应值作为当前代子代个体一一对应的适应值,并将当前适应值评价总次数作为适应值评价总次数。
8.根据权利要求7所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S41中个体的状态与进化方法关系模型的表达式如下:其中,Q′(s′,a′)表示个体进化奖励值,s′表示个体进化状态,a′表示个体进化方法,better表示个体为更好状态,inferior表示个体为更差状态,DE/rand/1表示随机进化方法,DE/best/1表示最优进化方法,DE/current‑to‑best/1表示迈向最优进化方法。
9.根据权利要求7所述的磁饱和同步发电机稳态运行时内部变量的求解方法,其特征在于,所述步骤S44中第t代子代个体状态与进化方法关系模型的表达式如下:其中,Q′t(s′ts,a′ta)表示第t代子代个体进化奖励值,s′ts表示第t代子代个体进化状态,a′ta表示第t代子代个体进化方法,better表示个体为更好状态,inferior表示个体为更差状态,DE/rand/1表示随机进化方法,DE/best/1表示最优进化方法,DE/current‑to‑best/1表示迈向最优进化方法,α和γ分别表示学习率和折扣率,Rt+1表示第t代子代个体奖励,Q(s′ts+1,a′ta)表示第t代子代个体获得的总积累奖励, 表示取最大值,←表示赋值运算,f(xt)表示第t代子代个体的适应值,f(xt+1)表示第t+1代子代个体的适应值。
10.一种磁饱和同步发电机稳态运行时内部变量的求解方法的系统,其特征在于,包括:
关系模型构建模块,用于构建磁饱和同步发电机稳态运行时内部变量与目标响应值的关系模型;
初始种群构建模块,用于根据内部变量与目标响应值的关系模型定义计算空间xi,j,并在设计空间内构建初始种群;
种群划分小生境方法获取模块,用于基于强化学习模型,并动态选择小生境方法划分初始种群,得到当前代子种群和当前代子种群对应的小生境方法;
个体适应值和适应值评价总次数获取模块,基于强化学习模型和当前代子种群对应的小生境方法对当前代子种群中的个体进行差分进化,得到当前代子代个体一一对应的适应值和适应值评价总次数;
适应值评价总次数判断模块,用于判断适应值评价总次数是否等于预设值;
磁饱和同步发电机内部变量根获取模块,将当前子代个体中适应值为零的子代个体作为磁饱和同步发电机稳态运行时内部变量与目标响应值的关系模型的根,完成磁饱和同步发电机稳态运行时内部变量的求解。