1.针对机器鱼的高阶迭代自学习控制方法,其特征在于,包括以下步骤:构建第一控制增益集合,所述第一控制增益集合包括N个控制增益元素,每个所述控制增益元素包括M个控制增益以及每个控制增益元素各自对应的一个元素适应度;M和N均为正整数;
对所述第一控制增益集合中的控制增益元素进行择优迭代得到目标控制增益集合,并将所述目标控制增益集合中适应度最高的控制增益元素中的M个控制增益作为目标控制增益进行输出;
根据所述目标控制增益、第一控制输入推力和第一跟踪误差进行高阶迭代计算得到目标控制输入推力,并根据所述目标控制输入推力控制机器鱼进行摆动,以获得期望速度;所述第一控制输入推力的初始值为预设值,所述第一跟踪误差根据摆动速度和期望速度计算得到。
2.根据权利要求1所述的针对机器鱼的高阶迭代自学习控制方法,其特征在于,每个所述控制增益元素各自对应的一个适应度是根据所述控制增益和所述第一跟踪误差计算而获得,具体为:
获取待计算的控制增益元素;
根据所述待计算的控制增益元素中M个控制增益和第一跟踪误差计算得到第二控制输入推力;
根据所述第二控制输入推力控制所述机器鱼进行摆动,以获得摆动速度,根据所述摆动速度和期望速度的差值得到第二跟踪误差的绝对值之和;
根据预设的第一阈值和所述第二跟踪误差的绝对值之和的差值得到所述待计算的控制增益元素的适应度。
3.根据权利要求2所述的针对机器鱼的高阶迭代自学习控制方法,其特征在于,对所述第一控制增益集合中的控制增益元素进行择优迭代得到目标控制增益集合,具体包括:对所述第一控制增益集合进行扩充:依次对所述第一控制增益集合中的控制增益元素进行判断,选择出满足第一预设条件的控制增益元素,并对所述满足预设条件的控制增益元素进行交叉算子和变异算子计算,获得用于扩充所述第一控制增益集合的多个新的控制增益元素,并将所述多个新的控制增益元素添加到所述第一控制增益集合;
对所述第一控制增益集合进行择优保留:根据第二预设条件对扩充后的第一控制增益集合中的所有控制增益元素进行择优保留,得到优化后的第一控制增益集合,直到迭代次数满足预设第二阈值,将所述第一控制增益集合作为目标控制增益集合进行输出。
4.根据权利要求3所述的针对机器鱼的高阶迭代自学习控制方法,其特征在于,根据第二预设条件对扩充后的第一控制增益集合中的所有控制增益元素进行择优保留,得到优化后的第一控制增益集合,具体为:
根据轮盘赌策略和精英保留策略对所述扩充后的第一控制增益集合中的控制增益元素进行选择,得到优化后的第一控制增益集合。
5.根据权利要求4所述的针对机器鱼的高阶迭代自学习控制方法,其特征在于,根据所述目标控制增益、第一控制输入推力和第一跟踪误差进行高阶迭代计算得到目标控制输入推力,具体为:
根据所述目标控制增益、所述第一控制输入推力和所述第一跟踪误差,迭代计算目标控制输入推力,每次迭代计算均根据当前的目标控制输入推力控制所述机器鱼进行摆动,继而获得目标跟踪误差,并根据当前的目标跟踪误差和目标控制输入推力更新所述第一控制输入推力和所述第一跟踪误差,直到所述目标跟踪误差满足预设的指标条件时,输出当前的目标控制输入推力。
6.根据权利要求1至5任一项所述的针对机器鱼的高阶迭代自学习控制方法,其特征在于,根据所述目标控制输入推力控制机器鱼进行摆动,以获得期望速度,具体为根据目标控制输入推力序列控制机器鱼进行摆动,以获得期望速度序列,继而实现期望运动轨迹。
7.一种针对机器鱼的高阶迭代自学习控制装置,其特征在于,包括:控制增益初始化模块、目标控制增益计算模块和目标控制输入推力计算模块;
其中,所述控制增益初始化模块用于构建第一控制增益集合,所述第一控制增益集合包括N个控制增益元素,每个所述控制增益元素包括M个控制增益以及每个控制增益元素各自对应的一个元素适应度;M和N均为正整数;
所述目标控制增益计算模块用于对所述第一控制增益集合中的控制增益元素进行择优迭代得到目标控制增益集合,并将所述目标控制增益集合中适应度最高的控制增益元素中的M个控制增益作为目标控制增益进行输出;
所述目标控制输入推力计算模块用于根据所述目标控制增益、第一控制输入推力和第一跟踪误差进行高阶迭代计算得到目标控制输入推力,并根据所述目标控制输入推力控制机器鱼进行摆动,以获得期望速度;所述第一控制输入推力的初始值为预设值,所述第一跟踪误差根据摆动速度和期望速度计算得到。
8.根据权利要求7所述的针对机器鱼的高阶迭代自学习控制装置,其特征在于,所述控制增益初始化模块中,每个所述控制增益元素各自对应的一个适应度是根据所述控制增益和所述第一跟踪误差计算而获得,具体为:获取待计算的控制增益元素;
根据所述待计算的控制增益元素中M个控制增益和第一跟踪误差计算得到第二控制输入推力;
根据所述第二控制输入推力控制所述机器鱼进行摆动,以获得摆动速度,根据所述摆动速度和期望速度的差值得到第二跟踪误差的绝对值之和;
根据预设的第一阈值和所述第二跟踪误差的绝对值之和的差值得到所述待计算的控制增益元素的适应度。
9.根据权利要求7或8所述的针对机器鱼的高阶迭代自学习控制装置,其特征在于,在目标控制增益计算模块,对所述第一控制增益集合中的控制增益元素进行择优迭代得到目标控制增益集合,具体包括:
对所述第一控制增益集合进行扩充:依次对所述第一控制增益集合中的控制增益元素进行判断,选择出满足第一预设条件的控制增益元素,并对所述满足预设条件的控制增益元素进行交叉算子和变异算子计算,获得用于扩充所述第一控制增益集合的多个新的控制增益元素,并将所述新的控制增益元素添加到所述第一控制增益集合;
对所述第一控制增益集合进行择优保留:根据第二预设条件对扩充后的第一控制增益集合中的所有控制增益元素进行择优保留,得到优化后的第一控制增益集合,直到迭代次数满足预设第二阈值,将所述第一控制增益集合作为目标控制增益集合进行输出。
10.一种可读存储介质,其特征在于,所述可读存储介质包括存储的计算机程序,所述计算机程序执行时,控制所述可读存储介质所在的设备执行如权利要求1至6中任意一项所述的针对机器鱼的高阶迭代自学习控制方法。