1.一种基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,其包括以下步骤:
步骤1:建立基于信息可见的MEC系统,所述基于信息可见的MEC系统包括移动设备和MEC服务器,所述移动设备包括本地执行系统、传输系统和决策制定模块,所述本地执行系统包括一个本地CPU和一个任务缓冲区I,所述传输系统包括一个传输单元和一个任务缓冲区II,所述MEC服务器包括一个任务缓冲区III和c个虚拟机;
步骤2:基于所述步骤1中获得的基于信息可见的MEC系统,根据纯阈值策略获得个体最优任务调度策略,具体步骤为:
步骤21:根据任务在所述步骤1中任务缓冲区I中的等待时间和在本地CPU上的执行时间,获得所述任务被分配到本地执行系统接受服务的逗留时间Dlocal和所述任务在本地执行系统中的预期净效益Glocal;
步骤22:根据所述任务在所述步骤1中任务缓冲区II中的等待时间、在传输单元上的传输时间、在MEC服务器上的执行时间和MEC服务器到移动设备的反馈时间,获得所述任务卸载到MEC服务器接受服务的逗留时间DMEC为:式中:j为传输系统中的任务数量,所述任务数量包括当前正在接受服务的任务数和在缓冲区II中等待的任务数;w0为任务在MEC服务器上的平均逗留时间;μ2为传输系统中传输单元的服务速率;
所述任务在MEC服务器中的预期净效益GMEC为:式中:R为任务完成服务后获得的奖励;C为任务在MEC系统中单位时间的逗留成本;
步骤23:基于所述步骤21、步骤22获得的任务在本地执行系统中的预期净效益Glocal、任务在MEC服务器中的预期净效益GMEC,根据纯阈值策略获得个体最优任务调度策略为为本地执行系统中的纯阈值, 为传输系统中的纯阈值,i为本地执行系统中的任务数量,所述任务数量包括当前正在接受服务的任务数和在缓冲区I中等待的任务数;所述个体最优任务调度策略S具体为:
S0、当 时,所述决策制定模块丢弃新到达的任务;
S1、当 或 时,如果Glocal>GMEC,所述决策制定模块将所述新到达的任务分配给所述本地执行系统;
S2、当 或 时,如果Glocal≤GMEC,所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器;
步骤3:基于所述步骤1中获得的基于信息可见的MEC系统,根据最大化净效益的原则获得社会最优任务调度策略,具体为:
当i=n1,j=n2时,n1为本地执行系统中的最大任务数,n2为传输系统中的最大任务数,所述决策制定模块丢弃所述新到达的任务,任务调度策略S为S0;
当i<n1且j<n2时,如果Glocal>GMEC,所述决策制定模块将所述新到达的任务分配给所述本地执行系统,所述任务调度策略S为S1;
当i<n1且j<n2时,如果Glocal≤GMEC,所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器,所述任务调度策略S为S2;
当i<n1且j<n2时,所述本地执行系统的任务有效到达率为λ(1‑δ(i,j)),所述传输系统的任务有效到达率为λδ(i,j),λ为任务有效到达率,λδ(i,j)为任务有效到达率特征函数:
当i<n1且j=n2时,所述决策制定模块将所述新到达的任务分配给所述本地执行系统,所述任务调度策略S为1,所述本地执行系统的任务有效到达率为λ,所述传输系统的任务有效到达率为0;
当i=n1且j<n2时,所述决策制定模块将通过所述传输系统将所述新到达的任务卸载到所述MEC服务器,所述任务调度策略S为2,所述本地执行系统的任务有效到达率为0,所述传输系统的任务有效到达率为λ;
建立具有两个可数分量的二维连续时间马尔可夫链:{(L1(t),L2(t)),t≥0}L1(t)=i(i=0,1,…,n1)L2(t)=j(j=0,1,…,n2)式中:L1(t)为系统水平,表示t时刻本地执行系统中的任务数;L2(t)为系统阶段,表示t时刻传输系统中的任务数;{(L1(t),L2(t)),t≥0}为规则不可约,具有有限的状态空间Ω:Ω={(i,j):0≤i≤n1,0≤j≤n2}稳态下系统水平为i,系统阶段为j时的概率分布πi,j为:式中:P{L1(t)=i,L2(t)=j}为本地执行系统中任务数为i并且传输系统中的任务数为j时的概率;
根据所述πi,j获得系统水平为i时的稳态概率向量πi为:所述二维连续时间马尔可夫链{(L1(t),L2(t)),t≥0}的稳态概率分布Π为:步骤4:根据稳态概率分布和Little定律,获得分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC];基于所述步骤2、步骤3获得的个体最优任务调度策略、社会最优任务调度策略,根据所述分配给本地执行系统的任务的平均逗留时间E[Dlocal]和分配给MEC服务器的任务的平均逗留时间E[DMEC]获得MEC系统中任务的平均逗留时间E[D],基于所述个体最优任务调度策略和社会最优任务调度策略,获得个体最优任务调度策略和社会最优任务调度策略的偏差,根据所述偏差制定任务在MEC系统中额外等待费用的定价方案使所述偏差为0。
2.根据权利要求1所述的基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,获得所述步骤22中任务在MEC服务器上的平均逗留时间w0的具体方法为构建函数g(w):
g(w)=wactual‑w
α=λp2
式中:wactual为任务在MEC服务器上的实际平均逗留时间;w为g(w)函数的自变量;α为任务在MEC服务器上的平均到达率;p2为任务通过传输系统分配给MEC服务器的概率;c为虚拟机个数;ρc为具有c个虚拟机的系统的服务强度;ρ为具有1个虚拟机的系统的服务强度;μ3为MEC服务器中虚拟机的服务速率;x!为x的阶乘。
3.根据权利要求2所述的基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,所述步骤4中获得的分配给本地执行系统的任务的平均逗留时间E[Dlocal]为:式中:p1为任务分配给本地执行系统的概率; 为稳态下系统水平为i,系统阶段为n2时的概率分布;
分配给MEC服务器的任务的平均逗留时间E[DMEC]为:式中:πn1,j为稳态下系统水平为n1,系统阶段为j时的概率分布;
根据所述E[Dlocal]和E[DMEC]获得MEC系统中任务的平均逗留时间E[D]为:E[D]=p1E[Dlocal]+p2E[DMEC]。
4.根据权利要求1所述的基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,所述步骤21中获得的任务被分配到本地执行系统接受服务的逗留时间Dlocal为:式中:μ1为任务在本地执行系统中的本地CPU上的服务率。
5.根据权利要求4所述的基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,所述步骤21中获得的任务在本地执行系统LES中的预期净效益Glocal为:
6.根据权利要求4所述的基于信息可见的MEC系统任务调度策略的博弈优化方法,其特征在于,所述步骤23中获得的个体最优任务调度策略 为:式中: 为不大于x的最大整数解。