欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020108891391
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种负载均衡的用户关联与资源分配方法,其特征在于:首先根据不同用户的服务质量需求以及分布式无线射频头端RRH的当前负载,设计用户收益函数;在保证用户服务质量的前提下,考虑到当前网络状态对用户收益的影响,建立随机博弈模型,然后基于多智能体Q学习算法进行用户关联和资源分配;具体包括以下步骤:

采集用户状态信息和RRH状态信息:用户向RRH发送访问请求,其中包括用户状态信息,RRH将这些信息以及自身状态信息转发到集中控制器;

量化用户收益:集中控制器根据采集到的信息,量化用户不同关联状态下的收益;

最大化网络吞吐量:集中控制器分析计算用户收益和RRH资源分配,构建随机博弈模型,最大化网络吞吐量;

确定用户关联和资源分配策略:在保证用户服务质量的约束条件下,基于多智能体Q学习算法获得用户i与RRHj之间的关联状态和资源分配方案;

所述量化用户不同关联状态下的收益具体为:在时刻t,RRHj可为用户i分配的RB数量req

为 ri (t)为用户i的速率需求,b表示每个RB的带宽,信噪比SINR,SINRi,j(t)为: 其中αi,j(t)为用户的关联状态,满足用户QoS时αi,j(t)=1,否则αi,j(t)=0,为用户分配的功率pi,j(t)=ni,j(t)×pj,hi,j(t)表示用户i与RRHj之间的信道增益, 是用户i和RRHj在t时刻的欧几里德距2

离,路径损耗因子α>2,σ表示白噪声的功率谱密度;量化用户i在t时刻与RRHj关联的收益为

所述最大化网络吞吐量具体为:每个用户在时刻t最多只能关联一个RRH,且一个RB在同一时刻只能为一位用户提供服务, RRH需要为用户足够的带req

宽资源ni,j(t)blog2(1+SINRi,j(t))≥ri (t),满足用户的QoS,根据以上约束将用户关联与资源分配问题抽象为最大化网络吞吐量的问题:所述随机博弈模型具体为:利用有限状态的马尔可夫决策过程MDP,将联合优化问题表述为随机博弈MDP(S,Ai,Pss′,Vi);S是可能的状态集合,Ai表示集合中第i个用户的动作空间,Pss′表示用户从状态s转换为状态s′的概率,Vi是第i个用户的收益;

定义每个用户在时刻t时的状态为s(t)={s1(t),s2(t)...sn(t)};其中si(t)∈{0,1},当si(t)=1时意味着用户i的服务质量QoS需求得到了满足,当si(t)=0时则说明没有满足用户i的QoS;定义每个用户的动作空间Ai={ai,1(t),ai,2(t),...,ai,m(t)},每个用户可能做出的动作数量与当前可关联的RRH数量相同,而且用户当前动作会影响下一时刻的网络状态;在任意时刻t,定义其他n‑1个用户的动作为a‑i(t)={a1(t),...,ai‑1(t),ai+1(t),...an(t)};当用户i采取行动ai(t)时,则用户i在时刻t的收益为vi(t),考虑到其他用户采取的动作a‑i(t),则用户i的在t时刻的收益为定义状态价值函数 是一个期望值,其中γ∈[0,1)是收益衰减因子,π‑i=(π1,...,πi‑1,πi+1,...πn)表示其他用户的策略向量;用户i通过在每个状态下获得最优的策略最优策略 最大化其在t时刻的状态价值函数 其中

并得到最佳Q函数

所述确定用户关联和资源分配策略具体为:用户根据动作选择概率选择动作;计算用户的状态价值函数 计算 并更新Q值表;若经过多次迭代后所有用户的QoS需求得到满足,则根据φi(si,ai)得到各自的集中控制器根据用户关联策略进行资源分配,并将配置信息传送到底层物理网络,实现用户关联和资源分配。

2.根据权利要求1所述的一种负载均衡的用户关联与资源分配方法,其特征在于:所述用户状态信息包括参数:用户坐标、速率请求和关联状态,其中使用二进制变量矩阵α={αi,j(t)∈(0,1)}表示在时刻t用户i与RRHj之间的关联状态,当用户i在时刻t与RRH j关联时αi,j(t)=1,否则αi,j(t)=0;

所述RRH状态信息包括参数:RRH坐标、信道增益和剩余资源块RB数量,其中RRHj拥有的RB为 RRHj的总发射功率是Pj,每个RB的功率为