1.一种面向SDN网络基于Q学习的节能路由方法,其特征在于:该方法包括以下步骤:S1:获取网络流信息,根据源节点和目标节点不同存入任务队列;
S2:为网络流的每个目标节点构建一张Q表并初始化;
S3:从队列中依次取出元素输入对应的Q表,输出下一跳位置;
S4:根据下一跳位置和当前网络状态得到不同的奖励值,依此更新Q表;
S5:重复S3,S4过程直到队列中所有任务都完成,即完成一次训练;
S6:重置队列和网络状态,重复S3~S5过程完成多次训练,得到最终的Q表;
S7:将待处理网络流输入对应Q表,步进得到路由路径,同时比较最终网络状态和初始状态得到网络节点链路开关闭策略。