1.基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,具体包括以下步骤:步骤1)、利用区块链技术,构建一个基于区块链的车联网系统框架(BVNS);
步骤2)、在基于区块链的车联网系统中,对车联网中车辆节点通信行为进行量化。即对车联网中车辆节点的通信行为进行分类。并对采取不同通信行为,奖励不同的收益;
步骤3)、根据获取车辆节点历史收益和其相邻车辆节点的平均历史收益,计算车辆节点Vi的变更通信行为博弈策略的概率pi;
步骤4)、RSU组建两个策略学习对象集,并将合适的对象集发送给需要变更通信行为博弈策略的车辆节点;
步骤5)、车辆节点变更通信行为博弈策略后,将变更后的通信行为策略反馈给RSU,RSU验证信息的真实性后,将该信息添加到区块链网络中。
2.根据权利要求1所述的基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,步骤1)具体包括以下步骤:
利用区块链技术,构建一个基于区块链的车联网系统框架(BVNS)。如图1所示,该系统框架可分为两层结构:物理层和网络层。
物理层:主要由道路基础设施,车辆(Vn),路边单元(RSU)等组成,构成车联网的基础。
网络层:网络中主要有两种节点,路边单元节点(RSU)和车辆节点(Vn)。其中车辆Vn=(v1,v2,...vn)具有与RSU进行通信的车载单元(OBU);RSU主要负责车辆节点与RSU之间的通信管理、记录车辆间的通信事务、监督车辆的通信行为、指导车辆行为策略的变更等;RSU与RSU之间构成区块链网络,负责存储通信事务于区块链中。
3.根据权利要求1所述的基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,步骤2)具体包括以下步骤:
a、车联网中车辆节点Vi的通信行为可以分为3大类:主动通信行为(AC‑Behavior):车联网中车辆节点Vi通过对外界的感知和分析,然后发送信息给其他节点的行为;被动通信行为(PC‑Behavior):车联网中车辆节点Vi转发来自其他节点信息的行为;拒绝通信行为(DC‑Behavior):车联网中车辆节点Vi拒绝转发来自其他节点信息的行为。当车辆节点Vi选择不同通信行为时,可以得到不同的收益。
b、假设车联网中有N个车辆节点,其中任意车辆节点Vi进行一次通信。当车辆节点Vi采取主动通信行为时,车辆节点Vi将消耗资源S,收到的回报为R1,该行为的总收益R1‑S。当车辆节点Vi采取被动通信行为时,车辆节点Vi将消耗资源S,收到的回报为R2,该行为的总收益R2‑S,其中,0<S<R2<R1<1。当车辆节点Vi采取拒绝通信行为时,车辆节点Vi将不消耗资源,即消耗资源为0;同时收到的回报也为0;该行为的总收益0。
4.根据权利要求1所述的基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,步骤3)具体包括以下步骤:
根据车辆节点Vi采取不同通信行为策略,获得不同的收益,计算车辆节点Vi的变更通信行为博弈策略的概率pi。如公式(1):其中,Ui表示车辆节点Vi在T时间段内博弈策略下的累计收益;表示相邻车辆节点Vk的历史博弈收益的均值。
相邻车辆节点Vk的历史博弈收益的均值 如公式(2):当pi>0.5时,认为该节点有较强趋势变更自身通信行为策略。
5.根据权利要求1所述的基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,步骤4)具体包括以下步骤:
a、RSU筛选两个策略学习的对象集A=[VA1,VA2,...,VAk]和B=[VB1,VB2,...,VBk]。分别是以主动通信行为策略为主要收益的节点对象集A;以被动通信行为策略为主要收益的节点对象集B。对象集A和B满足以下两个基本条件:①对象集A或B中任意车辆节点Vk的历史收益Uk需要大于车联网中车辆节点的平均历史收益UALL。如公式(3):
Uk≥UALL (3)
其中计算UALL车联网中车辆节点的平均历史收益,如公式(4):其中Rm表示对应车辆节点Vm的历史收益。m=1,2,...n。
②对象集A或B中同一车辆节点Vk最近两次通信后变更策略的概率没有增加。如公式(5):
其中 表示车辆节点Vk在第m次通信后变更策略的概率; 表示车辆节点Vk在第m‑1次通信后变更策略的概率。这两个条件为了防止选中对象集中车辆节点正在向着变更通信行为策略的方向发展。
b、RSU对车辆节点Vi的历史通信行为进行分析。若车辆节点Vi的历史通信行为主要是AC‑Behavior,则RSU给车辆节点Vi发送节点对象集B作为变更通信行为策略的学习对象集;
若车辆节点Vi的历史通信行为主要是PC‑Behavior,则RSU给车辆节点Vi发送节点对象集A作为变更通信行为策略的学习对象集;若车辆节点Vi的历史通信行为主要是DC‑Behavior,则RSU向车辆节点Vi发送对象集A和对象集B作为变更通信行为策略的学习对象集,并向车辆节点Vi发送强制变更通信行为策略的指令。
6.根据权利要求1所述的基于区块链的车联网车辆通信行为模仿博弈策略,其特征在于,步骤5)具体包括以下步骤:
a、车辆节点Vi收到来自RSU的学习对象集后,车辆节点Vi将在下一通信发生之前,随机选取对象集中某一节点进行策略学习,改变自身行为通信策略,并在随后T时间内保持现有策略不变。
b、随后,车辆节点Vi根据学习对象集变更通信行为策略后,将自身变更后的通信行为策略反馈给RSU,RSU验证信息的真实性后,将该信息添加到区块链网络中。