1.一种车联网联邦学习中的车辆选择方法,其特征在于:包括:在车联网联邦学习场景中,假设一组车辆{1,2,...,N}穿过基站的覆盖区域,根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与联邦学习的车辆;
其中,所述车辆的本地模型基于基站的全局模型构建;
所述车联网联邦学习包括:
车辆选择:在一轮迭代开始前,基站的边缘服务器首先根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与训练的车辆;
下载全局模型:选择好参与训练的车辆,边缘服务器将初始全局模型发送到所选车辆,用于参与训练的车辆进行分布式学习;
本地模型训练:参与训练的车辆根据自身的本地数据集训练初始全局模型,并采用联邦随机梯度下降对初始全局模型进行更新,得到本地模型;
上传本地模型:参与训练的车辆将自身的本地模型发送到边缘服务器;
全局聚合:边缘服务器接收参与训练的车辆的本地模型,并聚合本地模型的参数以更新初始全局模型;
经过若干次迭代,直至全局模型收敛;
所述基站的边缘服务器首先根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与训练的车辆,方法包括:假设边缘服务器的覆盖区域半径为RB,以基站为原点,车辆行驶方向为x轴建立直角坐标系,车辆n的当前x轴坐标为xn,车辆n的行驶速度为vn,则计算车辆n在基站覆盖范围内的预计停留时间;
根据车辆n在基站覆盖范围内的预计停留时间,在覆盖区域o中,通过定义必要性 来判断车辆n是否参与本轮迭代,其中,所述必要性 与模型相似性和车辆停留时间相关;
基于所述必要性 定义ξn,通过所述ξn来决策车辆n是否参与训练;
所述计算车辆n在基站覆盖范围内的预计停留时间,公式为:其中,(RB‑xn)/vn是车辆n从当前位置到离开基站覆盖范围所经过的时间,χ1,χ2是根据实际城市交通环境确定的系数,go是边缘服务器的覆盖区域o每小时的当前交通量,Go是边缘服务器的覆盖区域o每小时的最大容量;
所述必要性 的公式为:
其中,wn是车辆n存储的本地模型参数, 为边缘服务器的覆盖区域o的最新全局模型*参数, 为本地模型与全局模型的绝对模型差值,To 是聚合轮的平均间隔且是车辆n在基站覆盖范围内的预计停留时间且 αn和βn都是归一化指标,αn∈[0,1],βn∈[‑1,1];
所述基于所述必要性 定义ξn,通过所述ξn来决策车辆n是否参与训练,公式为:其中, 是边缘服务器的覆盖区域o的决策阈值。
2.根据权利要求1所述的车联网联邦学习中的车辆选择方法,其特征在于:所述参与训练的车辆根据自身的本地数据集训练初始全局模型时,还包括:获取车辆n处训练时的本地损失函数Fn(w),根据所述车辆n处训练时的本地损失函数构建全局损失函数F(w),并计算使所述全局损失函数F(w)最小化的全局模型参数向量w,表示为:其中, w表示全局模型参数向量,Fn(w)表示车辆n处训练时的本地损失函数,n∈[N], Dn表示车辆n处的本地数据集,|Dn|=D为本地数据集的大小,f(w,πx)是由学习任务定义的经验损失函数,并量化样本πx处全局模型参数向量w的损失。
3.根据权利要求1所述的车联网联邦学习中的车辆选择方法,其特征在于:所述参与联邦学习的车辆n的总延迟公式为:其中, 表示传输延迟且 ζ表示参与车辆n的接收到边缘服务器下发的初始全局模型大小, 表示参与车辆n的传输速率,r表示通信轮次, 表示车辆n训练其本地模型的本地计算延迟且 τ是本地迭代的次数,φn表示处理一个样本所需的CPU周期数,φnD表示第r轮中处理所有样本所需的CPU周期数,fn是CPU频率。
4.根据权利要求1所述的车联网联邦学习中的车辆选择方法,其特征在于:车辆n∈[N]穿过基站的覆盖区域的车辆速度由概率密度函数生成,所述概率密度函数公式为:其中,是平均速度,σ是车辆速度的标准差, 是高斯误差函数,vmin和vmax分别表示车辆的最小和最大速度,vn是车辆速度且vmin≤vn≤vmax。
5.一种车联网联邦学习中的车辆选择系统,其特征在于:包括:车辆选择模块:用于在车联网联邦学习场景中,假设一组车辆{1,2,...,N}穿过基站的覆盖区域,根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与联邦学习的车辆;
其中,所述车辆的本地模型基于基站的全局模型构建;
所述车联网联邦学习包括:
车辆选择:在一轮迭代开始前,基站的边缘服务器首先根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与训练的车辆;
下载全局模型:选择好参与训练的车辆,边缘服务器将初始全局模型发送到所选车辆,用于参与训练的车辆进行分布式学习;
本地模型训练:参与训练的车辆根据自身的本地数据集训练初始全局模型,并采用联邦随机梯度下降对初始全局模型进行更新,得到本地模型;
上传本地模型:参与训练的车辆将自身的本地模型发送到边缘服务器;
全局聚合:边缘服务器接收参与训练的车辆的本地模型,并聚合本地模型的参数以更新初始全局模型;
经过若干次迭代,直至全局模型收敛;
所述基站的边缘服务器首先根据车辆在基站覆盖区域内的停留时间、以及车辆的本地模型与基站的全局模型之间的相似性选择参与训练的车辆,方法包括:假设边缘服务器的覆盖区域半径为RB,以基站为原点,车辆行驶方向为x轴建立直角坐标系,车辆n的当前x轴坐标为xn,车辆n的行驶速度为vn,则计算车辆n在基站覆盖范围内的预计停留时间;
根据车辆n在基站覆盖范围内的预计停留时间,在覆盖区域o中,通过定义必要性 来判断车辆n是否参与本轮迭代,其中,所述必要性 与模型相似性和车辆停留时间相关;
基于所述必要性 定义ξn,通过所述ξn来决策车辆n是否参与训练;
所述计算车辆n在基站覆盖范围内的预计停留时间,公式为:其中,(RB‑xn)/vn是车辆n从当前位置到离开基站覆盖范围所经过的时间,χ1,χ2是根据实际城市交通环境确定的系数,go是边缘服务器的覆盖区域o每小时的当前交通量,Go是边缘服务器的覆盖区域o每小时的最大容量;
所述必要性 的公式为:
其中,wn是车辆n存储的本地模型参数, 为边缘服务器的覆盖区域o的最新全局模型*参数, 为本地模型与全局模型的绝对模型差值,To 是聚合轮的平均间隔且是车辆n在基站覆盖范围内的预计停留时间且 αn和βn都是归一化指标,αn∈[0,1],βn∈[‑1,1];
所述基于所述必要性 定义ξn,通过所述ξn来决策车辆n是否参与训练,公式为:其中, 是边缘服务器的覆盖区域o的决策阈值。