1.一种基于高斯回归算法的K-Means聚类分析车道流量方法,其特征在于,所述方法包括以下步骤:
1)在数据库中获取某交叉路口的过车流量数据表,根据过车数据统计某一规定步长下的时间间隔,将一天划分成N个时段,通过的车辆数集合,记为Pn,单位为车辆数集合;n为1,
2,3……n,计算得到N维的车流量,记为V,其中V(t)代表当前路口t时段的车流量;
2)运用超参数优化的高斯过程回归算法对流量V进行平滑处理,计算过程如下:
2.1)设置初始超参数hyp0=[sf0,ell0,sn0],分别表示高斯核函数的函数标准差、核函数的特征长度尺度、噪声标准偏差,开始进入训练过程;
2.2)为了消除由于横纵坐标差距过大带来的影响,对车流量V进行归一化处理:
2.3)进入第l次迭代过程,首先计算高斯核函数,此处采用时间t和它本身的协方差函数,考虑到噪声的影响,计算公式如式(3):式中:K为协方差矩阵,在此处由于是时间t和其自身的协方差,故矩阵为n维方阵,kij为矩阵内对应的元素,计算公式如下式(4):
2.4)计算边缘函数nlZ,作为超参数优化的目标函数:
式中:L为高斯核函数K的Cholesky分解所得的上三角阵,记作L=chol(K);
2.5)以nlZ为目标函数,采用梯度下降法做超参数优化,若本次迭代结果nlZl不为最优解,则l=l+1,返回步骤2.2重新计算;若本次迭代结果已达到最优,则返回hypl,并跳出循环;
2.6)输入需要预测的时间向量 以hypl为参数,使用训练数据得到的tmax和tmin,重新进行归一化和核函数的运算,得到归一化后的预测时间向量 和高斯核函数
2.7)以式(8)计算回归后的车流函数,并以训练过程中已知的Vmax和Vmin,做反归一化处理,最终得到回归后的车流函数 如式(9)
3)根据得到的车流函数 拟合画出平滑的流量曲线;
4)设定某一最大的迭代次数为n_max,该数值必须大于或等于聚类后能得到的最大簇数,然后基于K-Means聚类算法进行聚类运算,聚类簇数则以给定迭代簇值进行迭代聚类;
5)对于分成的K个簇,以及簇中的每个向量,计算得到他们相应的轮廓系数,对于某簇中的一个点i,计算i向量到所有它属于的簇中的其他点的距离得到a(i),即称为样本i的簇内不相似度,a(i)越小说明样本越该被聚类到该簇中;计算i向量到所有非本身所在簇的点的平均距离b(i),即称为样本i的簇间不相似度,b(i)越大说明样本越不属于其他簇,那么对应的向量i的轮廓系数S(i)就为:可见轮廓系数的值是介于[-1,1],s(i)接近1,则说明样本i聚类合理s(i)接近-1,则说明样本i更应该分类到另外的簇;若s(i)近似为0,则说明样本i在两个簇的边界上,求出所有点的轮廓系数并求出平均值,就是该聚类结果的轮廓系数;
6)在迭代完最大聚类次数n_max之后,对当前簇数值进行处理,得到各个簇值K下的聚类情况,使用轮廓系数法找到迭代聚类之后得到的最佳K值,给定一个阀值f,当两个聚类中心对距离小于该阀值就合并两个簇,相应地簇数值就会减一;若没有小于该阀值的则保持原有的K值;
7)利用轮廓系数法判断得到的相对的最佳聚类簇数值作为新的K值,再以此K值进行基于K-Means聚类的算法,最后输出聚类结果;
8)参考聚类结果给出相应的周最佳调度方案。