欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018101901516
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 信号装置
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于随机森林与聚类算法的道路旅行时间预测方法,其特征在于,包括以下步骤:

1)、根据路网的时空特性,从历史交通数据、天气数据、路网结构关系,以及路段本身属性中提取影响预测结果的相关特征集合V,并构建样本数据集D,其中V={v1,v2,v3,…,vn},样本数据集D的数据结构为:{v1,v2,v3,…,vn,y},vn为特征,n为特征维度,y为预测目标;

2)、对步骤1)中的样本数据集D进行数据清洗和缺失值补充;

3)、利用随机森林算法常用的特征选择方法,对特征集合V与预测目标y进行特征重要性度量,得出V中每个特征与预测目标之间的相关度V′,其中V′={v1′,v2′,v3′,…,vn′},v1′的值越大,说明特征v1与预测目标越相关,此特征越重要,重要的特征被优先选择用于构造随机森林;

4)、利用样本数据集D,构建密度聚类与随机森林混合预测模型;

5)、把与预测路段相关的样本数据X输入到步骤4)构建好的密度聚类与随机森林混合预测模型中,得出最终的预测结果;

所述步骤4)构建密度聚类与随机森林混合预测模型具体包括步骤:

①初始化随机森林中生成回归树T的棵数m和树的深度d;其中T={t1,t2,t3,…,tm},t1表示回归树的序号,m表示生成m棵回归树;

②将步骤2)中获取的样本数据集D,利用Bootstrap方法对数据集D通过有放回的重采样方式生成与建立回归树数目一致的m份样本子集D={D1,D2,…,Dm};

③对m份样本子集分别创建无剪枝的m棵回归树模型,采用最小剩余方差作为选择分裂属性和分裂点的依据,回归树创建后,每棵回归树的叶子节点对应部分样本数据;

④利用密度聚类算法对步骤③中每棵回归树的叶子节点中存在的样本数据进行聚类,此时叶子节点中的样本数据集会形成若干任意形状的类簇C={c1,c2,c3,…,ck},k为类簇的个数,并计算集合C中每个类簇的聚类中心Dc={d1,d2,d3,…,dk},其中d1表示类簇c1的聚类中心。

2.根据权利要求1所述的基于随机森林与聚类算法的道路旅行时间预测方法,其特征在于,所述步骤5)得出最终的预测结果具体包括步骤:①样本X遍历随机森林中的每棵回归树,直至每棵回归树的叶子节点;

②利用欧氏距离公式,分别计算样本X与叶子节点中每一个类簇中心的距离,最后返回与预测样本距离最近的类簇;

③计算②中返回的最相似的类簇中样本目标变量值的均值,作为本棵回归树的预测结果;

④获取每棵回归树的预测结果,取平均值作为随机森林的最终预测结果:

其中,yrf为随机森林的最终预测值,yt1表示第t1棵回归树的预测值。

3.根据权利要求2所述的基于随机森林与聚类算法的道路旅行时间预测方法,其特征在于,所述步骤②考虑到样本属性的权重,通过加权的欧式距离计算样本X与每个聚类中心的距离,通常认为距离值越小的类簇与预测样本越相似;

加权欧式距离公式:

其中,X:预测样本,d:类簇的聚类中心,n:样本维度,V′i:特征相关度。

4.根据权利要求2所述的基于随机森林与聚类算法的道路旅行时间预测方法,其特征在于,所述对m份样本子集分别构建无剪枝的m棵回归树模型,采用最小剩余方差作为选择分裂属性和分裂点的依据,具体包括:首先,遍历样本子集中的每个特征,将每个特征下的数据按从小到大进行排序;其次,将排序后的特征数据依次作为分裂节点,小于该分裂节点的数据进入左分支,大于或等于分裂节点的数据进入右分支,把原来的样本子集划分为两部分数据集;然后,利用最小剩余方差公式分别计算划分前的S值和划分后的左分支的SL值、右分支的SR值,计算S-(SL+SR)的差值,S表示最小剩余方差值,选取满足此差值最大时的特征值作为分裂节点,该分裂节点所在的特征项作为当前的分裂特征;递归执行以上的划分操作,并检验是否满足递归终止条件:树的深度>d的初始值,若满足就停止树的生长,否则让回归树继续生长。

5.根据权利要求4所述的基于随机森林与聚类算法的道路旅行时间预测方法,其特征在于,最小剩余方差公式为:其中,N为每个样本子集中的样本个数,y为预测目标,为预测目标的均值。