1.一种景区游玩路径规划方法,其特征在于,所述方法包括以下步骤:获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;
获取游客特征数据,所述游客特征数据用于表征游客画像信息;
将所述景区环境特征数据和游客特征数据输入至预设的BP神经网络模型中,得到游客兴趣地特征数据;
将所述游客兴趣地特征数据输入至预设的LSTM神经网络模型中,输出预测兴趣地POI值;
根据所述预测兴趣地POI值执行强化学习策略,完成游玩路径规划;
所述根据所述预测兴趣地POI值执行强化学习策略,完成游玩路径规划的步骤,具体包括:初始化环境状态和Q函数各参数、游客初始位置和游客特征数据;
根据Q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束;
获取游客对当前所述动作的满意度,得到真实的POI值;
根据真实的POI值返回即时奖励;
更新景点POI值与游客特征数据,根据神经网络再次输出预测兴趣地POI值;
重复执行动作并计算累计奖励;
判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间;
更新Q函数,输出游玩路径;
所述根据Q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束的步骤,具体包括:定义奖励函数,所述奖励函数为游客去往下一个预测兴趣地时,奖励+Pt,其他动作奖励为0;
定义游客体力恢复时间为timet,参数为mt,其中所述mt为0‑1之间的随机数,则游客恢复的体力为Dt为:Dt=Dt‑1+timet·mt;
设单位距离的体力消耗为0.1,游客执行动作行走距离为st,则游客当前体力值为:Zt=Zt‑1‑st·0.1+Dt。
2.根据权利要求1所述的方法,其特征在于,所述获取游客特征数据,所述游客特征数据用于表征游客画像信息的步骤,具体包括:向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人群关系、收入和喜好指标的一种或多种;
接收移动设备反馈的特征问询响应;
根据所述特征问询响应生成游客特征数据。
3.根据权利要求1所述的方法,其特征在于,将所述景区环境特征数据和游客特征数据输入至预设的BP神经网络模型中,得到游客兴趣地特征数据的步骤之后,还执行:根据所述LSTM神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程;
对所述误差方程执行梯度下降策略;
根据所述误差方程梯度下降结果反向优化BP神经网络模型。
4.一种景区游玩路径规划系统,其特征在于,所述系统包括:景区环境特征数据获取模块,用于获取景区环境特征数据,所述景区环境特征数据至少包括含有景点属性的地图信息;
游客特征数据获取模块,用于获取游客特征数据,所述游客特征数据用于表征游客画像信息;
游客兴趣地特征数据获取模块,用于将所述景区环境特征数据和游客特征数据输入至预设的BP神经网络模型中,得到游客兴趣地特征数据;
预测兴趣地POI值输出模块,用于将所述游客兴趣地特征数据输入至预设的LSTM神经网络模型中,输出预测兴趣地POI值;以及游玩路径规划模块,用于根据所述预测兴趣地POI值执行强化学习策略,完成游玩路径规划;
所述游玩路径规划模块包括:
初始单元,用于初始化环境状态和Q函数各参数、游客初始位置和游客特征数据;
动作执行单元,用于根据Q函数执行动作并更新游客体力值,动作空间包括去往下一个兴趣景点、原地休息和结束;
真实POI值获取单元,用于获取游客对当前所述动作的满意度,得到真实的POI值;
即时奖励计算单元,用于根据真实的POI值返回即时奖励;
数据更新单元,用于更新景点POI值与游客特征数据,根据神经网络再次输出预测兴趣地POI值;
迭代单元,用于重复执行动作并计算累计奖励;
判定单元,用于判定是否满足结束条件,所述结束条件为游客体力值低于设定阈值或步数超过设定阈值或到达闭馆时间;
结果输出单元,用于更新Q函数,输出游玩路径;
所述动作执行单元包括:
奖励函数定义子单元,用于定义奖励函数,所述奖励函数为游客去往下一个预测兴趣地时,奖励+Pt,其他动作奖励为0;
游客体力恢复计算子单元,用于计算游客恢复的体力,定义游客体力恢复时间为timet,参数为mt,其中所述mt为0‑1之间的随机数,则游客恢复的体力为Dt为:Dt=Dt‑1+timet·mt;
游客当前体力值计算子单元,用于计算游客当前体力值,设单位距离的体力消耗为
0.1,游客执行动作行走距离为st,则游客当前体力值为:Zt=Zt‑1‑st·0.1+Dt。
5.根据权利要求4所述的景区游玩路径规划系统,其特征在于,所述游客特征数据获取模块包括:特征问询请求发送单元,用于向设定范围内的移动设备发送特征问询请求,所述特征问询请求中包含有年龄、人群关系、收入和喜好指标的一种或多种;
特征问询响应接收单元,用于接收移动设备反馈的特征问询响应;以及游客特征数据生成单元,用于根据所述特征问询响应生成游客特征数据。
6.根据权利要求4所述的景区游玩路径规划系统,其特征在于,还包括:误差确定单元,用于根据所述LSTM神经网络模型的输出结果,确定所述输出结果与真实兴趣地的误差方程;
策略执行单元,用于对所述误差方程执行梯度下降策略;
反向优化单元,用于根据所述误差方程梯度下降结果反向优化BP神经网络模型。