1.一种位置嵌入解释方法,其特征在于,包括:S10:获取原始数据集,并对所述原始数据集进行预处理,其中,预处理后的原始数据集由多个位置数据和多个位置类别数据组成,每个位置数据对应一个位置类别数据;
S20:获取所述多个位置数据对应的多个位置,其中,每个位置对应至少一个位置数据;
根据所述预处理后的原始数据集中的多个位置上下文序列,利用Skip‑gram模型学习得到多个位置嵌入向量,其中,每个位置对应一个位置嵌入向量;
S30:获得所述多个位置类别数据对应的多个位置类别,其中,每个位置类别对应至少一个位置类别数据;利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中,其中,每个位置类别对应一个位置类别嵌入向量;
S40:按照预定的规则,将每个位置嵌入向量从所述原始向量空间转换到语义向量空间,得到所述每个位置嵌入向量对应的位置语义表示,其中,所述语义向量空间为以M个位置类别为维度的向量空间,M为大于或等于1的整数;
其中,所述预处理后的原始数据集为用户轨迹数据,所述多个位置为所述用户去过的多个地点,所述多个位置类别为用于用户画像的多个语义类别,所述多个位置类别嵌入向量为用于用户画像的多个语义类别嵌入向量;
在步骤S30中,所述利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中,包括:S310:将每个位置上下文序列中的多个位置数据对应的多个位置类别数据作为位置类别的上下文,构造一个位置类别上下文序列;由所述多个位置上下文序列,构造多个位置类别上下文序列;
S320:根据所述多个位置上下文序列和所述多个位置类别上下文序列,利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中;
在步骤S40中,所述预定的规则为:将每个位置嵌入向量与所述M个位置类别之间的相似性分数作为所述每个位置嵌入向量的位置语义表示;
所述位置语义表示为 其中,
其中,Sim(wi,cm)表示给定位置wi与位置类别cm(m=1,…i,…M)之间的相似性评分,cos(wi,cm)表示wi和cm之间的余弦相似度,λ表示一个阈值;
其中, 表示给定位置wi在所述原始向量空间中的位置嵌入向量, 表示位置类别cm在所述原始向量空间中的位置类别嵌入向量。
2.如权利要求1所述的位置嵌入解释方法,其特征在于,在步骤S20中,Skip‑Gram模型训练的目标函数是:其中,wi表示给定位置,wi的上下文序列Su=(w1,...,wi,...),s表示上下文序列,k表示预先定义的上下文窗口大小,wj表示wi前后各k个上下文位置,p(wj|wi)表示在给定位置wi的前提下wi的上下文位置wj出现的概率, 表示给定位置wi及wi的上下文序列Su同时出现的概率;
在步骤S30中,Skip‑Gram模型训练的目标函数是:其中,ci表示给定位置wi对应的位置类别,cj是ci前后各k个的上下文类别,p(cj|wi,ci)表示在给定位置wi及wi对应的类别ci的前提下ci的上下文类别cj出现的概率,表示给定位置wi、wi对应的类别ci以及ci的上下文类别序列同时出现的概率;S表示上下文序列的集合,Nu表示wi的上下文序列Su的长度。
3.如权利要求2所述的位置嵌入解释方法,其特征在于,还包括:S50:利用二进制命中HIT评估方案——位置相似性评价来度量语义相关的两个位置在嵌入空间中的相似性,其中,所述嵌入空间包括所述原始向量空间和所述语义向量空间。
4.如权利要求3所述的位置嵌入解释方法,其特征在于,还包括:S60:对于给定位置wi,选择相似性评分最高的5个位置类别,对所述给定位置wi进行解释。
5.如权利要求3所述的位置嵌入解释方法,其特征在于,还包括:计算每个语义类别对应的语义类别嵌入向量与所述多个位置嵌入向量之间的相似性分数之和;
基于所述相似性分数之和,将所述用户表示为以所述多个语义类别为维度的向量,实现用户画像,其中,所述相似性分数之和为所述用户在所述每个语义类别维度上的值。
6.一种位置嵌入解释装置,其特征在于,包括:数据获取模块,用于获取原始数据集,并对所述原始数据集进行预处理,其中,预处理后的原始数据集由多个位置数据和多个位置类别数据组成,每个位置数据对应一个位置类别数据;
位置嵌入模块,用于获取所述多个位置数据对应的多个位置,其中,每个位置对应至少一个位置数据;根据所述预处理后的原始数据集中的多个位置上下文序列,利用Skip‑gram模型学习得到多个位置嵌入向量,其中,每个位置对应一个位置嵌入向量;
类别嵌入模块,用于获得所述多个位置类别数据对应的多个位置类别,其中,每个位置类别对应至少一个位置类别数据;利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中,其中,每个位置类别对应一个位置类别嵌入向量;
语义表示模块,用于按照预定的规则,将每个位置嵌入向量从所述原始向量空间转换到语义向量空间,得到所述每个位置嵌入向量对应的位置语义表示,其中,所述语义向量空间为以M个位置类别为维度的向量空间,M为大于或等于1的整数;
其中,所述预处理后的原始数据集为用户轨迹数据,所述多个位置为所述用户去过的多个地点,所述多个位置类别为用于用户画像的多个语义类别,所述多个位置类别嵌入向量为用于用户画像的多个语义类别嵌入向量;
所述类别嵌入模块用于通过如下步骤实现所述利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中的功能:
S310:将每个位置上下文序列中的多个位置数据对应的多个位置类别数据作为位置类别的上下文,构造一个位置类别上下文序列;由所述多个位置上下文序列,构造多个位置类别上下文序列;
S320:根据所述多个位置上下文序列和所述多个位置类别上下文序列,利用Skip‑gram模型学习得到多个位置类别嵌入向量,使所述多个位置嵌入向量与所述多个位置类别嵌入向量均位于原始向量空间中;
所述语义表示模块采用的预定的规则为:将每个位置嵌入向量与所述M个位置类别之间的相似性分数作为所述每个位置嵌入向量的位置语义表示;所述位置语义表示为其中,
其中,Sim(wi,cm)表示给定位置wi与位置类别cm(m=1,…i,…M)之间的相似性评分,cos(wi,cm)表示wi和cm之间的余弦相似度,λ表示一个阈值;
其中, 表示给定位置wi在所述原始向量空间中的位置嵌入向量, 表示位置类别cm在所述原始向量空间中的位置类别嵌入向量。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1‑5中任意一项所述的位置嵌入解释方法。
8.一种存储介质,其上存储有计算机可读的程序,其特征在于,该程序被执行时实现如权利要求1‑5中任意一项所述的位置嵌入解释方法。