1.一种用户偏好特征与地理特征融合的行为动机推断方法,其特征在于具体步骤为:(1)提取地理特征与用户偏好特征从高德地图的全国POI数据和用户的互联网行为数据提取地理特征和用户偏好特征源数据;地理特征是以位置为关键字,以POI的类型为变量,经统计、筛选、权重计算三个步骤处理所得;用户偏好特征的获取首先将用户的行为数据分解为包含对象、时间、地点、内容、行为和重返次数六方面内容的单元行为,然后根据以上六要素计算行为权重,最后对数据进行用户兴趣建模,最终构造“用户画像”获取用户偏好特征;
(2)构造地理特征和用户偏好特征集合将第(1)步提取的地理特征和用户偏好特征构造为特征集合,每个特征项由特征标签和特征权重两部分构成,构造地理特征和用户偏好特征集合时,两集合中的特征标签采用统一的规范化短语,集合内的特征项按照权重降序排列;记地理特征集合为Geo,记用户偏好特征集合为Pre,则:
Geo={Geo1,Geo2,Geo3,...,Geom};
Pre={Pre1,Pre2,Pre3,...,Pren};
其中,Geoi={LGeoi,PGeoi},LGeoi代表地理特征标签,PGeoi代表该地理特征的权重;
Prei={Lprei,PPrei},LPrei代表用户偏好特征标签,PPrei代表该用户偏好特征的权重;
(3)求地理特征与用户偏好特征集合的交集对第(2)步构建的地理特征和用户偏好特征集合做求交集处理,具体策略是以特征标签为判断依据,对Geo和Pre两集合中的特征标签做归一化处理,即只保留两者共有的集合元素;设求交集后的地理特征和用户偏好特征集合分别为Geo'和Pre',其计算公式如下Geo'=Geo‑(Geo‑(Geo∩Pre));
Pre'=Pre‑(Pre‑(Geo∩Pre));
(4)求地理特征与用户偏好特征集合的乘积经第(3)步处理后Geo'和Pre'两集合在特征标签和特征项数量上达到了统一,对Geo'和Pre'做乘积运算时只计算两个集合中标签相同的特征权重,计算时标签不变,乘积后的权重为两集合中该标签权重的乘积,最后得到乘积集合Comprehensive如下:Comprehensive=Geo'×Pre'={Com1,Com2,Com3,...,Comk};
其中:
Comi={LComi,PComi}={LGeoi+LPrei,PGeoi×PPrei};
上式中,LGeoi+LPrei代表地理特征与用户偏好特征的综合标签,由于在乘积计算前已经对两集合特征标签做归一化处理,因此,实际表示时取二者任意一个即可,PGeoi×PPrei代表该地理特征与用户偏好特征的综合权重;
在对Geo'和Pre'集合做乘积运算时,为防止特征失真,在两相同特征做乘积时,以两特征之差与两集合平均值之差做比较,若前者大于后者,则该综合特征的权重为两集合中该标签权重较大的值乘以其在两标签中所占的比重再乘以其在偏好集合中的权重,若前者小于等于后者,则该综合特征的权重为两集合中该标签权重的乘积,判断过程如下:①设Geo'和Pre'集合中存在两特征Geoi和Prei,两特征标签内容相同,即LGeoi=LPrei,权重分别为PGeoi和PPrei;
②计算集合Geo'的特征权重平均值为 集合Pre'的特征权重平均值为 当Geo'和Pre'作乘积时,特征Geoi和Prei的综合权重取值如下:其中:
(5)排序及特征筛选
将第(4)步获取的Comprehensive集合按照权重对集合元素进行降序排序,并去除权重较小的特征,即特征筛选,特征筛选的处理流程如下:①计算Comprehensive集合的平均值②特征筛选,若 则保留该特征,若 则剔除该特征;
(6)用户显著行为动机的确定
第(5)步获取的Comprehensive集合中保留的特征即用户的显著行为动机,根据特征权重的大小判断用户行为动机的可能性大小,且特征权重越大,用户行为动机越偏向于该特征,反之,用户特征越背离该特征,从而确定用户显著行为动机,最终实现行为动机的推断。