1.基于多模态特征的互联网广告效果测评方法,其特征是,包括:
步骤(1):采集各项数据:采集用户的个人基本信息及认知方式,用户在浏览互联网网页过程中产生的多模态行为特征以及用户对广告的记忆程度信息;
步骤(2):数据分析与特征提取:根据所述采集的数据,通过特征相关性分析筛选特征,进行特征融合;
步骤(3):建立广告记忆力模型:挖掘用户的浏览模式,将用户的浏览模式融合步骤(2)得到的特征,构建广告记忆力模型;
步骤(4):利用已经建立好的广告记忆力模型计算用户对广告的记忆程度,从而对互联网广告效果进行测评。
2.如权利要求1所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(1)中,采集各项数据的步骤为:步骤(1-1):采集用户自身特征,所述用户自身特征包括:姓名、年龄、性别、用户认知方式;所述用户的认知方式通过镶嵌图形测验获得;
步骤(1-2):采集广告自身特征,所述广告自身特征,包括:广告的尺寸和广告的位置;
步骤(1-3):采集眼动行为特征:利用眼动追踪方式,在用户浏览互联网网页过程中佩戴眼动仪来获取用户的眼动行为特征;
步骤(1-4):采集鼠标行为特征:在互联网网页内嵌入用于记录鼠标轨迹的Javascript代码来获得用户浏览网页过程中的点击广告区域的鼠标行为特征;
步骤(1-5):采集广告记忆程度:每个网页浏览结束后,对用户进行广告记忆测试,得到用户的广告记忆程度。
3.如权利要求2所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(1-5)中,广告记忆程度划分为:“A:肯定看到”,“B:似乎已经看到”,“C:似乎没有看到”,“D:肯定没有看到”,四个等级。
4.如权利要求1所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(2)中,数据分析与特征提取的步骤为:步骤(2-1):特征初步筛选:通过相关性分析的方式从用户自身特征、广告自身特征、眼动行为特征和鼠标行为特征中筛选与广告记忆程度在额定显著性水平下显著相关性的特征;
步骤(2-2):特征相关性分析:对步骤(2-1)筛选后的特征进行特征间相关性分析,去除特征间相关性低的特征;
步骤(2-3):特征降维:对经过步骤(2-2)处理后的特征进行特征融合,从而降低特征维数,去除数据噪声。
5.如权利要求1所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(3)中,建立广告记忆力模型的步骤为:步骤(3-1):频繁浏览模式挖掘:计算用户在搜索引擎结果页内的频繁浏览模式序列;
步骤(3-2):模型建立:根据步骤(2)得到的特征,结合步骤(3-1)的浏览模式序列,采用Random Forest算法建立广告记忆力模型。
6.如权利要求5所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(3-1)的步骤为:步骤(3-1-1):依照广告位置对步骤(1)采集的数据进行分类,针对每个广告位置根据采集到的用户进入每条链接区域内时间的先后顺序进行排列,每个用户查看每个网页中检索链接的顺序都对应一条浏览模式序列Qi;
步骤(3-1-2):为步骤(3-1-1)得到的所有数据添加三个属性并初始化:被采纳长度l=(l1,l2,...,lp)、元素的支持度S=(s1,s2,...,sp),设定的频繁度阈值s;l1=0,s1=0;
步骤(3-1-3):计算序列首元素的支持度sj,若序列首元素的支持度sj小于设定的频繁度阈值s,则令序列首元素的支持度sj=0,并剔除当前序列;
步骤(3-1-4):对剩余序列按照首元素值从大到小进行排序,创建与排序后每个首元素相对应的队列G1,G2,...,Gt,将序列按类别进入到不同队列中,并删除每个序列首元素;
步骤(3-1-5):更新序列的l和S属性,其中lj+1=lj+1,sj+1=s;
步骤(3-1-6):重复步骤(3-1-3)和(3-1-4),直至每个序列中的元素都以支持度等于0结束为止;
步骤(3-1-7):计算每个序列的得分Fi=li*si,从Fi中找到最大得分maxFi,最大得分对应的序列为频繁浏览模式序列,输出浏览模式序列Qi,否则,判定序列为非频繁浏览模式序列。
7.如权利要求6所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述元素的支持度为任一元素在不同序列中的同一个位置出现的次数;
所述被采纳长度为任一序列中,从首元素开始算起,元素的支持度大于设定的频繁度阈值的个数。
8.如权利要求5所述的基于多模态特征的互联网广告效果测评方法,其特征是,所述步骤(3-2)的步骤为:步骤(3-2-1):根据挖掘出的频繁浏览模式序列,筛选出所述步骤(1)收集到的数据集中包含频繁浏览模式序列的数据项;
步骤(3-2-2):根据步骤(2-3)所得到的特征,使用Random Forest算法计算出所有用户在每个互联网网页内概率值最大的广告记忆程度;
步骤(3-2-3):根据步骤(2-3)所得到的特征,使用Random Forest算法计算出具有频繁浏览模式序列的数据项在每个互联网网页内的概率值最大的广告记忆程度;
步骤(3-2-4):对比同一用户查看每个网页的数据项经过步骤(3-2-2)计算所得概率值最大的广告记忆程度和经过步骤(3-2-3)计算所得概率值最大的广告记忆程度,以两者概率值大的广告记忆程度更新步骤(3-2-2)获得的结果。
9.基于多模态特征的互联网广告效果测评系统,其特征是,包括:存储器、处理器以及存储在存储器上,并在处理器上运行的计算机指令,所述计算机指令被运行时,完成以下步骤:步骤(1):采集各项数据:采集用户的个人基本信息及认知方式,用户在浏览互联网网页过程中产生的多模态行为特征以及用户对广告的记忆程度信息;
步骤(2):数据分析与特征提取:根据所述采集的数据,通过特征相关性分析筛选特征,进行特征融合;
步骤(3):建立广告记忆力模型:挖掘用户的浏览模式,将用户的浏览模式融合步骤(2)得到的特征,构建广告记忆力模型;
步骤(4):利用已经建立好的广告记忆力模型计算用户对广告的记忆程度,从而对互联网广告效果进行测评。
10.一种计算机可读存储介质,其特征是,其上存储有计算机指令,所述计算机指令在处理器被运行时,完成以下步骤:步骤(1):采集各项数据:采集用户的个人基本信息及认知方式,用户在浏览互联网网页过程中产生的多模态行为特征以及用户对广告的记忆程度信息;
步骤(2):数据分析与特征提取:根据所述采集的数据,通过特征相关性分析筛选特征,进行特征融合;
步骤(3):建立广告记忆力模型:挖掘用户的浏览模式,将用户的浏览模式融合步骤(2)得到的特征,构建广告记忆力模型;
步骤(4):利用已经建立好的广告记忆力模型计算用户对广告的记忆程度,从而对互联网广告效果进行测评。