1.一种搜索需求分析方法,其特征在于,包括以下步骤:获取搜索词,并获取所述搜索词对应的多个关联词;
抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及根据所述原始特征和所述关联特征获取搜索需求;
其中,通过对所述关联词本身进行分析以抽取所述关联词的特征,所述抽取所述多个关联词的特征并作为关联特征,包括:对所述关联词进行分词以抽取与所述搜索词相关且不包含所述搜索词的多个关键词;
从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述多个关联词的特征;或者,通过对根据所述关联词获取的搜索结果或通过对用户点击日志进行分析以抽取所述关联词的特征,所述抽取所述多个关联词的特征并作为关联特征,包括:获取所述多个关联词的多个搜索结果或用户点击日志;从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一种或多种作为所述关联特征。
2.如权利要求1所述的搜索需求分析方法,其特征在于,所述根据所述原始特征和所述关联特征获取搜索需求具体包括:根据所述原始特征和所述关联特征查询搜索需求识别模型以获取所述搜索需求。
3.如权利要求1所述的搜索需求分析方法,其特征在于,所述获取所述搜索词对应的多个关联词具体包括:以所述搜索词为中心将与所述搜索词之间的编辑距离小于预设距离的词作为所述关联词;和/或对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。
4.如权利要求1所述的搜索需求分析方法,其特征在于,所述抽取所述搜索词的特征并作为原始特征具体包括:提取所述搜索词中的专名、专名类别以及各个成分的语义TAG标签信息;
提取所述搜索词的组成结构;
根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息以及所述组成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。
5.一种搜索需求分析装置,其特征在于,包括:
第一获取模块,用于获取搜索词,并获取所述搜索词对应的多个关联词;
抽取模块,用于抽取所述搜索词的特征并作为原始特征,并抽取所述多个关联词的特征并作为关联特征;以及第二获取模块,用于根据所述原始特征和所述关联特征获取搜索需求;
其中,所述抽取模块用于对所述关联词本身进行分析以抽取所述关联词的特征,所述抽取模块包括:分词单元,用于对所述关联词进行分词以抽取与所述搜索词相关且不包含所述搜索词的多个关键词;
选择单元,用于从所述多个关键词中选择与所述搜索词需求相关的特征词,并将所述特征词作为所述多个关联词的特征;
或者,所述抽取模块用于对根据所述关联词获取的搜索结果或对用户点击日志进行分析以抽取所述关联词的特征,所述抽取模块包括:获取单元,用于获取所述多个关联词的多个搜索结果或用户点击日志;以及抽取单元,用于从所述多个关联词的多个搜索结果或用户点击日志中抽取所述关联词的Title特征、搜索特征和点击特征中的一种或多种,并将所述Title特征、搜索特征和点击特征中的一种或多种作为所述关联特征。
6.如权利要求5所述的搜索需求分析装置,其特征在于,所述第二获取模块具体用于:根据所述原始特征和所述关联特征查询搜索需求识别模型以获取所述搜索需求。
7.如权利要求5所述的搜索需求分析装置,其特征在于,所述第一获取模块具体用于:以所述搜索词为中心将与所述搜索词之间的编辑距离小于预设距离的词作为所述关联词;和/或对所述搜索词进行语义分析,并将与所述搜索词语义近似的词作为所述关联词。
8.如权利要求5所述的搜索需求分析装置,其特征在于,所述抽取模块具体包括:第一提取单元,用于提取所述搜索词中的专名、专名类别以及各个成分的语义TAG标签信息;
第二提取单元,用于提取所述搜索词的组成结构;
生成单元,用于根据所述搜索词中的专名、所述专名类别、所述各个成分的语义TAG信息以及所述组成结构生成所述搜索词的描述模板,并将所述描述模板作为所述原始特征。