1.一种搜索内容提供方法,其特征在于,包括:
搜索引擎获取用户的搜索数据;
所述搜索引擎根据所述搜索数据获取与预设关键词具有关联关系的第一关联词集合和第二关联词集合,其中,所述第一关联词集合为对所述预设关键词进行修饰或者补充的词语的集合,所述第二关联词集合为对与所述预设关键词具有关联关系的第一关联词集合中的关联词进行概括类的词语的集合;
所述搜索引擎根据所述搜索数据和所述预设关键词建立所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系;以及当接收到包括所述预设关键词的搜索请求时,所述搜索引擎根据所述关联关系提供搜索内容。
2.如权利要求1所述的搜索内容提供方法,其特征在于,所述搜索数据包括问答数据,所述搜索引擎根据所述搜索数据获取与预设关键词具有关联关系的第一关联词集合和第二关联词集合,具体包括:所述搜索引擎根据所述搜索数据获取与所述预设关键词具有关联关系的第一关联词集合;以及所述搜索引擎根据所述问答数据获取与所述预设关键词具有关联关系的第二关联词集合。
3.如权利要求2所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述搜索数据获取与所述预设关键词具有关联关系的第一关联词集合,具体包括:所述搜索引擎对所述搜索数据进行分词以获取多个分词;
所述搜索引擎从所述多个分词中获取与所述预设关键词具有关联关系的分词,并分别获取每个与所述预设关键词具有关联关系的分词与所述预设关键词的相关度;
所述搜索引擎根据所述相关度筛选出候选词集合;
所述搜索引擎将所述候选词集合中同类别的候选词进行聚类,以获取包括多个第一关词类的所述第一关联词集合。
4.如权利要求3所述的搜索内容提供方法,其特征在于,所述搜索引擎将所述候选词集合中同类别的候选词进行聚类,具体包括:所述搜索引擎获取所述候选词集合中每两个候选词之间的相似度;
所述搜索引擎对所述相似度进行回归映射,以获取每两个候选词之间的相似度的回归值;
所述搜索引擎根据所述回归值对所述候选词集合进行层次聚类。
5.如权利要求2所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述问答数据获取与所述预设关键词具有关联关系的第二关联词集合,具体包括:所述搜索引擎根据预设问题模板对所述问答数据中的问题数据进行筛选,其中,所述预设问题模板包括所述预设关键词,以获取与所述预设关键词具有关联关系的多个第二关联词;
所述搜索引擎分别获取每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数;
所述搜索引擎根据所述每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数对所述多个第二关联词进行筛选,以获取所述第二关联词集合。
6.如权利要求3所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述搜索数据和所述预设关键词建立所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系,具体包括:所述搜索引擎获取所述问答数据中包括所述第二关联词集合中第二关联词的问题数据和包括所述第一关联词集合中的第二关联词的回答数据,并根据所述问答数据中的问题数据和回答数据的对应关系分别获取每个第一关联词与每个第二类关联词的对应关系;
所述搜索引擎根据所述每个第一关联词与每个第二类关联词的对应关系获取每个第一关联词类对应的第二关联词。
7.如权利要求2所述的搜索内容提供方法,其特征在于,还包括:所述搜索引擎在所述问答数据中筛选出包括所述第一关联词的回答数据;
所述搜索引擎对包括所述第一关联词的回答数据进行分析,以获取所述包括所述第一关联词的回答数据中与对应的第一关联词同时出现的频率超过预设频率的共现词;
所述搜索引擎根据所述共现词更新所述第一关联词集合,并建立更新后的第一关联词集合中的第一关联词与所述第二关联词集合中的第二关联词的关联关系。
8.如权利要求1-7任一项所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述关联关系提供搜索内容,具体包括:所述搜索引擎提供与所述预设关键词对应的所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系。
9.如权利要求1-7任一项所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述关联关系提供搜索内容,具体包括:所述搜索引擎提供与所述预设关键词对应的所述第二关联词集合中的至少一个第二关联词;
所述搜索引擎接收用户对所述至少一个第二关联词的点击操作,并显示与所述点击操作对应第二关联词相关联的第一关联词。
10.如权利要求1-7任一项所述的搜索内容提供方法,其特征在于,所述搜索引擎根据所述关联关系提供搜索内容,具体包括:所述搜索引擎根据所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系进行搜索选择提示;
所述搜索引擎接收用户针对所述搜索选择提示的输入操作,并根据所述输入操作提供对应的第一关联词或第二关联词。
11.一种搜索引擎,其特征在于,包括:
第一获取模块,用于获取用户的搜索数据;
第二获取模块,用于根据所述搜索数据获取与预设关键词具有关联关系的第一关联词集合和第二关联词集合,其中,所述第一关联词集合为对所述预设关键词进行修饰或者补充的词语的集合,所述第二关联词集合为对与所述预设关键词具有关联关系的第一关联词集合中的关联词进行概括类的词语的集合;
建立模块,用于根据所述搜索数据和所述预设关键词建立所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系;以及提供模块,用于当接收到包括所述预设关键词的搜索请求时,根据所述关联关系提供搜索内容。
12.如权利要求11所述的搜索引擎,其特征在于,所述搜索数据包括问答数据,所述第二获取模块具体用于:根据所述搜索数据获取与所述预设关键词具有关联关系的第一关联词集合;以及根据所述问答数据获取与所述预设关键词具有关联关系的第二关联词集合。
13.如权利要求12所述的搜索引擎,其特征在于,所述第二获取模块具体包括:分词单元,用于对所述搜索数据进行分词以获取多个分词;
第一获取单元,用于从所述多个分词中获取与所述预设关键词具有关联关系的分词,并分别获取每个与所述预设关键词具有关联关系的分词与所述预设关键词的相关度;
第二筛选单元,用于根据所述相关度筛选出候选词集合;
聚类单元,用于将所述候选词集合中同类别的候选词进行聚类,以获取包括多个第一关词类的所述第一关联词集合。
14.如权利要求13所述的搜索引擎,其特征在于,所述聚类单元具体用于:获取所述候选词集合中每两个候选词之间的相似度;
对所述相似度进行回归映射,以获取每两个候选词之间的相似度的回归值;
根据所述回归值对所述候选词集合进行层次聚类。
15.如权利要求12所述的搜索引擎,其特征在于,所述第二获取模块具体包括:挖掘单元,用于根据预设问题模板对所述问答数据中的问题数据进行筛选,其中,所述预设问题模板包括所述预设关键词,以获取与所述预设关键词具有关联关系的多个第二关联词;
第二获取单元,用于分别获取每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数;
第二筛选单元,用于根据所述每个第二关联词与所述预设关键词的对应关系在所述问答数据中的出现次数对所述多个第二关联词进行筛选,以获取所述第二关联词集合。
16.如权利要求13所述的搜索引擎,其特征在于,所述建立模块具体包括:第三获取单元,用于获取所述问答数据中包括所述第二关联词集合中第二关联词的问题数据和包括所述第一关联词集合中的第二关联词的回答数据,并根据所述问答数据中的问题数据和回答数据的对应关系分别获取每个第一关联词与每个第二类关联词的对应关系;
第四获取单元,用于根据所述每个第一关联词与每个第二类关联词的对应关系获取每个第一关联词类对应的第二关联词。
17.如权利要求12所述的搜索引擎,其特征在于,还包括:筛选模块,用于在所述问答数据中筛选出包括所述第一关联词的回答数据;
分析模块,用于对包括所述第一关联词的回答数据进行分析,以获取所述包括所述第一关联词的回答数据中与对应的第一关联词同时出现的频率超过预设频率的共现词;
更新模块,用于根据所述共现词更新所述第一关联词集合,并建立更新后的第一关联词集合中的第一关联词与所述第二关联词集合中的第二关联词的关联关系。
18.如权利要求11-17任一项所述的搜索引擎,其特征在于,所述提供模块具体用于:提供与所述预设关键词对应的所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系。
19.如权利要求11-17任一项所述的搜索引擎,其特征在于,所述提供模块具体用于:提供与所述预设关键词对应的所述第二关联词集合中的至少一个第二关联词;
接收用户对所述至少一个第二关联词的点击操作,并显示与所述点击操作对应第二关联词相关联的第一关联词。
20.如权利要求11-17任一项所述的搜索引擎,其特征在于,所述提供模块具体用于:根据所述第一关联词集合中第一关联词与所述第二关联词集合中第二关联词的关联关系进行搜索选择提示;
接收用户针对所述搜索选择提示的输入操作,并根据所述输入操作提供对应的第一关联词或第二关联词。