1.一种互联网基于云数据关键词搜索方法,其特征在于,包括以下步骤:
步骤一:用户将云数据上传至云平台;所述云数据包括标题、摘要以及详细内容;并获取每条云数据的搜索关键词;
步骤二:将用户的搜索关键词按搜索次数进行从大到小排序并编号;将搜索关键词按顺序编号为1,2,…,N;其中,N为搜索关键词的数量;
按1,2,…,N的顺序找出与每个搜索关键词语义相近的搜索关键词组;
步骤三:将云数据按搜索关键词的字典序进行排序;将搜索关键词标记为k;对于每个搜索关键词k,将所有搜索关键词中包含k的云数据使用集合保存;将搜索关键词k对应的包含搜索关键词k的云数据集合标记为Pk;将云数据集合Pk中的云数据按点击量进行从大到小进行排序;
步骤四:用户在搜索客户端输入搜索词并点击搜索按钮进行搜索,搜索客户端将搜索词通过无线网络发送至云平台;云平台查找符合搜索词的云数据,并将云数据标题、摘要以及详细内容发送至搜索客户端。
2.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述搜索关键词为用户提交或使用关键词提取算法自动提取。
3.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,对于每个搜索关键词n,找出与该搜索关键词语义相近的搜索关键词组包括以下步骤:步骤S1:使用NLP技术计算搜索关键词n与所有其他的搜索关键词之间的语义相似度;
步骤S2:在所有搜索关键词中,统计出所有与搜索关键词n相似度大于相似度阈值t的搜索关键词;并使用集合形式保存搜索关键词组;将搜索关键词n对应的词义相近的搜索关键词集合标记为Sn;所述相似度阈值t按实际经验设置;将词义相似度大于像素点阈值t的搜索关键词定义为词义相近;
步骤S3:对于搜索关键词集合Sn中的搜索关键词,按与搜索关键词的相似度大小,从大至小进行排序。
4.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述云平台查找符合搜索词的云数据包括以下步骤:步骤P1:使用分词工具对搜索词进行分词;获得搜索关键词的集合;将分词后的搜索关键词集合标记为G;
步骤P2:预先生成词性黑名单;使用词性标注算法对搜素关键词集合G中的搜索关键词进行词性分析;并去除词性处于词性黑名单中的搜索关键词;将剩余的搜索关键词集合标记为H;
步骤P3:云平台将搜索关键词集合H中的搜索关键词按搜索数量以从大到小的顺序进行排序;将排序后的搜索关键词集合标记为H1;
对于搜索关键词集合H1中的每个搜索关键词h,云平台搜索与搜索关键词h相关的云数据。
5.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述云平台搜索与搜索关键词h相关云数据包括以下步骤:步骤Q1:云平台根据搜索关键词h的字典序,从已完成排序的搜索关键词中查找搜索关键词h;若未查找到搜索关键词h,则转至步骤Q2;否则转至步骤Q3;
步骤Q2:计算搜索关键词h与所有搜索关键词的词义相似度;并将词义相似度最大的搜索关键词作为新的搜索关键词h;并转至步骤Q3;
步骤Q3:将搜索关键词h对应的云数据集合Ph返回搜索客户端;并按云数据的点击量从大到小进行排序,按排序后的云数据顺序向用户展示云数据标题以及摘要;
步骤Q4:获取搜索关键词h的词义相近的搜索关键词集合Sh;对于搜索关键词集合Sh中的每个搜索关键词s,获取搜索关键词s对应的云数据集合Ps;将搜索关键词s与搜索关键词h的词义相似度标记为lsh;将云数据集合Ps中的每条云数据标记为p,将云数据p的点击量标记为Kp;计算每条云数据p的展示优先级Fp;计算公式为Fp=α*lsh+β*kp;其中,α、β分别为根据实际经验预设的比例系数;
步骤Q5:将搜索关键词集合Sh中所有搜索关键词s对应的云数据集合Ps中的云数据p按优先级Fp从大到小进行排序;并将所有云数据按排序后的顺序向用户展示云数据的标题以及摘要。
6.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述点击量为每条云数据标题被用户点击并查看云数据详细内容的次数。
7.根据权利要求4所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述词性黑名单为一个词性集合,在词性黑名单中的词性均不作为搜索关键词;所述词性黑名单根据实际经验设置。
8.根据权利要求1所述的一种互联网基于云数据关键词搜索方法,其特征在于,所述搜索客户端与云平台分别为搜索程序的前端与后端;其中,前端用于与用户进行交互,获取用户的搜索关键词并向用户展示云数据的标题以及摘要,用户点击标题后,查看云数据的详细内容;后端用于根据用户的搜索关键词查找对应的云数据。