欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019107960476
申请人: 河南大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,包括:

步骤1:收集Web服务描述信息及Web服务辅助性知识并进行预处理,得到Web服务描述关键词、Web服务标签信息及Web服务开发者辅助性知识;

步骤2:利用TF-IDF提取Web服务描述关键词中的特征词,基于Word2vec对所述特征词进行向量化操作,得出Web服务描述向量,并将所有Web服务描述向量进行K-means聚类,得到K个Web服务类簇以及各类簇的聚类中心;

步骤3:将用户需求解析成用户需求服务描述及用户需求服务辅助性知识,通过用户需求服务辅助性知识得出用户需求服务标签信息,对用户需求服务描述进行向量化,得出用户需求服务描述向量,计算用户需求服务描述向量与各类簇的聚类中心的距离,确定用户需求所属Web服务类簇;

步骤4:分别计算用户需求服务标签与用户需求所属Web服务类簇中各Web服务对应的Web服务标签、用户需求服务描述与用户需求所属Web服务类簇中包含的Web服务描述间相似度,并将两个相似度加权求和,选取前top-p个综合相似度高的Web服务;

步骤5:基于Web服务开发者辅助性知识构建Web服务开发者能力度量模型,根据构建的模型对前top-p个综合相似度高的Web服务的开发者进行能力度量,选取前top-q个能力度量值高的Web服务开发者进行推荐。

2.根据权利要求1所述的基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,所述步骤1包括:步骤1.1:利用爬虫收集Web服务描述信息以及Web服务辅助性知识,其中Web服务辅助性知识包括Web服务标签信息及Web服务开发者辅助性知识,所述Web服务开发者辅助性知识包括Web服务开发者在服务注册网站上发布的Web服务资源及粉丝数;所述Web服务资源包括API服务和Mashup服务,所述Mashup服务通过1个或1个以上API服务开发;

步骤1.2:对Web服务描述信息以及Web服务辅助性知识进行解析,抽取Web服务描述信息中的所有单词以及Web服务标签信息、Web服务开发者辅助性知识;

步骤1.3:将Web服务描述信息中不属于动词和名词的单词进行过滤,根据对服务功能表征能力对过滤后单词进一步处理,得到描述每个Web服务的关键词;

步骤1.4:去除关键词的前缀和后缀以得到其词根。

3.根据权利要求1所述的基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,所述步骤2包括:步骤2.1:将预处理后的每个Web服务描述信息作为一个文档,计算Web服务描述文档中每个关键词的TF-IDF值,将TF-IDF值由高到低前m个关键词作为Web服务描述的特征词;

步骤2.2:利用Word2vec向量化每个从Web服务描述中提取的特征词,然后对向量化的特征词进行加权求和,权重是特征词的TF-IDF值,得到每个Web服务描述向量;

步骤2.3:将收集的每个Web服务描述向量化,得到Web服务描述向量集;

步骤2.4:利用K-means算法对Web服务描述向量集进行Web服务聚类,得到K个Web服务类簇及各类簇的聚类中心。

4.根据权利要求1所述的基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,所述步骤3包括:步骤3.1:将用户需求解析成用户需求服务描述及用户需求服务辅助性知识,通过用户需求服务辅助性知识得出用户需求服务标签信息;

步骤3.2:将用户需求服务描述和用户需求服务标签信息进行预处理和向量化,得到用户需求服务描述向量和用户需求服务标签集;

步骤3.3:计算用户需求服务描述向量与K个Web服务类簇的聚类中心的欧氏距离,将所述距离最小的类簇作为用户需求所属的Web服务类簇。

5.根据权利要求1所述的基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,所述步骤4包括:步骤4.1:利用Jaccard系数计算用户需求服务标签与用户需求所属Web服务类簇中每个Web服务对应的各Web服务标签间的相似度;

步骤4.2:利用余弦相似性计算用户需求服务描述与用户需求所属Web服务类簇中每个Web服务描述间的相似度;

步骤4.3:将步骤4.1与步骤4.2中相似度进行加权求和,得到综合相似度;

步骤4.4:对综合相似度进行排序,选取前top-p个综合相似度高的Web服务,所述Web服务为API服务。

6.根据权利要求5所述的基于辅助性知识的Web服务开发者按需推荐方法,其特征在于,所述步骤5包括:步骤5.1:对Web服务开发者辅助性知识进行解析,得到Web服务开发者在服务注册网站上发布的Web服务资源,利用步骤4.4中得出的API服务开发的Mashup服务以及Web服务开发者的粉丝;所述Web服务资源包括API服务和Mashup服务;

步骤5.2:将Web服务开发者辅助性知识进行维度建模,在此基础上构建Web服务开发者能力度量模型:其中,DCapi表示Web服务开发者开发的API,DCmsh表示Web服务开发者开发的Mashup,DCf表示Web服务开发者的粉丝, 表示Web服务开发者利用步骤4.4中得出的API开发的Mashup;

步骤5.3:通过Web服务开发者能力度量模型对前top-p个综合相似度高的Web服务的开发者进行能力度量:DS=λ1·Na+λ2·Nf+λ3·Nm

其中,DS表示Web服务开发者的能力度量值;λ1、λ2、λ3∈[0,1]为权重因子,且满足条件λ1+λ2+λ3=1;Na表示Web服务开发者的资产数,是DCapi和DCmsh的数量之和;Nf表示Web服务开发者的粉丝数;Nm表示Web服务开发者利用步骤4.4中得出的API服务开发的Mashup数;

步骤5.4:对Web服务开发者能力度量结果进行排序,选取前top-q个能力度量值高的Web服务开发者进行推荐。

7.一种基于辅助性知识的Web服务开发者按需推荐系统,其特征在于,包括:

数据收集预处理模块,用于收集Web服务描述信息及Web服务辅助性知识并进行预处理,得到Web服务描述关键词、Web服务标签信息及Web服务开发者辅助性知识;

聚类模块,用于利用TF-IDF提取Web服务描述关键词中的特征词,基于Word2vec对所述特征词进行向量化操作,得出Web服务描述向量,并将所有Web服务描述向量进行K-means聚类,得到K个Web服务类簇以及各类簇的聚类中心;

用户需求匹配模块,用于将用户需求解析成用户需求服务描述及用户需求服务辅助性知识,通过用户需求服务辅助性知识得出用户需求服务标签信息,对用户需求服务描述进行向量化,得出用户需求服务描述向量,计算用户需求服务描述向量与各类簇的聚类中心的距离,确定用户需求所属Web服务类簇;

Web服务选取模块,用于分别计算用户需求服务标签与用户需求所属Web服务类簇中各Web服务对应的Web服务标签、用户需求服务描述与用户需求所属Web服务类簇中包含的Web服务描述间相似度,并将两个相似度加权求和,选取前top-p个综合相似度高的Web服务;

Web服务开发者推荐模块,用于基于Web服务开发者辅助性知识构建Web服务开发者能力度量模型,根据构建的模型对前top-p个综合相似度高的Web服务的开发者进行能力度量,选取前top-q个能力度量值高的Web服务开发者进行推荐。

8.根据权利要求7所述的基于辅助性知识的Web服务开发者按需推荐系统,其特征在于,所述数据收集预处理模块包括:数据收集子模块,用于利用爬虫收集Web服务描述信息以及Web服务辅助性知识,其中Web服务辅助性知识包括Web服务标签信息及Web服务开发者辅助性知识,所述Web服务开发者辅助性知识包括Web服务开发者在服务注册网站上发布的Web服务资源及粉丝数;所述Web服务资源包括API服务和Mashup服务,所述Mashup服务通过1个或1个以上API服务开发;

第一解析子模块,用于对Web服务描述信息以及Web服务辅助性知识进行解析,抽取Web服务描述信息中的所有单词以及Web服务标签信息、Web服务开发者辅助性知识;

第一处理子模块,用于将Web服务描述信息中不属于动词和名词的单词进行过滤,根据对服务功能表征能力对过滤后单词进一步处理,得到描述每个Web服务的关键词;

第二处理子模块,用于去除关键词的前缀和后缀以得到其词根。

9.根据权利要求7所述的基于辅助性知识的Web服务开发者按需推荐系统,其特征在于,所述聚类模块包括:第一计算子模块,用于将预处理后的每个Web服务描述信息作为一个文档,计算Web服务描述文档中每个关键词的TF-IDF值,将TF-IDF值由高到低前m个关键词作为Web服务描述的特征词;

第二计算子模块,用于利用Word2vec向量化每个从Web服务描述中提取的特征词,然后对向量化的特征词进行加权求和,权重是特征词的TF-IDF值,得到每个Web服务描述向量;

第一向量化子模块,用于将收集的每个Web服务描述向量化,得到Web服务描述向量集;

聚类子模块,用于利用K-means算法对Web服务描述向量集进行Web服务聚类,得到K个Web服务类簇及各类簇的聚类中心。

10.根据权利要求7所述的基于辅助性知识的Web服务开发者按需推荐系统,其特征在于,所述用户需求匹配模块包括:第二解析子模块,用于将用户需求解析成用户需求服务描述及用户需求服务辅助性知识,通过用户需求服务辅助性知识得出用户需求服务标签信息;

第二向量化子模块,用于将用户需求服务描述和用户需求服务标签信息进行预处理和向量化,得到用户需求服务描述向量和用户需求服务标签集;

第三计算子模块,用于计算用户需求服务描述向量与K个Web服务类簇的聚类中心的欧氏距离,将所述距离最小的类簇作为用户需求所属的Web服务类簇;

优选地,所述Web服务选取模块包括:

第四计算子模块,用于利用Jaccard系数计算用户需求服务标签与用户需求所属Web服务类簇中每个Web服务对应的各Web服务标签间的相似度;

第五计算子模块,用于利用余弦相似性计算用户需求服务描述与用户需求所属Web服务类簇中每个Web服务描述间的相似度;

第六计算子模块,用于将第四计算子模块与第五计算子模块中相似度进行加权求和,得到综合相似度;

Web服务选取子模块,用于对综合相似度进行排序,选取前top-p个综合相似度高的Web服务,所述Web服务为API服务;

优选地,所述Web服务开发者推荐模块包括:

第三解析子模块,用于对Web服务开发者辅助性知识进行解析,得到Web服务开发者在服务注册网站上发布的Web服务资源,利用Web服务选取子模块中得出的API服务开发的Mashup服务以及Web服务开发者的粉丝;所述Web服务资源包括API服务和Mashup服务;

度量模型构建子模块,用于将Web服务开发者辅助性知识进行维度建模,在此基础上构建Web服务开发者能力度量模型:其中,DCapi表示Web服务开发者开发的API,DCmsh表示Web服务开发者开发的Mashup,DCf表示Web服务开发者的粉丝, 表示Web服务开发者利用Web服务选取子模块中得出的API开发的Mashup;

能力度量子模块,用于通过Web服务开发者能力度量模型对前top-p个综合相似度高的Web服务的开发者进行能力度量:DS=λ1·Na+λ2·Nf+λ3·Nm

其中,DS表示Web服务开发者的能力度量值;λ1、λ2、λ3∈[0,1]为权重因子,且满足条件λ1+λ2+λ3=1;Na表示Web服务开发者的资产数,是DCapi和DCmsh的数量之和;Nf表示Web服务开发者的粉丝数;Nm表示Web服务开发者利用Web服务选取子模块中得出的API服务开发的Mashup数;

Web服务开发者推荐子模块,用于对Web服务开发者能力度量结果进行排序,选取前top-q个能力度量值高的Web服务开发者进行推荐。