1.一种基于极限学习机的服务发现方法,其特征在于,包括以下步骤:步骤1,从现有服务集中选取一组服务作为训练服务集,用于生成训练样本,剩余服务则用作测试服务集;针对某一随机查询请求,对训练服务集中每个服务,应用余弦相似度、Jaccard相似度、欧式距离及曼哈顿距离这四种测量方法,得到相似度匹配得分,并通过差分进化算法得到对应的适应度值,以此构成训练样本向量;
步骤2,将步骤1所得训练样本向量的相似度匹配得分作为极限学习机的输入,每个服务的适应度值作为输出,对神经网络模型进行训练,得到训练完成的ELM神经网络模型;
步骤3,当用户提出新的查询请求时,对步骤1所述测试服务集的各个样本与所述查询请求进行相似度匹配,并通过步骤2训练好的ELM神经网络模型预测各个样本对应的适应度值;
步骤4,根据步骤3所得测试服务集各个样本即候选服务对应的适应度值,选取最小适应度值对应的服务集中的候选服务作为目标服务。
2.根据权利要求1所述的基于极限学习机的服务发现方法,其特征在于,步骤1中,现有服务集中的每个服务均由描述其功能的自然语言文本表示,并根据服务集中的服务样本随机给出一条查询信息。
3.根据权利要求1所述的基于极限学习机的服务发现方法,其特征在于,步骤1具体通过以下步骤实现:
步骤11,对描述服务集中每个服务功能的自然语言文本进行预处理,包括去除停用词、词干提取以及分词,完成对文本的特征提取;
步骤12,应用余弦相似度、Jaccard相似度、欧式距离及曼哈顿距离这四种测量方法计算服务集中的服务样本与查询请求之间的相似度匹配得分;
步骤13,采用差分进化算法得到服务集中每个服务样本的适应度值,作为衡量服务样本的匹配基准;
步骤14,将服务集中的每个服务样本表示为一个五维向量,即s=(m1,m2,m3,m4,f);其中,s表示服务样本,m1,m2,m3,m4表示步骤12所述四种相似度得分,f表示差分进化所得每个服务样本的适应度值,得到训练样本向量。
4.根据权利要求3所述的基于极限学习机的服务发现方法,其特征在于,步骤14中提出的差分进化算法,是将每个服务的四种相似度得分作为输入进行迭代优化,通过模拟遗传学中的杂交、变异以及选择方法来设计遗传算子,在不断地进化过程中保留优良个体,并引导搜索向最优解逼近。
5.根据权利要求1所述的基于极限学习机的服务发现方法,其特征在于,步骤1中所指出的适应度值,通过差分进化过程中的Rastrigr函数计算,用于对样本个体进行评价。
6.根据权利要求1所述的基于极限学习机的服务发现方法,其特征在于,步骤2中训练ELM神经网络模型时,将步骤1中得到的样本向量中的相似度匹配得分作为输入层的输入变量,随机确定输入层连接权值及隐含层神经元阈值,选择S型函数作为激活函数,样本向量中的适应度值为对应输出层的输出变量。
7.根据权利要求6所述的基于极限学习机的服务发现方法,其特征在于,步骤2中,ELM神经网络模型由输入层、隐含层及输出层三部分构成,不同功能结构之间通过神经元相互连接,输入层与隐含层神经元之间和隐含层与输出层神经元之间,均有相应的连接权值ω和β,隐含层神经元上包含其阈值b;极限学习机算法具体包括以下步骤:步骤21,确定隐含层神经元个数,随机设定输入层连接权值ω及隐含层阈值b;
步骤22,选择合适的隐含层神经元激活函数,计算得出隐含层的输出矩阵H;
步骤23,计算输出层权值β。
8.根据权利要求1所述的基于极限学习机的服务发现方法,其特征在于,步骤3中,当用户向测试服务集提出新的查询请求时,通过向步骤2训练好的ELM神经网络模型中输入每个服务样本的相似度向量,从而得到表征服务总体相似度的预测适应度值,并将其作为服务排序的基准。