1.一种绿色云服务提供中的最小能耗计算方法,其特征是:包括以下步骤:A.构建关键词词库L的过程:
A101.收集移动微学习中的历史资源,组成样本集合;
A102.将A101步骤中的样本集合分为训练集和测试集,其中训练集为测试集为 在U和V中,u1,u2,...,uφ和v1,v2,...,vφ为字节数较多的大样本类, 和 为字节数较少的小样本类;
A103.利用类别均化方法对A102步骤中的训练集U中的小样本类进行重组,形成与大样本字节数量相对均匀的新的训练集U′={u1,u2,...,uφ,u′φ+1,u′φ+2},其中u′φ+1={uφ+1,uφ+2},A104.利用ICTCLAS2013分词系统对A103步骤获得的训练集U′进行分词处理,得到训练集分词结果;
A105.利用现有技术中的停用词表,对A104步骤中的训练集分词结果进行去噪处理,得到训练集低噪分词结果;
A106.将步骤A105中得到的训练集低噪分词结果与ICTCLAS2013分词系统中的各个类别进行对比,统计训练集低噪分词结果中的每个词在ICTCLAS2013分词系统各个类别中出现的频率,得到训练集频率统计;
A107.统计A106步骤中的训练集频率出现频次最高的 个词称为训练集关键词;
A108.重复A103步骤~A107步骤,直至训练集U′的样本全部处理完成,得到训练集U′的样本的全部关键词,得到关键词词库L;
B.词频分类过程:
B101.利用ICTCLAS2013分词系统对A102步骤的测试集V进行分词处理,得到测试集分词结果;
B102.利用现有技术中的停用词表,对B101步骤中的分词结果进行去噪处理,得到测试集低噪分词结果;
B103.将测试集低噪分词结果与ICTCLAS2013分词系统中的各个类别进行对比,统计测试集低噪分词结果中的每个词在ICTCLAS2013分词系统各个类别中出现的频率,得到测试集频率统计;
B104.将B103步骤中的测试集频率统计,将出现频次最高的 个词称为测试集关键词;
B105.将B104步骤得到的测试集关键词与A108步骤得到的关键词词库L进行匹对,对于匹对成功的关键词,将该测试集关键词在对应的ICTCLAS2013分词系统的类别中出现的频率加1,得到匹对后的频率统计;
B106.采用动态TF-IDF方法,根据公式 得
到B105步骤中的匹对后的频率统计中的各个关键词分别相对于全部关键词的权重d-tf-idfi,v;其中,wi是关键词;vj是ICTCLAS2013分词系统的类别中的某一个文件;ni,j是关键词wi在文件vj中出现的次数,∑knk,j是文件vj中所有关键词出现的次数之和,|V|是语料库中文件总数,|{j:wi∈vj}|是包含关键词wi的文件数目,ε和θ是用于缓和样本大小对分类正确率的影响所引进的缓和系数;
B107.令ε=θ,在[0,10]区间内调节ε和θ,并以0.2的步长对分类正确率进行测试;
B108.重复执行B107步骤,直到ε>10且θ>10成立;
B109.重复B101~B108步骤,直至测试集V中样本处理完成;
B1010.根据公式 得到测试集V相对于ICTCLAS2013分词系统中的各个类别的分类正确率Wj;其中,是ICTCLAS2013分词系统中的某个类别中关键词的个数;
B1011.根据公式 得到测试集V中所有样本的平均分类正确率,并利用B107步骤得到分类正确率最高时ε和θ的值以及最高分类正确率
C.对移动用户进行移动微学习而发送的新的用户请求,采用以下处理步骤:C101.将云平台划分为本地云平台和公共云平台;
C102.针对任意的用户请求,利用ICTCLAS2013提取关键词;
C103.将C102步骤中得到的关键词与A步骤得到的关键词词库L进行匹配,得到匹配正确率C104.若 则将该资源部署在本地云平台上,反之,则将该资源部署在公共云平台上;
D.对于新的用户请求,构建最小能耗函数:
D1.利用灰狼寻优算法,得到最优能耗值:
D101.设定云平台随机产生Q个单字节的请求,且云平台将该请求按照灰狼的层次结构分为α、β、δ和ω,并设置最大迭代次数T;随机初始化t时,云平台提供服务的能耗为Et,用户能够忍受服务的最大能耗为Emax,云平台完成请求的最优能耗Eq;
如果当前执行次数t<T,继续灰狼寻优过程;否则,结束本次优化过程,开始下一次迭代;对于每一次迭代,以Et>E max作为本次迭代结束的条件,如果成立,结束本次迭代过程,开始下一次迭代;
D102根据公式:
Dt=|C*Et-Eq|;A=2*a*r1-a;C=2*r2和Et=Eq-A*Dt得到下一个时刻t云平台完成请求所需要的能耗,直到t=T;其中,其中a是从2到0的线性下降过程,r1是0到1之间的随机数,r2为0到1的随机数;其中,A为灰狼算法中的用于随机发散或收缩的第一指引系数;C为灰狼算法中的用于随机发散或收缩的第二指引系数;
D103.根据公式 计算D102步骤中得到的所有能耗Et的平均值,Pt是提供本次请求服务的理想最小能耗值Eq的接近值;
D2.构建总能耗函数:
D201.利用公式 得到B步骤的能量消耗Rloc;其中,Sdoc表示A101步骤中的用户历史资源总的字节数;Sk表示对Sdoc进行C102步骤所得到的关键词的总字节数;Stask表示当前系统待处理的字节数;Tloc表示完成A101步骤中的历史资源的分类所花费的时间;N表示系统中的任务分配给了N个处理机进行处理;
D202.如果该用户请求能够在本地云平台找到,则提供服务的过程中消耗的时间为:其中,Scdoc表示在当前用户请求的字节数;Sck表示对Scdoc通过C102步骤所得到的关键词的总字节数;M表示系统中的任务分配给了M个处理机进行处理;
D203.则该用户请求在本地云平台找到所需要的总能耗为Eideal=q*Ptl*Tideal;q为用户请求的数量;
D204:如果该用户请求需要上传到公共云平台查找,则该用户请求消耗的时间为:其中,Tth是云平台为了不影响用户满意度设定的用
户请求在本地云平台的最大执行时间;如果当前用户在本地云平台的执行时间为Tnow,如果Tth>Tnow成立,那么该请求仍然在本地云平台进行,反之,上传到公共云平台,其中T是用户请求在本地执行的时间;Smig是迁移到公共云平台的字节大小,Tmig表示迁移所花费的时间,M′表示系统分配的处理机数量,Rclo表示公共云平台的执行速率;
D205.设置用于提高能耗计算准确率的实际运行中影响迁移性能的因素,根据公式得到本地云平台的执行时间Tnow,其中,Vmem表示迁移期间虚拟机内存的大小,Rmig表示迁移过程中的迁移速率;其中, D表示迁移过程中内存的脏化率;
D206.根据D204~D205步骤得出在该用户请求需要上传到公共云平台时所需要的能耗为:En-ideal=q*Ptc*Tn-ideal;
D3:根据C步骤,本地云平台存放分类精度高于 的资源,共享云平台上存放的是分类精度低于 的资源;通过D1步骤的优化,得到该次移动微学习过程中找到该用户请求所需的最小能耗为:
2.根据权利要求1所述的一种绿色云服务提供中的最小能耗计算方法,其特征是:所述B106步骤中的ε=θ且ε=2.6。
3.根据权利要求1所述的一种绿色云服务提供中的最小能耗计算方法,其特征是:所述的A105步骤和B102步骤中的现有技术中的停用词表为哈尔滨工业大学停用词表。