1.一种云服务事件及服务等级合约数据的向量化方法,其特征在于包括有下列步骤:步骤一,形式化云服务事件;
步骤101,云服务器日志收集;
收集云服务器执行作业的日志记录,日志记录中的作业记为JOB,JOB中存在有多个任务;将其中一个任务下的任意一个实例 记录作为一次云服务事件;
步骤102,设置云服务事件的字段内容;
将所述 进行云服务事件字段内容标记,记为所述
所述 中的下角标i表示任务的标识号,下角标j表示实例的标识号;
start_time表示实例的开始时刻;
end_time表示实例的结束时刻;
machine_id表示云服务器标识;
task_name表示任务名;
job_name表示作业名;
inst_name表示实例名;
seq_no表示实例重试的次数;
total_seq_no表示实例重试的总次数;
status表示实例的状态;
cpu_avg表示实例的平均CPU利用量;
cpu_max表示实例的最大CPU利用量;
mem_avg表示实例的平均内存利用量;
mem_max表示实例的最大内存利用量;
步骤二,构造云服务事件的状态元;
步骤201,云服务事件的主谓句式表达;
云服务事件 中的每一个字段是句子的组成元素;应用句子结构成分方法,用双竖线划分出句子的主语部分和谓语部分;一次云服务事件 用主谓句式的表述式记为SYS_EVENT,且SYS_EVENT=[时段],(特定)实例||[重试]呈态<载荷>;
步骤202,基于状态元表征的云服务事件的状况;
采用主谓句式SYS_EVENT=[时段],(特定)实例||[重试]呈态<载荷>对实例集各个实例的字段语义进
行句子结构成分划分,构造出云服务事件的状态元集合,记为EVENT_STATUS,所述EVENT_STATUS包含的内容有:云服务事件的时长状态元TIME用于描述云服务事件的时长状态,所述TIME={start_time,end_time};
云服务事件的位置状态元LOCATION用于描述云服务事件的位置状态,所述LOCATION={machine_id,job_name,task_name};
云服务事件的数量状态元NUMBER用于描述云服务事件的数量状态,所述NUMBER={inst_name};
云服务事件的重试状态元RETRY用于描述云服务事件的重试状态,所述RETRY={seq_no,total_seq_no};
云服务事件的操作状态元OPERATION用于描述云服务事件的操作状态,所述OPERATION={status};
云服务事件的CPU载荷状态元CPU用于CPU载荷元CPU描述云服务事件的CPU载荷状态,所述CPU={cpu_avg,cpu_max};
云服务事件的内存载荷状态元MEM用于内存载荷元MEM描述云服务事件的内存载荷状态,所述MEM={mem_avg,mem_max};
对于任意一个云服务事件字段内容 构造得到的云服务事件状态元集合为:
步骤三,形式化云服务事件的服务等级合约;
基于大数据计算服务MaxCompute服务等级合约,并结合云服务事件字段内容构建得到云服务事件-状况规约SLAS;
所述
实例级的时长元规约
实例级的位置元规约
作业级的数量元规约
实例级的重试元规约
实例级的操作规约
实例级的CPU载荷规约
实例级的内存载荷规约
步骤四,提取违规元;
在符合步骤三制定的规约中的元素,则作为违规元;
违规元是指云服务事件-状况规约 中涉及违反规定的元素;从所述SLAS中提取出的违规元构建得到云服务事件违规元集合违反实例级的时长元规约sla4inst_time,称为时长元-违规元vf_longTail:所述vf_longTail=
违反实例级的位置元规约sla4inst_location,称为位置元-违规元vf_location:所述vf_location={machine_id,job_name,task_name};
违反作业级的数量元规约sla4job_number,称为数量元-违规元vf_number:所述vf_number={inst_name};
违反实例级的重试元规约sla4inst_retry,称为重试元-违规元vf_retry:所述vf_retry={seq_no,total_seq_no};
违反实例级的操作元规约sla4inst_operation,称为操作元-违规元vf_operation:所述vf_operation={status};
违反实例级的CPU载荷元规约sla4inst_cpu,称为CPU载荷元-违规元vf_cpu:所述vf_cpu={cpu_avg,cpu_max};
违反实例级的内存载荷元规约sla4inst_mem,称为内存载荷元-违规元vf_mem:所述vf_mem={mem_avg,mem_max};
违规是指未达到云服务事件-状况规约 的行为;事件违规是指云服务事件 则所述违规;
违规元是指涉及违反规约 中的因素;违规元揭示云服务事件 违规的本质,从而能够为准确地判定违规生成出所需的向量样本,故需要发现所述云服务事件 违规的因素(即违规元),它成为云服务事件 的违规元;为从多个方面考虑云服务事件可能涉嫌违规的因素,因此,构造出云服务事件状态元集合
步骤五,提取指标;
从云服务事件-状况规约 以及云服务事件违规元集合提取出违规限制值作为违规指标,得到规约-指标集合METRIC;
所述
步骤六,映射构建状况元-违规元-联系组;
依据云服务事件状态元集合 及其云服务事件违规元集合 映射出状态元-违规元联系元组,从而得到状况元-违规元-联系元组集,记为PSV;
所述
PSV_TIME表示“时长状态元-时长违规元”联系元组;
PSV_LOCATION表示“位置状态元-位置违规元”联系元组;
PSV_NUMBER表示“数量状态元-数量违规元”联系元组;
PSV_RETRY表示“重试状态元-重试违规元”联系元组;
PSV_OPERATION表示“操作状态元-操作违规元”联系元组;
PSV_CPU表示“CPU载荷状态元-CPU载荷违规元”联系元组;
PSV_MEM表示“内存载荷状态元-内存载荷违规元”联系元组;
依据事件的时长状态元TIME及其违规元vf_longTail,映射出时长状态元-时长违规元联系元组PSV_TIME:PSV_TIME=(end_time,start_time);
依据事件的位置状态元LOCATION及其违规元vf_location,映射出位置状态元‑位置违规元联系元组PSV_LOCATION:PSV_LOCATION=(machine_id,job_name,task_name);
依据数量状态元NUMBER及其违规元vf_number,映射出数量状态元‑数量违规元联系元组PSV_NUMBER:PSV_NUMBER=(inst_name);
依据事件的重试状态元RETRY及其违规元vf_retry,映射出重试状态元‑重试违规元联系元组PSV_RETRY:PSV_RETRY=(seq_no,total_seq_no);
依据事件的操作状态元OPERATION及其违规元vf_operation,映射出操作状态元‑操作违规元联系元组PSV_OPERATION:PSV_OPERATION=(status);
依据事件的CPU载荷状态元CPU及其违规元vf_cpu,映射出“CPU载荷状态元‑CPU载荷违规元”联系元组PSV_CPU:PSV_CPU=(cpu_avg,cpu_max);
依据事件的内存载荷状态元MEM及其违规元vf_mem,映射出“内存载荷状态元‑内存载荷违规元”联系元组PSV_MEM:PSV_MEM=(mem_avg,mem_max);
步骤七,构造状况元-指标元-联系组;
步骤701,依据映射出的状况元-违规元-联系元组集以及提取出的规约-指标集合 构造云服务事件的状态元-指标元-元组集合,记为PSM;
所述
PSM_TIME表示时长状态元-时长违规元指标元组;
PSM_LOCATION表示位置状态元-位置违规元指标元组;
PSM_NUMBER表示数量状态元-数量违规元指标元组;
PSM_RETRY表示重试状态元-重试违规元指标元组;
PSM_OPERATION表示操作状态元-操作违规元指标元组;
PSM_CPU表示CPU载荷状态元-CPU载荷违规元指标元组;
PSM_MEM表示内存载荷状态元-内存载荷违规元指标元组;
时长状态元-时长违规元指标元组位置状态元-位置违规元指标元组数量状态元-数量违规元指标元组重试状态元-重试违规元指标元组操作状态元-操作违规元指标元组CPU载荷状态元-CPU载荷违规元指标元组内存载荷状态元-内存载荷违规元指标元组步骤702,依据状态元-指标元-元组集合 将状况事件与指标做笛卡尔积,构造出云服务事件的状况-指标联系元组,记为RSM;
所述RSM=(EVENT_STATUS,METRIC)EVENT_STATUS表示实例状况事件;
METRIC表示事件的违规指标;
构造的云服务事件状况-指标联系元组步骤八,生成云服务事件的状况-指标向量化样本;
向量化方法是类比自然语言的word2vec方法,将云服务事件与其服务等级合约数据量化为向量;
读入实例集 遍历每
个实例状况事件的状态元
若任意一实例 的状态元 不为空,则抽取出位置状态元值和数量状态元值中的数值;
Terminated态映射为数值0;
Ready态映射为数值1;
Running态映射为数值2;
Terminating态映射为数值3;
Interrupted态映射为数值4;
Failed态映射为数值5;
若时长状态元、重试状态元、CPU载荷状态元以及内存载荷状态元的值为数值,则保存其数值;若CPU载荷状态元、内存载荷状态元的值存在空值,则将其填为数值0;
若任意一实例 的状态元 为空,则说明已遍历且量化完所述 的所有状态元 最后保存状态元的量化结果至文件中。
2.根据权利要求1所述的云服务事件及服务等级合约数据的向量化方法,其特征在于:云服务事件-状况规约SLAS中的各个规约为;
实例级时长状态元规约形式化为公式(1):v表示谓词判定的条件;
当所述v的谓词判定结果是 则违反了公式(1),记为违规-实例级的时长元规约,即该状态元是违规元vf_longTail;
当所述v的谓词判定结果不是 则为满足实例级时长元规约;
实例级位置元规约形式化为公式(3):v表示谓词判定的条件;
当所述v的谓词判定结果是 则违反了公式(3),记为违规-实例级的位置元规约,即该状态元是违规元vf_location;
当所述v的谓词判定结果不是 则为满足实例级位置元规约;
作业级数量元规约形式化为公式(5):rNumber_metric=2000 (8)mNumber_metric=8000 (9)v表示谓词判定的条件;
当所述v的谓词判定结果是则违反了公式(5),记为违规-作业级的数量元规约,即该状态元是违规元vf_number;
当所述v的谓词判定结果不是则为满足作业级数量元规
约;
实例级重试元规约形式化为公式(10)retry_metric=3 (11)v表示谓词判定的条件;
当所述v的谓词判定结果是 则违反了公式(10),记为违规-实例级的重试元规约,即该状态元是违规元vf_retry;
当所述v的谓词判定结果不是 则为满足实例级重试元规约;
实例级操作元规约形式化为公式(12):retry_metric=3 (13)v表示谓词判定的条件;
当所述v的谓词判定结果是则违反了公式(12),记为违规-实例级的操作元规约,即该状态元是违规元vf_operation;
当所述v的谓词判定结果不是则为满足实例级操作元规
约;
将中文表述的实例级CPU载荷元规约形式化为公式(14):v表示谓词判定的条件;
当所述v的谓词判定结果是 则违反了公式(14),记为违规-实例级的CPU载荷元规约,即该状态元是违规元vf_cpu;
当所述v的谓词判定结果不是 则为满足实例级CPU载荷元规约;
将中文表述的实例级内存载荷元规约形式化为公式(15):v表示谓词判定的条件;
当所述v的谓词判定结果是 则违反了公式(15),记为违规-实例级的内存载荷元规约,即该状态元是违规元vf_mem;
当所述v的谓词判定结果不是则为满足实例内存载荷元规约。
3.根据权利要求1所述的云服务事件及服务等级合约数据的向量化方法,其特征在于:云服务器的日志选用Alibaba cluster trace v2018数据集。