欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023107309369
申请人: 黑龙江贾维斯物联网科技有限公司
专利类型:发明专利
专利状态:授权未缴费
专利领域: 计算;推算;计数
更新日期:2024-04-17
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于云计算的多维数据分析处理方法,其特征在于:该方法包括以下步骤:S1、系统自主收集现有标记产品的相关数据,标记产品是企业评判出销量递增的产品,判断数据的格式;

S2、对不同格式的数据进行转化、识别和筛选后获取目标信息,将信息储存;

S3、利用聚类算法生成簇,找出簇的质心;

S4、以簇的质心作为预测圆的圆心,规划预测圆的半径,画出预测圆;

S5、根据预测圆辅助开发管理人员进行决策;

所述步骤S4包括以下步骤:

S401、以S305中簇的质心作为预测圆的圆心,记预测圆的半径为r,随机选取r的值,画出预测圆,记圆内点与圆上点相加的数量为d,计算d与r的比值并记为p;

S402、记除圆心外的每一个样本点到圆心的距离为ri,记ri的数量为n,记ri的平均值为avg,记ri的标准差为s,记ri的标准误差为SE,存在以下公式:S403、样本点的数量大于30,计算SE,令置信水平为95%,查询标准正态分布概率表求得标准分z,记置信区间的下限值为a,置信区间的上限值为b,存在以下公式:根据公式求出上限值a和下限值b;

样本点的数量小于或等于30,计算SE,令置信水平为95%,查询t表格求得t值,t表格是学生t‑分布的分布概率表,存在以下公式:根据公式求出上限值a和下限值b;

S404、r取在区间[a,b]内的值,计算出令比值p最大的半径rf作为预测圆的半径,画出预测圆;

所述步骤S5包括以下步骤:

S501、依据存储的目标信息,分别规划出产品生命周期各阶段的时间成本和人力成本的预测圆,在新产品开发过程中,记录样本点在预测圆的右上方的次数Na,右上方是以圆心为坐标原点,划分四个象限,第一象限中圆外的部分,计算出新产品开发耗费的时间成本和人力成本大于标记产品预测范围的概率pr, Nt是新产品的样本点在已往阶段出现的总次数,将pr输出,由开发管理人员判断产品开发是否继续;

S502、对于确定开发的产品,输出S501中产品生命周期各阶段的时间成本和人力成本的预测圆,将预测的成本范围输出。

2.根据权利要求1所述的一种基于云计算的多维数据分析处理方法,其特征在于:在步骤S1‑S2中,系统收集被标记产品的各类相关数据,判断数据的格式,将数据分为结构化数据、半结构化数据和非结构化数据;

系统将半结构化数据和非结构化数据转化为结构化数据,从中识别出目标信息后进行筛选,所述目标信息指的是信息所处阶段、信息所属类别和信息所包含数值都完整。

3.根据权利要求2所述的一种基于云计算的多维数据分析处理方法,其特征在于:所述步骤S3包括如下具体步骤:

S301、从储存的信息中提取聚类算法所需要的信息数据,对数据进行离群点处理,删除异常值,利用最大‑最小规范化,对数据进行规范化处理,最大‑最小规范化的公式为:x为规范化前的数据,xnew为规范化后的数据,xmax为数据集的最大值,xmin为数据集的最小值,最大最小规范化将数据映射到[0,1]区间;

S302、记中心点的值为k,k为整数且k>0,记k个中心点为μ1,μ2,...μk;

S303、定义损失函数如下:

其中xi为第i个样本值,i为整数且i>0,ci为xi所属的簇, 为簇代表的中心点,M为样本总数;

S304、对于每一个样本,计算其属于的簇,取样本到中心点的最小值:2

argminj||xi‑μj||

其中μj为簇代表的中心点的猜测值,j为整数且j>0;

对于每一个簇,重新计算中心点;

S305、重复步骤S304,直到算法收敛,损失函数取到最小值,确定簇的质心。

4.一种基于云计算的多维数据分析处理系统,使用如权利要求1‑3中任一项所述的一种基于云计算的多维数据分析处理方法,其特征在于:本系统包括多维数据收集模块、多维数据处理模块、辅助模型建立模块和辅助决策输出模块;

所述多维数据收集模块用于收集被标记产品的所有相关数据,并判断所收集到的数据的格式,将数据分类传输给多维数据处理模块;所述多维数据处理模块用于接收多维数据收集模块所传输的各类数据,分类转换为统一格式,提取并筛选出目标信息,将目标信息储存起来;所述辅助模型建立模块用于利用储存的信息建立预测模型;所述辅助决策输出模块用于基于输入的信息得出结果,辅助管理人员的决策;

多维数据收集模块的输出端电性连接多维数据处理模块的输入端;多维数据处理模块的输出端电性连接辅助模型建立模块的输入端;辅助模型建立模块的输出端电性连接辅助决策输出模块的输入端。

5.根据权利要求4所述的一种基于云计算的多维数据分析处理系统,其特征在于:所述多维数据收集模块包括数据自动采集单元和数据格式判断单元;

所述数据自动采集单元用于采集被标记产品的所有相关数据;

所述数据格式判断单元用于判断采集到的数据的格式,将数据分为结构化数据、半结构化数据和非结构化数据;

数据自动采集单元的输出端电性连接数据格式判断单元的输入端。

6.根据权利要求4所述的一种基于云计算的多维数据分析处理系统,其特征在于:所述多位数据处理模块包括数据转换单元、信息提取单元和信息储存单元;

所述数据转换单元用于将半结构化数据和非结构化数据转换为结构化数据;

所述信息提取单元用于在结构化数据中识别目标信息,将目标信息提取出来传递给信息储存单元;

所述信息储存单元用于将目标信息归类后储存;

数据转换单元的输出端电性连接信息提取单元的输入端,信息提取单元的输出端电性连接信息储存单元的输入端。

7.根据权利要求4所述的一种基于云计算的多维数据分析处理系统,其特征在于:所述辅助模型建立模块包含数据预处理单元、簇生成单元、预测圆生成单元;

所述数据预处理单元用于对数据进行离群点处理和规范化处理,将数据格式转化为聚类算法处理的格式;

所述簇生成单元用于利用聚类算法获得预测模型的质心;

所述预测圆生成单元用于确定预测圆的圆心和半径,生成预测模型;

数据预处理单元的输出端电性连接簇生成单元的输入端,簇生成单元的输出端电性连接预测圆生成单元的输入端。

8.根据权利要求4所述的一种基于云计算的多维数据分析处理系统,其特征在于:所述辅助决策输出模块包含产品开发判断单元和产品成本预测单元;

所述产品开发判断单元在提取目标信息中的时间和人力成本信息生成预测模型后,计算出新产品继续开发的整个生命周期时间成本和人力成本超过标记产品生成的预测范围的概率,协助开发管理人员判断产品是否要继续开发;

所述产品成本预测单元用于计算新产品在生命周期各阶段的时间和人力成本投入的合理范围。