1.一种基于大数据处理的钢结构焊接工艺质量管理推荐方法,包括:获取焊接过程中的图像数据和实时数据,实时数据包含焊接的电流、电压和速度;
对图像数据进行标记,标记焊接缺陷的位置和类型;将标记后的图像数据与对应的实时数据进行同步,生成带标签的数据集;
对带标签的数据集进行预处理,预处理包含图像增强,生成预处理数据集;
根据预处理数据集,提取关键特征,关键特征包含材料类型、厚度和焊接方法,生成特征数据集;
对特征数据集进行聚类分析,获取不同焊接参数和环境条件下的工艺模式;
根据预处理数据集和特征数据集,通过迁移学习建立焊接模型,进行焊接缺陷检测;
根据用户的历史行为和偏好,构建用户画像;
结合用户画像、工艺模式和焊接缺陷检测结果,建立推荐模型,进行焊接工艺推荐;
根据识别的工艺模式和推荐的焊接工艺,通过多臂老虎机策略进行推荐结果的优化。
2.根据权利要求1所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:图像增强,包括:
将带标签的数据集划分为多个局部窗口;
计算每个局部窗口内的像素灰度值的累积分布函数CDF,将CDF映射到指定的动态范围内,映射后的灰度值范围为0至255,映射函数为:其中,i为原始灰度值,CDF(i)为灰度值i对应的累积分布函数值,CDF_min和CDF_max分别为局部窗口内CDF的最小值和最大值,round为四舍五入取整函数;
采用双线性插值方法对相邻局部窗口的映射结果进行平滑过渡,插值系数根据局部窗口的重叠率计算,计算公式为:coefficient=1-overlap_ratio其中,window_size为局部窗口的大小,stride为相邻局部窗口之间的步长,overlap_ratio为局部窗口的重叠率,coefficient为插值系数。
3.根据权利要求2所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:图像增强,还包括:
计算每个局部窗口内像素灰度值的对比度和熵值,对比度计算公式为:其中,max_gray和min_gray分别为局部窗口内像素灰度值的最大值和最小值;
熵值计算公式为:
entropy=-∑(p×log2(p))其中,p为局部窗口内每个灰度值出现的概率;
根据对比度和熵值的大小调整局部窗口的大小和重叠率;
其中,当对比度小于预设的对比度阈值且熵值小于预设的熵值阈值时,将局部窗口的大小增大,重叠率减小;当对比度大于预设的对比度阈值且熵值大于预设的熵值阈值时,将局部窗口的大小减小,重叠率增大;
将所有局部窗口的映射结果和插值结果组合,得到对比度增强后的图像数据。
4.根据权利要求3所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:对特征数据集进行聚类分析,包括:
采用最小-最大归一化方法对特征数据集进行归一化处理,将特征数据集中的每个特征的取值范围缩放到0至1区间内,得到归一化后的特征数据集;
将归一化处理后的特征数据集划分为训练集和验证集,其中,训练集用于特征选择,验证集用于评估特征集的聚类性能;
初始化候选特征子集为空集,初始化最优特征子集为全集,将归一化后的特征数据集作为初始的候选特征子集;
重复以下步骤,直至最优特征子集的大小达到预设的特征数量阈值k:将候选特征子集中的每个候选特征,将其加入当前最优特征子集,得到新的特征子集;
在训练集上采用新的特征子集训练聚类模型,得到聚类结果;
在验证集上采用训练得到的聚类模型进行聚类,评估聚类性能;
选择加入后使得聚类性能提升最大的特征,将其从候选特征子集中移除,加入最优特征子集,得到新的最优特征子集和新的候选特征子集;
如果当前候选特征子集的聚类性能优于最优特征子集,则将当前候选特征子集更新为最优特征子集;
输出最优特征子集,最优特征子集包含了对聚类结果影响最大的前k个特征。
5.根据权利要求4所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:对特征数据集进行聚类分析,还包括:
计算最优特征子集的核密度估计,其中,核密度估计采用高斯核函数,核密度估计的带宽参数采用Silverman's rule of thumb方法确定;
根据核密度估计的结果,选择密度最高的数据点作为第一个聚类中心;
计算最优特征子集中的每个数据点与第一个聚类中心的距离,距离计算公式为:其中,x为数据点的特征向量,c为聚类中心的特征向量,Σ为特征数据集的协方差矩阵;
根据计算得到的距离,计算每个数据点被选为下一聚类中心的概率,概率计算公式为:其中,d(x)为数据点x与已选聚类中心的距离;
根据计算得到的概率,采用Roulette Wheel Selection方法随机选择一个新的数据点作为下一个聚类中心;
重复以上步骤,直至选择出k个聚类中心。
6.根据权利要求5所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:对特征数据集进行聚类分析,还包括:
计算最优特征子集中的每个数据点属于各个聚类中心的隶属度,隶属度计算公式为:其中,c
根据数据点的隶属度,更新聚类中心的位置,更新聚类中心的位置的公式为:其中,u(x,c)为数据点x对聚类中心c的隶属度,x为数据点的特征向量,c为聚类中心的特征向量;
重复以上步骤,直至聚类中心的变化小于预设的阈值或达到最大的迭代次数。
7.根据权利要求6所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:评估聚类性能,包括:
采用如下公式评估聚类结果的紧凑度和分离度:其中,a(i)为数据点i与同一类别中其他数据点之间的平均距离,b(i)为数据点i与最近的其他类别中数据点之间的平均距离;s(i)取值范围为-1至1,s(i)值越大表示聚类结果的紧凑度和分离度越好;
采用如下公式评估聚类结果的整体性能:
其中,SS_b为类别之间的离差平方和,SS_w为类别内部的离差平方和,k为聚类的类别数,n为数据点的总数;CH值越大,表示聚类结果的类别之间差异越大,类别内部差异越小,聚类性能越好。
8.根据权利要求1至7任一所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:结合用户画像、工艺模式和焊接缺陷检测结果,建立推荐模型,进行焊接工艺推荐,包括:构建用户-工艺模式-缺陷检测结果的三元关系矩阵R,矩阵R中的元素r(u,i,j)表示用户u在工艺模式i下的焊接操作对应的缺陷检测结果j,r(u,i,j)取值为1表示用户在对应工艺模式下的操作结果为j,取值为0表示未知或未发生;
对构建的三元关系矩阵R进行分解,得到用户隐因子矩阵P、工艺模式隐因子矩阵Q和缺陷检测结果隐因子矩阵Y,分解公式为:R≈μ+B
其中,R为m×n×lm×n×l维三元关系矩阵,m为用户数,n为工艺模式数,l为缺陷检测结果类别数;P为m×k维用户隐因子矩阵,k为隐因子维度;Q为n×k维工艺模式隐因子矩阵;Y为l×k维缺陷检测结果隐因子矩阵;B
9.根据权利要求8所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:结合用户画像、工艺模式和焊接缺陷检测结果,建立推荐模型,进行焊接工艺推荐,还包括:通过如下公式修正分解公式:
r(u,i,j)≈μ+b
其中,μ为全局偏置项,b
采用随机梯度下降法最小化误差平方和,优化隐因子矩阵P、Q、Y和偏置项b其中,λ为正则化参数,||·||表示矩阵的Frobenius范数,采用交替最小二乘法对目标函数进行优化求解,交替固定部分参数,优化其他参数,迭代优化直至收敛,得到最优的隐因子矩阵P、Q、Y和偏置项b
10.根据权利要求9所述的基于大数据处理的钢结构焊接工艺质量管理推荐方法,其特征在于:结合用户画像、工艺模式和焊接缺陷检测结果,建立推荐模型,进行焊接工艺推荐,还包括:利用训练得到的最优隐因子矩阵P、Q、Y和偏置项br
其中,r
根据预测的缺陷检测结果概率分布,计算用户u对工艺模式i的潜在偏好,偏好值计算公式为:Preference(u,i)=∑j×r其中,v
对于给定用户,根据其对不同工艺模式的潜在偏好值排序,得到对应用户的工艺模式偏好排序结果,为用户推荐潜在偏好值最高的工艺模式组合。