欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2023106361017
申请人: 西安工程大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-03-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.非遗文化数据特征选择方法,其特征在于,包括以下步骤:

步骤1、获取非遗文化数据集,基于萤火虫算法构建非遗文化数据集特征选择模型;具体为:根据获取的非遗文化数据集基于萤火虫算法初始化特征选择模型参数;其中,非遗文化数据集的特征子集即萤火虫数目N为50,最大迭代次数Tmax为30,随机初始化大小为N的萤火虫种群FAG={S1,S2,...,SN},每只萤火虫所对应的初始位置S={Si1,Si2,...,Sid},1≤i≤N,d表示特征数;设置初始吸引力β0、传播介质对光的吸收系数γ、步长的扰动因子α以及最大迭代次数Tmax;在计算每个萤火虫个体即每个特征子集的适应度之前,采用sigmoid函数对每个个体进行编码,从而将其值转换为0、1形式,sigmoid函数的定义如下:步骤2、利用邻域粒度粗糙熵和属性集重要性计算萤火虫种群中个体的适应度FitNGRE;

邻域粒度粗糙熵计算式如下:

NGRE(S)=NGK(D|S)×NEr(D|S)     (2)

式(2)中,NGK(D|S)和NEr(D|S)分别为候选特征子集S相对于决策属性D的邻域知识粒度和邻域粗糙熵,计算式如下:式(3)和式(4)中,δS(xi)为特征子集S中样本的邻域类,|δS∪D(xi)|是在特征子集S和决策属性D中样本的邻域类,U是样本空间;

利用邻域粒度粗糙熵和属性集重要性计算萤火虫种群中个体的适应度,计算公式如下:

式(5)中,λ1和λ2用来调整邻域粒度粗糙熵和属性集重要性的影响程度,且λ1+λ2=1;对于任一萤火虫即特征子集S∈FAG,|S|为特征子集S的特征个数,N为所有特征个数;NGRE(S)为邻域粒度粗糙熵;

步骤3、比较萤火虫个体的适应度之间的大小,令适应度较低的萤火虫个体朝适应度较高的萤火虫个体所在的方向移动,根据空间距离计算出每个萤火虫个体与其他萤火虫个体之间的相互吸引力,进而对萤火虫的位置进行更新并重新计算萤火虫个体的适应度;具体包括以下步骤:步骤3.1、依次将每个萤火虫个体的适应度与其他萤火虫个体的适应度进行比较,按照适应度低的萤火虫个体被适应度高的萤火虫个体吸引的原则,确定每个萤火虫个体分别被种群内哪些萤火虫个体吸引,并根据空间距离计算出每个萤火虫个体与其他萤火虫之间的相互吸引力,吸引力计算公式如下:式(6)中,β0是r=0时的吸引力,γ是光吸收系数,rij为萤火虫个体xi和xj之间的距离;

步骤3.2、对于任意两只萤火虫Si和Sj∈FAG,若Sj的适应度高于Si,则令萤火虫Si朝Sj所处位置的方向进行移动,萤火虫个体的位置更新计算公式如下:Sid(t+1)=Sid(t)+β(rij)(Sjd(t)‑Sid(t))+α(rand‑1/2)      (7)式(7)中,d表示萤火虫个体的空间维度即特征维度,α∈[0,1]为步长因子,β(rij)为萤火虫xi和xj之间的吸引力,(rand‑1/2)是[‑0.5,0.5]区间内的随机数,t是迭代次数;

步骤3.3、利用公式(5)更新萤火虫个体Si的适应度,对所有萤火虫进行排序并找出当前迭代次数中适应度最优的萤火虫个体;

步骤4、判断当前迭代是否达到最大迭代次数Tmax,若未达到,则返回执行步骤3,否则输出全局最优萤火虫个体所对应的非遗文化数据集的最优特征子集。

2.如权利要求1所述的非遗文化数据特征选择方法,其特征在于,所述步骤4还包括,将输出的非遗文化数据集的最优特征子集R按照7:3的比例划分为训练集T和测试集V,并采用CART决策树模型对划分后的特征子集进行分类,在分类过程中,通过计算训练集T中每个特征的基尼指数来选择CART决策树的初始根节点,将训练集T划分成若干子集;训练集T中每个特征A的基尼指数计算公式如下:式(8)中,|T|表示训练集T中的非遗文化数据个数,|Ck|代表训练集T中第k个类别的非遗文化数据量,K为非遗文化级别数目,假设特征A的值将训练集T划分为T1和T2两个类别,那么|T1|和|T2|分别表示每个类别所包含的非遗文化数据量;

对于划分的每个子集,如果该子集中的非遗文化数据属于同一类别,则将该子集标记为一类;否则,跳转至计算特征基尼指数的步骤,并在每个子集上递归应用上述步骤;重复此过程,直至满足停止条件。