欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2021100989659
申请人: 大连交通大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于人工合成数据过采样技术的不平衡物体识别方法,其特征在于,包括:S1、将源领域少数类样本与目标领域训练样本混合;所述目标领域训练样本,包括:目标领域少数类训练样本和目标领域多数类训练样本;

S2、对每个所述源领域少数类样本在目标领域训练样本中查找k个近邻,并标记k个近邻样本中所包含的所述目标领域多数类训练样本数量为m个;

S3、若m与k相等,将当前的所述源领域少数类样本设置为孤立型,对当前孤立型所述源领域少数类样本进行标记,返回S2;

S4、若m不小于k/2且不大于k时,将当前的所述源领域少数类样本设置为危险型,并通过计算人工合成出k个第一目标领域少数类训练样本,返回S2;

S5、若m不小于0且不大于k/2时,将当前的所述源领域少数类样本设置为安全型,并通过计算人工合成出k个第二目标领域少数类训练样本,返回S2;

S6、过滤掉所有标记的孤立型所述源领域少数类样本,将原始的所述目标领域训练样本和第一目标领域少数类训练样本、第二目标领域少数类训练样本混合构建为新的训练样本集;判断所述新的训练样本集中不平衡率是否小于预先设置的目标值,若小于所述目标值则返回S2,若不小于所述目标值,则得到最终的训练样本集;

S7、根据所述最终的训练样本集通过机器学习算法训练图像分类器,进行物体识别。

2.根据权利要求1所述的一种基于人工合成数据过采样技术的不平衡物体识别方法,其特征在于,所述源领域少数类样本由式(1)表示:所述目标领域训练样本由式(2)表示:

式中,i表示训练样本序号,src和tgt分别表示源领域和目标领域,s表示源领域少数类训练样本个数,p表示目标领域少数类训练样本个数,n表示目标领域多数类训练样本个数,上标+和‑表示的是类标号,+表示少数类,‑表示多数类。

3.根据权利要求2所述的一种基于人工合成数据过采样技术的不平衡物体识别方法,其特征在于,所述若m与k相等,将当前的所述源领域少数类样本设置为孤立型,对当前孤立型所述源领域少数类样本进行标记,包括:寻找所述源领域少数类样本中的每个样本 在Dtgt中的k个近邻样本,若 在所述目标领域训练样本的k近邻样本中所述目标领域多数类训练样本的个数为k,则将样本标记为孤立型。

4.根据权利要求2所述的一种基于人工合成数据过采样技术的不平衡物体识别方法,其特征在于,所述若m不小于k/2且不大于k,将当前的所述源领域少数类样本设置为危险型,并通过计算人工合成出k个第一目标领域少数类训练样本,包括:寻找危险型源领域少数类样本 在 中的k个近邻样本,构造样本对集合

对于V中每个样本对 通过式(3)合成为k个新的源领域

少数类样本qi;

式中, 和 表示集合V中第i个样本对中源领域样本和目标领域样本,假设均为d维特征向量,rand(1,d)表示生成一个1×d的随机向量,该向量的每一个元素是(0,1)区间上服从标准均匀分布的一个随机数。

5.根据权利要求2所述的一种基于人工合成数据过采样技术的不平衡物体识别方法,其特征在于,所述若m不小于0且不大于k/2,将当前的所述源领域少数类样本设置为安全型,并通过计算人工合成出k个第二目标领域少数类训练样本,包括:寻找安全型源领域少数类样本 在 中的k个近邻样本,构造样本对集合

对于U中每个样本对 通过式(4)人工合成为k个新的目

标领域少数类训练样本pi;

式中, 和 表示集合U中第i个样本对中源领域样本和目标领域样本,假设均为d维特征向量,rand(1,d)表示生成一个1×d的随机向量,该向量的每一个元素是(0,1)区间上服从标准均匀分布的一个随机数。