1.基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,包括以下步骤:步骤1,输入待分类的极化SAR图像,对极化SAR图像进行预处理;
步骤2:根据步骤1处理后的样本作为初始训练样本集D,从训练样本集D中随机选取部分样本进行标记,将选好的标记样本数据集记为X,同时选取大量的未标记样本为无标签数据集U;
步骤3:然后根据步骤2中当前注释的像素对样本进行数据增强,然后利用卷积神经网络进行训练并学习其高层语义特征,得到图像的特征信息以及空间信息;
步骤4:将步骤3学习到的高层语义特征的训练集输入到softmax分类器进行分类;对于PolSAR图像分类任务,为了提高分类精度,选择EBQ技术作为查询条件,使用信息熵H(Xi)来记录未标记样本的不确定性;在每次迭代中,利用主动学习首先从未标记的候选样本集U’中进行注释,然后添加新的注释后使用更新的样本集X’利用CNN重新进行训练;
步骤5:在步骤4更新后的数据集X’上分别利用Pauli分解、Krogager分解、Huyen分解、Yamaguchi分解方法提取出PolSAR图像4种不同类型的极化特征并得到特征集;
步骤6:根据步骤5生成的4种特征集进行两两组合,利用SVM来协同训练分类器{D1,D2,D3,D4,D5,D6},得到若干SVM分类器;
步骤7:将每个SVM分类器再分别对U中未预测的样本U’继续进行预测,将预测出来的分类概率进行整合,然后挑选出不可信的样本进行删除,再继续从U’中挑选出可信度高的样本加入到集合X’中,然后将它输入到CNN网络模型上继续进行训练,保存训练好的网络参数模型,通过网络中最后一层softmax层对全连接层输出的特征进行归一化,然后计算每类地物的后验概率得到最后的分类结果,并以此来得到整副PolSAR图像的分类结果。
2.根据权利要求1所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤1中的预处理是Lee滤波处理。
3.根据权利要求1所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤3的具体步骤为:首先对步骤2中当前注释的像素进行水平翻转、垂直翻转和顺时针旋转空间变换来实现数据增强,然后利用卷积神经网络对当前带有标签的像素进行训练并学习高层语义特征,包括PolSAR图像的特征信息以及空间信息;通过CNN自动从高维图像数据中提取特征向量,原始图像数据的维数大大减小,并且提取了最有用的分类信息。
4.根据权利要求3所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤4具体为:对于PolSAR图像分类任务,主动学习是一个迭代交互式的过程;从使用有限数量的带注释样本训练的原始分类器开始;在每次迭代中,主动学习首先从未标记的候选样本集U进行注释,然后在添加新的注释后使用更新的样本集X’利用CNN对分类器进行重新训练;选择EBQ技术作为查询条件,使用信息熵H(Xi)来记录未标记样本的不确定性;
步骤4.1:EBQ算法首先从初始训练集中以装袋的方法选取m个训练集,然后使用这m个训练集分别训练出m个分类模型,这些模型构成委员会,步骤4.2:使用委员会中的分类器对未标记样本集中的每一个样本进行预测,并对每一个样本根据预测类别贴上标签,因此,每一个样本就拥有K个标签,步骤4.3:EBQ利用这些标签来计算样本的熵值,其中EBQ查询函数定义为:
信息熵定义为:
其中 表示样本Xi被m个训练模型预测为类别ω的概率,即样本Xi的预测标
签为ω的得票数/m;Ni是类别总数;
步骤4.4:得到样本的熵值后,由BVSB准则来衡量样本的不确定性,在这个准则中,只考虑属于该样本最大和次大的两个类别,而忽略该样本属于其他类别,将不确定性大的样本看作是价值大的样本;该准则表示为:其中,Xi为样本,P(yBest|Xi)为样本的最优类别概率,P(ysecond|Xi)为样本的次优类别概率;
在主动学习的迭代中,如果委员会中所有分类器对样本所属类别的预测一致时,H(Xi)为0,表示将此样本加入训练集几乎不能对模型的改善提供帮助,而当委员会分类器对样本标签的预测分期越大时,H(Xi)也就越大,那么该样本提供的信息量就越大;BVSB准则只考虑分类结果中可能性最大的两个,忽略了其他可能性较低的类别概率,更能直接地来度量对所估计样本的不确定性。
5.根据权利要求4所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤5具体为:步骤5.1:利用Pauli分解在极化SAR图像得到特征集合F1;
Pauli分解将散射矩阵[S]表示为Pauli基{[Sa],[Sb],[Sc],[Sd]}的复数形式的加权和,在线性正交基(H,V)下,Pauli基用下面的2*2矩阵表示:Pauli分解是四种散射机制的相干分解,其物理解释可查阅在线性正交基(H,V)下Pauli分解的物理解释;
步骤5.2:利用Krogager分解在极化SAR图像得到特征集合F2;
Krogager分解是将一个对称的散射矩阵[S]分解为三个相干分量球、二面角和螺旋体散射之和,最后两个分量带有一个方位角θ,这种分解又简称为SDH分解,如果在线性正交基(H,V)下考虑散射矩阵[S],那么SDH分解可表示如下:参数 表示球分量相对于二面角分量和螺旋体分量的偏移量,ks,kd,kh分别表示球、二面角、螺旋体散射分量对散射矩阵[S]的贡献大小;
步骤5.3:利用Huyen分解在极化SAR图像得到特征集合F3;
根据Huynen分解理论,Huynen分解是针对T矩阵的特征分解,对于分布式目标的统计描述形式<[T3]>进行参数化,经过处理后的相干矩阵用9个自由度的是实参数表示:这里A0,B0,C,D,E,F,G,H都称为Huynen参数,这9个独立的参数每一个都含有一定的目标散射信息,具体含义可查阅Huynen参数表;这些参数都是从散射矩阵[S]中得到的,由散射矩阵得到与目标相关的重要信息;
步骤5.4:利用Yamaguchi分解在极化SAR图像得到特征集合F4;
Yamaguchi分解是一种为极化协方差/相干矩阵建立四种散射机制的模型,除了面散射、二次散射和体散射分量外,还加上螺旋散射项Helix分量;假设体散射、二次散射、表面散射和螺旋体散射成分之间互不相关,Yamaguchi分解是将测量得到的协方差矩阵表示为:<[C]>=fs<[c]>s+fd<[c]>d+fv<[c]>v+fh<[c]>h (6)其中,复系数fs、fd、fv、fh分别表示对应表面散射、二次散射、体散射、螺旋体对协方差矩阵的贡献;Ps、Pd、Pv、Ph分别是表面散射、二次散射、体散射、螺旋体散射对应的散射功率,散射功率以及总功率分别为:
2 2
Ps=fs(1+|β|),Pd=fd(1+|α|),Pv=fv,Ph=fh (7)
2 2 2
Span=Pt=Ps+Pd+Pv+Ph=<|SHH|+2|SHV|+|SVV|> (8)。
6.根据权利要求5所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤6具体为:由于单组特征不能很好的反映出地物类型的特征,所以分类器的效果较差,对步骤5生成的4种特征集任选两组特征进行组合,利用SVM来协同训练分类器{D1,D2,D3,D4,D5,D6},共训练出6个有差异性的分类器。
7.根据权利要求6所述的基于主动学习和协同表示的小样本极化SAR图像分类方法,其特征在于,所述步骤7具体为:将每个SVM分类器再分别对U中未预测的样本U’进行预测,将预测出来的分类概率进行整合,采用概率投票法来进行集成,然后挑选出不可信的样本进行删除,再继续从U’中挑选出可信度高的样本进行标注加入到集合X’中,然后将它输入到CNN网络模型上继续进行训练,保存训练好的网络参数模型,通过网络中最后一层softmax层对全连接层输出的特征进行归一化,然后计算每类地物的后验概率得到最后的分类结果;其中,全连接层将权重矩阵与输入向量相乘再加上偏置,将n个(‑∞,+∞)的实数映射为K个(‑∞,+∞)的实数;Softmax将K个(‑∞,+∞)的实数映射为K个(0,1)的实数,同时保证它们之和为1。