1.一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,包括如下步骤:步骤1、获取茶叶样本的近红外漫反射光谱数据;
步骤2、预处理茶叶样本的近红外漫反射光谱;
步骤3、采用模糊非相关线性鉴别分析的方法提取茶叶近红光谱鉴别信息;
步骤4、采用一种Gath-Geva模糊聚类方法进行茶叶品种分类。
2.根据权利要求1所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,所述步骤1的实现方法:通过使用Antaris II傅立叶变换近红外光谱分析仪的积分球漫反射模式采集茶叶样本的近红外漫反射光谱数据;具体地:第一,将Antaris II傅立叶变换近红外光谱分析仪开机预热1个小时;
第二,设置光谱扫描的波数范围、扫描间隔、扫描次数分别为10000cm-1~4000cm-1、
3.857cm-1、32;
第三,采用Antaris II傅立叶变换近红外光谱分析仪的积分球漫反射模式获取茶叶样本的近红外漫反射光谱数据,所获得的茶叶光谱数据为1557维的高维数据。
3.根据权利要求2所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,尽可能确保采集时的温度、湿度稳恒。
4.根据权利要求1所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,所述步骤2的实现方法:采用Savitzky-Golay一阶导数对收集到的茶叶样本的近红外漫反射光谱数据进行预处理,再将预处理后的茶叶样本数据分为训练样本集和测试样本集。
5.根据权利要求1所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,所述步骤3的实现方法:对经步骤2预处理后的茶叶近红外漫反射光谱数据进行降维处理和分类鉴别信息提取。
6.根据权利要求5所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,所述步骤3的具体步骤包括:
3.1,给定一个有标签的训练样本矩阵 p1为样本维数,n为样本数量,Sft,Sfb,Sfw分别定义为该训练样本集的模糊总体散射矩阵,模糊类间散射矩阵和模糊类内散射矩阵:式中,c为类别数,η为权重指数,xi为第i个茶叶近红外漫反射光谱训练样本,为训练样本集的总体样本均值,uij为样本xi属于第j类的模糊隶属度,vj为样本集中第j类样本的样本均值(j=1,2,3,4);
3.2,构造矩阵Hft,Hfb,Hfw,并使其满足
3.3,计算矩阵Hft的奇异值分解,Hft=G∑ST,其中,矩阵G=[G1 G2], 矩阵p1为样本维数,t=rank(Hft);
3.4,令 其中,矩阵 为矩阵∑t的逆矩阵,矩阵 为矩阵G1的转置矩阵。并计算矩阵B的奇异值分解,B=PAOT,其中矩阵 t=rank(Hft);
3.5,令 其中,矩阵Yq是由矩阵Y的前q列组成的矩阵,q=rank(Hfb);
3.6,最终得到模糊非相关线性鉴别分析的特征投影矩阵W=Yq,将步骤二的训练样本集中的第i(i=1,2,…,n)个训练样本xi转换为x′i=xiW,其中n为训练样本数;将步骤二的测试集中的第k(k=1,2,…,n1)个测试样本yk转换为zk=ykW,其中n1为测试样本数。
7.根据权利要求6所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,还包括:初始化类别数c、权重指数η、聚类中心V以及模糊隶属度U;其中,聚类中心V是以每类训练样本的均值作为其聚类中心值vj,以及模糊隶属度矩阵U中的uij的计算公式如下:式中,xi为第i个茶叶近红外漫反射光谱训练样本,vk为第k类的类中心。
8.根据权利要求1所述的一种模糊非相关线性鉴别分析的茶叶品种分类方法,其特征在于,所述步骤4的实现包括如下步骤:
4.1,初始化:设置茶叶品种数为c(+∞>c≥2),初始权重指数m0(+∞>m0>1),最大迭代数rmax,误差上限的值ε,训练样本数为n,测试样本数n1,以步骤三中的训练样本x′i组成的样本集中每类样本的均值作为初始类中心γi(0),初始模糊隶属度计算如下:γi(0)为第i(i=1,2,…,c)类的初始类中心,zk是步骤三中的第k(k=1,2,…,n1)个测试样本。
4.2,计算第r(r=1,2,……,rmax)次迭代时的隶属度值μik(r);
隶属度值μik(r)表示第r(r=1,2,……,rmax)次迭代计算时(r-1)
第k个样本隶属于第i类的隶属度值,Dik为样本zk到类中心γi 的距离范数,且(r-1)zk为第k个测试样本,γi 是第r-1次迭
代计算的第i类的类中心值;Sfi为模糊协方差矩阵,且
n1为测试样本数,μik(r-1)是第r-1次迭代计算的模糊隶属度值;所有模糊隶属度组成模糊隶属度矩阵 mr为第r次迭代时的权重指数,mr=m0-rΔm;Δm=(m0-1)/rmax;
4.3,计算第r次迭代时的学习速率αik,r
4.4,计算第r次迭代时的类中心γi(r)(i=1,2,……,c)其中γi(r)为第r次迭代计算时第i(i=1,2,……,c)类的类中心,γi(r-1)为第r-1次迭代计算时第i类的类中心;
4.5,当maxi||γi(r)-γi(r-1)||<ε或者r=rmax-1时,迭代结束,否则返回步骤4.2继续迭代计算;当迭代收敛后,根据最终的模糊隶属度μik(r)判别测试样本zk属于哪个品种的茶叶。