1.一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,包括如下步骤:步骤S1,采集茶叶样本近红外光谱,获取茶叶样本近红外漫反射光谱数据;
步骤S2,利用多元散射矫正(MSC)对获取的茶叶样本近红外漫反射光谱进行预处理;
步骤S3,对茶叶样本近红外光谱进行降维处理和鉴别信息提取;
步骤S4,对S3中包含鉴别信息的测试样本用一种模糊簇间分离聚类方法进行茶叶品种分类。
2.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S1中,采集茶叶样本近红外光谱时利用傅里叶近红外光谱仪。
3.根据权利要求2所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,所述采集茶叶样本近红外光谱数据的具体方法如下:将茶叶样本研磨粉粹后经40目筛过滤;环境温度和相对湿度保持相对不变,Antaris II近红外光谱分析仪开机预热1个小时;采用反射积分球模式采集茶叶近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值;光谱扫描的波数为10000~
4000cm-1,扫描间隔为3.857cm-1,采集每个茶叶样品的光谱为1557维的数据;每个样本采样
3次,取其平均值作为茶叶样本近红外漫反射光谱数据。
4.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S2中,所述预处理的方法包括:将步骤S1中每个茶叶样本的近红外光谱与茶叶近红外光谱平均值做线性回归,计算每个茶叶样本的近红外光谱相对于平均值的线性平移量和倾斜偏移量,最后,在每个茶叶样本的近红外光谱中减去线性平移量同时除以倾斜偏移量以实现茶叶近红外光谱的多元散射校正(MSC)。
5.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S3中,所述降维处理是利用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;
具体地:
将S2中的光谱用主成分分析计算特征值和特征向量,λkvk=Cvk,λk是第个特征值,vk是第k个特征向量,C是S2中由茶叶近红外光谱数据构成的协方差矩阵,将特征值从大到小排列,取前7个最大特征值对应的7个特征向量,将260个茶叶样本的近红外光谱数据投影到这
7个特征向量组成的特征矩阵W上,即yk=WTzk,zk是S2中第k个茶叶近红外光谱,yk是zk投影到特征矩阵W后得到的数据,经过投影转换将近红外光谱从1557维压缩到7维。
6.根据权利要求5所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,还包括:将这7维光谱数据分为两个部分:从每类茶叶样本中选取若干个样本组成茶叶样本训练集,剩余的样本组成茶叶样本测试集。
7.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S3中,所述鉴别信息提取是利用线性判别分析(LDA)提取茶叶样本的鉴别信息;具体地:用线性判别分析根据式SW-1SBw=βw计算茶叶样本训练集的特征值和特征向量,类内散射矩阵SW和类间散射矩阵SB是由茶叶样本训练集计算得到的,β和w分别为特征值和对应的特征向量,取前3个最大特征值对应的3个特征向量,将茶叶样本测试集投影到这3个特征向量上得到经过线性判别分析处理后的三维数据。
8.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S4的实现包括:S4.1,初始化:设置权重指数m,类别数c,其中m>1;设置参数β;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;以S3中包含鉴别信息的训练样本的均值作为初始类中心值νi(0),计算初始的模糊隶属度值uik(0)如下:S4.2,计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik(r):为样本xk到类中心vi的距离范数,且 xk为第k个样
本,vi是第i类的类中心值,νi(r-1)是第r-1次迭代计算的类中心vi的值; Sfi为模糊协方差矩阵,且 d为样本的维数,n为样本数,uik(r-1)是第r-1次迭代计算的模糊隶属度值;全部样本的模糊隶属度组成模糊隶属度矩阵U(r)={uik(r)}c×n。
S4.3,计算第r次迭代时第i类的类中心值νi(r):
(r)
其中νi 是第r次迭代计算的类中心vi的值;
S4.4,循环计数增加,即r=r+1;若满足条件:||U(r)-U(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值,实现茶叶品种分类。