买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法_江苏大学_201910506047.8 

申请/专利权人:江苏大学

申请日:2019-06-12

公开(公告)日:2024-03-22

公开(公告)号:CN110414549B

主分类号:G06V10/764

分类号:G06V10/764;G06F17/16;G01N21/359

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2019.11.29#实质审查的生效;2019.11.05#公开

摘要:本发明公开了一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,包括:一、采用AntarisII傅立叶变换近红外光谱分析仪获取茶叶样本的近红外漫反射光谱数据;二、运用多元散射校正对近红外漫反射光谱数据进行预处理,再将经预处理后的茶叶样本数据随机分配到训练集和测试集中;三、利用一种模糊正交线性鉴别分析的茶叶近红外光谱鉴别信息提取方法从茶叶近红外漫反射光谱数据中提取茶叶品种的鉴别信息;四、使用K近邻分类算法进行测试样本分类,确定所测茶叶样本的种类。本发明是正交线性鉴别分析的模糊模型,既有效克服了LDA的小样本问题,又充分解决了样本类信息多样性的问题,具有检测成本低、鉴别速度快、分类准确率高等优点。

主权项:1.一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,包括如下步骤:步骤1、获取茶叶样本的近红外漫反射光谱;步骤2、预处理茶叶样本的近红外漫反射光谱;步骤3、提取茶叶样本的分类鉴别信息:利用一种模糊正交线性鉴别分析的茶叶近红外光谱鉴别信息提取方法从步骤2中已预处理过的茶叶近红外漫反射光谱数据中提取茶叶品种的鉴别信息,得到包含鉴别信息的训练样本和测试样本;所述步骤3的实现方法包括如下步骤:3.1,给定一个有标记的训练样本数据矩阵d为样本维数,n为训练样本数量,Sft,Sfb,Sfw分别为该训练样本集的模糊总体散射矩阵,模糊类间散射矩阵和模糊类内散射矩阵: c为类别数,m为权重指数,xi为第i个茶叶近红外漫反射光谱训练样本,i=1,2,…,n,x为训练样本集的总体样本均值,uij为样本xi属于第j类的模糊隶属度,j=1,2,...,c,vj为样本集中第j类样本的样本均值;3.2,构造矩阵Hft,Hfb,Hfw,使之满足 3.3,将矩阵Hft以Hft=GΣST的形式进行奇异值分解,其中矩阵G和S都为正交矩阵,G=[G1G2],矩阵Σt为对角矩阵,t=rankHft;3.4,定义矩阵B,其中矩阵为矩阵Σt的逆矩阵,矩阵为矩阵G1的转置矩阵,并将矩阵B以B=PAOT的形式进行奇异值分解,其中矩阵P和O都为正交矩阵,矩阵A为对角阵;3.5,构造矩阵Y,同时将矩阵Yq以Yq=QR的形式进行QR分解,其中矩阵Yq为矩阵Y的前q列组成的矩阵,q=rankHfb,矩阵Q为上三角矩阵,矩阵R为正交矩阵,3.6,最终得到模糊正交线性鉴别分析的特征投影矩阵W=Q,将步骤2的测试集中的第k个测试样本yk转换为zk=ykQ,其中n1为测试样本数,k=1,2,…,n1;步骤4、识别茶叶样本的种类:使用K近邻分类算法KNN将步骤3中蕴含茶叶样本品种鉴别信息的测试样本zk分类,k=1,2,…,n1,以确定所测茶叶样本的种类。

全文数据:一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法技术领域本发明涉及模式识别和人工智能领域,具体涉及一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法。背景技术传统的茶叶品种鉴别方法包括感官审评和理化检测。感官审评是利用眼、舌、鼻、手等人体各种感觉器官,依靠个人经验和规范的技术操作来鉴别茶叶品种。因此,感官审评受人为因素和外界环境的影响较大,难以保证鉴别的客观性和可靠性。理化检测是借助物理、化学理论,使用某种测量工具或仪器设备,对产品进行检验而获取结果的手段。尽管理化检测可以得到高准确率、高可靠性的茶叶品种鉴别结果,但其普遍存在成本高、效率低、步骤繁琐、耗时费工、产品破坏大等问题。近红外光谱技术因其无损、成本低、高效快速、绿色无污染等优点,成为近年来国内外发展最快的检测技术之一,广泛应用于各个领域。近红外光谱的波数范围在10000cm-1~4000cm-1之间,该光谱波段的吸收区与有机分子中含氢基团H-C、H-N、H-O、H-S等振动的合频和倍频的吸收区一致,因而近红外光谱波段包含了大量有机物质中的结构、组成和性质信息。实际上,虽然不同品种茶叶的主要有机化学成分相同,包括茶多酚、咖啡因、蛋白质、氨基酸和儿茶素等;但是这些有机化学成分在不同种类茶叶中的含量是有差异的,这也为运用近红外光谱技术鉴别茶叶品种提供了可能。然而,在对近红外光谱数据进行鉴别信息提取时会出现维数灾难、信息提取困难等问题。降维是处理高维数据、解决维数灾难最为广泛的手段。对于分类任务,线性判别分析是最流行的降维方法之一。但在实际应用中,由于样本数量远小于样本维数,线性判别分析往往存在小样本问题。正交线性鉴别分析的特征提取算法虽然有效解决了线性判别分析的小样本问题,但本质上还是一种“硬”的特征提取算法,难以描述样本类信息的多样性,因此该方法对样本近红外光谱数据的鉴别信息提取和最终分类的准确率影响较大。本发明在正交线性鉴别分析的基础上引入模糊集理论,提出了一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法以实现茶叶的品种鉴别。发明内容本发明为了解决线性判别分析的小样本问题和正交线性鉴别分析的“硬”类的特征提取问题,设计了一种将模糊集理论与正交线性鉴别分析相结合以用于茶叶近红外光谱分类的模糊正交线性鉴别分析方法。一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法在提取茶叶品种的鉴别信息时,以加入模糊隶属度的方式重新定义了目标函数中的散射矩阵,并用模糊C均值聚类算法初始化模糊隶属度矩阵,既有效克服了线性鉴别分析的小样本问题,又充分解决了样本类信息多样性的问题。同时,本发明还具有检测成本低、鉴别速度快、分类准确率高等优点。一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其具体步骤如下:步骤一、获取茶叶样本的近红外漫反射光谱:收集多个种类的茶叶样本,采用AntarisII傅立叶变换近红外光谱分析仪获取茶叶样本的近红外漫反射光谱数据;步骤二、预处理茶叶样本的近红外漫反射光谱:运用多元散射校正MSC对收集到的茶叶样本的近红外漫反射光谱数据进行预处理,再将经预处理后的茶叶样本数据随机分配到两个样本集训练集和测试集中;步骤三、提取茶叶样本的分类鉴别信息:利用一种模糊正交线性鉴别分析的茶叶近红外光谱鉴别信息提取方法从步骤二中已预处理过的茶叶近红外漫反射光谱数据中提取茶叶品种的鉴别信息,得到包含鉴别信息的训练样本和测试样本;进行步骤三即提取茶叶样本的分类鉴别信息之前,需初始化类别数c、权重指数m、聚类中心V以及模糊隶属度U。进行步骤三即提取茶叶样本的分类鉴别信息的详细过程如下:1给定一个有标记的训练样本数据矩阵d为样本维数,n为训练样本数量,Sft,Sfb,Sfw分别为该训练样本集的模糊总体散射矩阵,模糊类间散射矩阵和模糊类内散射矩阵:c为类别数,m为权重指数,xi为第ii=1,2,…,n个茶叶近红外漫反射光谱训练样本,为训练样本集的总体样本均值,uij为样本xi属于第jj=1,2,...,c类的模糊隶属度,vj为样本集中第jj=1,2,...,c类样本的样本均值。2构造矩阵Hft,Hfb,Hfw,使之满足3将矩阵Hft以Hft=G∑ST的形式进行奇异值分解,其中矩阵G和S都为正交矩阵,G=[G1G2],矩阵∑t为对角矩阵,t=rankHft;是一个l×l阶的正交矩阵,其中l为矩阵Hft的列数;表示d×d阶的实数集矩阵,其中d为样本维数。4定义矩阵B,其中矩阵为矩阵∑t的逆矩阵,矩阵为矩阵G1的转置矩阵。并将矩阵B以B=PAOT的形式进行奇异值分解,其中矩阵P和O都为正交矩阵,矩阵A为对角阵;5构造矩阵Y,同时将矩阵Yq以Yq=QR的形式进行QR分解,其中矩阵Yq为矩阵Y的前q列组成的矩阵,q=rankHfb,矩阵Q为上三角矩阵,矩阵R为正交矩阵,6最终得到模糊正交线性鉴别分析的特征投影矩阵W=Q,将步骤二的测试集中的第kk=1,2,…,n1个测试样本yk转换为zk=ykQ,其中n1为测试样本数。步骤四、识别茶叶样本的种类:使用K近邻分类算法KNN将步骤三中蕴含茶叶样本品种鉴别信息的测试样本zkk=1,2,…,n1分类,以确定所测茶叶样本的种类。本发明的有益效果:本发明的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,不仅有效克服了线性鉴别分析LDA的小样本问题,还充分解决了样本类信息多样性的问题,具有检测成本低、鉴别速度快、分类准确率高等优点,既适用于茶叶近红外光谱分类信息的提取和鉴别,也适用于其他食品近红外光谱鉴别信息的提取和分析。附图说明图1是本发明的流程图;图2是茶叶样本的近红外漫反射光谱图;图3是经MSC预处理后的茶叶近红外漫反射光谱图;图4是模糊正交线性鉴别分析提取鉴别信息后得到的测试样本数据图。图5是初始模糊隶属度图;具体实施方式下面结合附图对本发明作进一步说明。如图1所示,本发明的具体操作步骤如下:步骤一、获取茶叶样本的近红外漫反射光谱:收集岳西翠兰、六安瓜片、施集毛峰、黄山毛峰四种安徽品牌茶叶,每种茶叶的样本数为65,共计260个茶叶样本。所有茶叶样本先被研磨粉碎,再用40目筛过滤。获取茶叶样本的近红外漫反射光谱数据的过程中,应尽可能确保实验室的温度、湿度等外界环境的恒定。详尽的光谱采集过程如下:首先,将AntarisII傅立叶变换近红外光谱分析仪开机预热1个小时;其次,设置光谱扫描的波数范围、扫描间隔、扫描次数分别为4000cm-1~10000cm-1、3.857cm-1、32;最后,采用AntarisII傅立叶变换近红外光谱分析仪的积分球漫反射模式获取茶叶样本的近红外漫反射光谱数据,所获得的茶叶光谱数据为1557维的高维数据。同时,每个茶叶样本采样3次,并将3次采样的均值保存在计算机里,以便为后续模型的建立提供实验数据。图2所示,即为260个茶叶样本的近红外漫反射光谱图。步骤二、预处理茶叶样本的近红外漫反射光谱:运用多元散射校正MSC对收集到的茶叶样本的近红外漫反射光谱数据进行预处理,预处理后的茶叶近红外光谱图如图3所示;再将经预处理后的茶叶样本数据随机分配到两个样本集训练集和测试集中,每个种类的茶叶样本各随机抽取22个样本组成训练集,剩下的43个样本则构成测试集。步骤三、提取茶叶样本的分类鉴别信息:利用一种模糊正交线性鉴别分析的茶叶近红外光谱鉴别信息提取方法从步骤二中已预处理过的茶叶近红外漫反射光谱数据中提取茶叶品种的鉴别信息,得到包含鉴别信息的训练样本和测试样本,其中测试样本数据如图4所示。进行步骤三即提取茶叶样本的分类鉴别信息之前,需设置类别数c=4、权重指数m=1.5,并以每类训练样本的均值作为其初始聚类中心值计算初始的模糊隶属度值如下:上式中xi为第i个茶叶近红外漫反射光谱训练样本,为第k类的初始类中心k=1,2,3,4,初始模糊隶属度图如图5所示;进行步骤三即提取茶叶样本的分类鉴别信息的详细过程如下:1给定一个有标记的训练样本数据矩阵样本维数d为1557,训练样本数量n为88,Sft,Sfb,Sfw分别为该训练样本集的模糊总体散射矩阵,模糊类间散射矩阵和模糊类内散射矩阵:类别数c=4、权重指数m=1.5,xi为第i个茶叶近红外漫反射光谱训练样本,为训练样本集的总体样本均值,uij为样本xi属于第j类的模糊隶属度,vj为样本集中第j类样本的样本均值j=1,2,3,4。2构造矩阵Hft,Hfb,Hfw,使之满足3将矩阵Hft以Hft=G∑ST的形式进行奇异值分解,其中矩阵G和S都为正交矩阵,G=[G1G2],矩阵∑t为对角矩阵,d=1557,t=87;4定义矩阵B,其中矩阵为矩阵∑t的逆矩阵,矩阵为矩阵G1的转置矩阵。并将矩阵B以B=PAOT的形式进行奇异值分解,其中矩阵P和O都为正交矩阵,矩阵A为对角阵;5构造矩阵Y,同时将矩阵Yq以Yq=QR的形式进行QR分解,其中矩阵Yq为矩阵Y的前q列组成的矩阵,矩阵Q为上三角矩阵,矩阵R为正交矩阵,d=1557,q=3;6最终得到模糊正交线性鉴别分析的特征投影矩阵W=Q,将步骤二的测试集中的第kk=1,2,…,172个测试样本yk转换为zk=ykQ,测试样本数n1=172。步骤四、识别茶叶样本的种类:使用K近邻分类算法KNN将步骤三中蕴含茶叶样本品种鉴别信息的测试样本zkk=1,2,…,172分类,以确定所测茶叶样本的种类。实验结果:当设置K近邻分类算法KNN中的K值为3时,待测的茶叶样本测试集的茶叶样本数量为172的分类准确率达到100%。上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

权利要求:1.一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,包括如下步骤:步骤1、获取茶叶样本的近红外漫反射光谱;步骤2、预处理茶叶样本的近红外漫反射光谱;步骤3、提取茶叶样本的分类鉴别信息:利用一种模糊正交线性鉴别分析的茶叶近红外光谱鉴别信息提取方法从步骤2中已预处理过的茶叶近红外漫反射光谱数据中提取茶叶品种的鉴别信息,得到包含鉴别信息的训练样本和测试样本;步骤4、识别茶叶样本的种类:使用K近邻分类算法KNN将步骤3中蕴含茶叶样本品种鉴别信息的测试样本zkk=1,2,…,n1分类,以确定所测茶叶样本的种类。2.根据权利要求1所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,所述步骤1的实现方法:采用AntarisII傅立叶变换近红外光谱分析仪获取茶叶样本的近红外漫反射光谱数据;具体方法如下:首先,将AntarisII傅立叶变换近红外光谱分析仪开机预热1个小时;其次,设置光谱扫描的波数范围、扫描间隔、扫描次数分别为4000cm-1~10000cm-1、3.857cm-1、32;最后,采用AntarisII傅立叶变换近红外光谱分析仪的积分球漫反射模式获取茶叶样本的近红外漫反射光谱数据,所获得的茶叶光谱数据为1557维的高维数据。3.根据权利要求2所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,还包括:保持采集环境的温度、湿度相对恒定。4.根据权利要求1所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,所述步骤2的实现方法:运用多元散射校正MSC对收集到的茶叶样本的近红外漫反射光谱数据进行预处理,再将经预处理后的茶叶样本数据随机分配到两个样本集中;所述两个样本集为训练集和测试集。5.根据权利要求1所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,所述步骤3的实现方法包括如下步骤:3.1,给定一个有标记的训练样本数据矩阵d为样本维数,n为训练样本数量,Sft,Sfb,Sfw分别为该训练样本集的模糊总体散射矩阵,模糊类间散射矩阵和模糊类内散射矩阵:c为类别数,m为权重指数,xi为第ii=1,2,…,n个茶叶近红外漫反射光谱训练样本,为训练样本集的总体样本均值,uij为样本xi属于第jj=1,2,...,c类的模糊隶属度,vj为样本集中第jj=1,2,...,c类样本的样本均值;3.2,构造矩阵Hft,Hfb,Hfw,使之满足3.3,将矩阵Hft以Hft=G∑ST的形式进行奇异值分解,其中矩阵G和S都为正交矩阵,G=[G1G2],矩阵∑t为对角矩阵,t=rankHft;3.4,定义矩阵B,其中矩阵为矩阵∑t的逆矩阵,矩阵为矩阵G1的转置矩阵,并将矩阵B以B=PAOT的形式进行奇异值分解,其中矩阵P和O都为正交矩阵,矩阵A为对角阵;3.5,构造矩阵Y,同时将矩阵Yq以Yq=QR的形式进行QR分解,其中矩阵Yq为矩阵Y的前q列组成的矩阵,q=rankHfb,矩阵Q为上三角矩阵,矩阵R为正交矩阵,3.6,最终得到模糊正交线性鉴别分析的特征投影矩阵W=Q,将步骤2的测试集中的第kk=1,2,…,n1个测试样本yk转换为zk=ykQ,其中n1为测试样本数。6.根据权利要求5所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,在提取茶叶样本的分类鉴别信息之前,还包括初始化类别数c、权重指数m、聚类中心V以及模糊隶属度U。7.根据权利要求6所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,所述类别数c=4、权重指数m=1.5。8.根据权利要求6所述的一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法,其特征在于,所述模糊隶属度的初始值的计算方法如下:式中xi为第i个茶叶近红外漫反射光谱训练样本,为第k类的初始类中心k=1,2,3,4。

百度查询: 江苏大学 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。