一种多源信息融合的泰国茉莉香米掺伪鉴别方法与流程

    专利2022-07-07  199


    本发明涉及食品检测技术领域,特别是涉及一种多源信息融合的泰国茉莉香米掺伪鉴别方法。



    背景技术:

    泰国茉莉香米是指经泰国农业合作部农业司证明确认的泰国当地种植的kaodokmali105和rd15品种产生的非糯性香稻谷碾磨的香糙米或香米。泰国茉莉香米品质优良,是全球最受欢迎,价格最高的大米产品之一。近年来我国对泰国莱莉香米的进口量日益增加,但进口和市场销售的泰国茉莉香米存在着掺伪的问题。《泰国香米检验标准》中指出不同类别和级别的泰国茉莉香米均符合香米含量不少于92%。而个别不良商家为降低成本在泰国茉莉香米中混入廉价的普通大米牟取暴利,侵犯消费者权益,扰乱市场秩序,因此找到一种能快速准确鉴别泰国茉莉香米掺伪的方法对于促进优质大米产业的可持续健康发展具有重要的意义。

    传统泰国茉莉香米鉴别的方法主要有常规鉴定法、分子生物学鉴定法以及气味鉴定法。泰国茉莉香米的常规检测方法有感官法,水煮法。感官法主要通过观察泰国茉莉香米的气味、色泽、精度、粒形等外观特征来进行检测。水煮法主要通过观察米粒在沸水中的糊化程度鉴定泰国茉莉香米。感官法操作简单,检测成本低,但是肉眼观察对检测人员的经验要求较高,容易受主观因素的影响。水煮法精密度高于感官检验法,适合对感官检验不合格的香米进行纯度的复验,但水煮法无法辨别泰国茉莉香米和巴吞米。分子生物学鉴定法主要为dna鉴定法,dna指纹图谱鉴定法是通过提取单个米粒的dna,采用两个基因位点的随机扩增多态性分析(rapd)和聚合酶链式反应对单个米粒进行判断,测定结果准确,但仪器设备要求高,检测费用高。泰国茉莉香米最重要的特征品质是香味,大米的香味检测和评价技术主要有咀嚼法、氢氧化钾法、热水法、蒸煮法、气相色谱法等。检测结果受主观因素影响较大或检测过程耗时长,成本高。

    近红外光谱技术检测样品时,无需繁琐的前处理和化学反应过程,对测试人员无专业化要求,具有操作简单、测试快捷、无污染等优点。大米的主要成分淀粉、蛋白质、水分等含有大量含氢基团,在近红外光不同的波长处产生强度不同的吸收峰。由于大米品种、种植环境、加工和贮存方式的差异,不同来源大米化学组成的含量不同,在近红外光谱图中显示出不同的吸收峰,可用大米样品的近红外光谱信息分析鉴别大米。目前,近红外技术在大米鉴别及品质分析上也有一些应用,一种稻米品质的近红外检测方法与应用(cn201510657245.6)利用近红外光谱技术建立了稻米的蛋白质、脂肪、水分、总糖、灰分、碎米率、谷壳率、糠粉率和整精米率预测模型和测试方法,一种利用近红外光谱技术鉴别五常稻花香大米的方法(cn201410767600.0)采用二阶导数和标准化手段对原始数据进行预处理,然后采用偏最小二乘法建立鉴别模型。由于近红外光谱分析主要是根据不同来源大米化学组成的含量不同而在近红外光谱图中显示出不同的吸收峰来进行分析,所以单纯的近红外光谱信息鉴别香米结果并不准确。不同稻米品种的品质不同,其中整精米率、粒长、垩白度、垩白率等是影响稻米品质的主要因素。泰国茉莉香米与普通大米相比,外观品质上也存在较大的差异,所以大米的常规指标存在一定的鉴别作用。因此,将大米的近红外光谱信息和常规指标信息进行融合建立鉴别模型,可提高泰国茉莉香米鉴别的快速性和准确性。



    技术实现要素:

    本发明的目的是提供一种多源信息融合的泰国茉莉香米掺伪鉴别方法,以解决上述现有技术存在的问题,使鉴别泰国茉莉香米掺伪的过程快速、准确、无损。

    为实现上述目的,本发明提供了如下方案:

    一种多源信息融合的泰国茉莉香米掺伪鉴别方法,包括以下步骤:

    s1.近红外光谱数据采集及光谱预处理:对待测样品进行近红外光谱数据采集,得到吸光值,满足光谱测定条件,选用一阶导数对原始光谱吸光值进行预处理,得到预处理吸光值;

    s2.利用大米外观品质检测分析仪系统检测大米的常规指标,利用色差仪测量样品的l*、a*、b*,其中l*为黑至亮,a*为红色变成绿色,b*为黄色变成蓝色,并用公式计算出白度;

    s3.采用主成分分析对大米的常规指标以及一阶导数预处理后的大米近红外光谱数据进行降维处理,提取特征数据,使各个主成分的特征值大于1、主成分的累计贡献率大于85%,并根据累计贡献率确定主成分保留数、主成分得分;

    s4.建立泰国茉莉香米掺伪鉴别模型:建立支持向量机分类器模型,使用径向基函数作为核函数,建立校正集和验证集,再对校正集进一步处理;

    s5.掺伪鉴别模型的验证:将所述步骤s4划分出的验证集的样本数据进行归一化处理,得到验证集的样本的特征向量,带入所述步骤s4的鉴别模型进行预测,得到是否为泰国茉莉香米的预测值,与验证集的真实值进行比对,得到模型预测的正确识别率。

    进一步地,所述步骤s1中的光谱测定条件为:扫描波长为1000~1799nm,光谱数据点数800,扫描温度为15~25℃,扫描间隔1nm,仪器带宽1nm,光谱重复性小于0.2nm,信噪比大于2000:1。

    进一步地,所述步骤s2中的常规指标为:千粒重、面积、周长、长宽比、长、宽、整精米面积、整精米周长、整精米长宽比、完整米粒长宽比、整精米长、完整米粒长、整精米宽、完整米粒宽、整精米率、整精米千粒重、小碎米率、碎米率、透明度、精度、垩白粒率、垩白度、圆度及整精米圆度。

    进一步地,所述步骤s2中的计算白度的公式为:

    进一步地,所述步骤s4中的掺伪鉴别模型为:f(x)的值为±1,当f(x)=1时为泰国茉莉香米,当f(x)=-1时为非泰国茉莉香米。

    进一步地,所述步骤s4中建立校正集和验证集的过程为:

    将所述步骤s3得到的主成分得分作为样本特征向量形成支持向量机分类器的输入向量矩阵,采用kennard-stone法以4:1的比例划分校正集和验证集。

    进一步地,所述步骤s4中对对校正集进一步处理的过程为:

    将校正集的样本数据进行归一化处理,使用网格搜索法和k-折叠交叉验证法确定径向基函数的惩罚参数c、核函数参数g,用校正集样本对支持向量机分类器进行训练,得到模型分类准确率最高时的c、g值。

    本发明公开了以下技术效果:本发明操作简单,对操作人员无特殊要求;首次建立了正确识别率为100%的泰国茉莉香米掺伪的多源信息融合鉴别模型;使用该模型能准确鉴别泰国茉莉香米的真伪,具有无需任何化学试剂、无损、稳定快速、环境友好、准确率高、检测成本低廉、重复性好的特点;能有效应用于泰国茉莉香米市场的质量监管与检测,对于促进优质大米产业的可持续健康发展具有重要的意义,应用前景广阔。

    附图说明

    为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    图1为本发明实施例的155个泰国茉莉香米和194非泰国茉莉香米的原始近红外光谱图,(a)为泰国茉莉香米样品,(b)为非泰国茉莉香米样品;

    图2为本发明实施例的349个大米样品经一阶导数预处理后的近红外光谱图;

    图3为本发明实施例的支持向量机的参数c、g的参数优化图,(c)为等高线图,(d)为3d视图。

    具体实施方式

    现详细说明本发明的多种示例性实施方式,该详细说明不应认为是对本发明的限制,而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

    应理解本发明中所述的术语仅仅是为描述特别的实施方式,并非用于限制本发明。另外,对于本发明中的数值范围,应理解为还具体公开了该范围的上限和下限之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

    除非另有说明,否则本文使用的所有技术和科学术语具有本发明所属领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料,但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入,用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时,以本说明书的内容为准。

    在不背离本发明的范围或精神的情况下,可对本发明说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。

    关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。

    本发明中所述的“份”如无特别说明,均按质量份计。

    实施例1:

    (1)试验原料收集:四色菊泰国茉莉香米、泰玲珑泰国茉莉香米、金谷象泰国茉莉香米、两种乌汶泰国茉莉香米,为纯种泰国茉莉香米,由金健米业股份有限公司提供。134种不同品种非泰国茉莉香米产自不同国家和地区,其中金健顶佳泰香米、柬埔寨茉莉香米由金健米业股份有限公司提供,泰国大米购置于武汉中百超市,由武汉市嘉禾粮油有限责任公司生产。

    (2)样品配制:

    ①泰国茉莉香米含量为100%的样品:取上述五种泰国茉莉香米中的任意两种排列组合,有10种组合方式,每种组合中两种泰国茉莉香米的含量比为9:1、7:3、5:5、3:7、1:9,共50份样品。取上述五种泰国茉莉香米中的任意三种排列组合,有10种组合方式,每种组合中三种泰国茉莉香米的含量比为1:1:1、1:2:2、2:1:2、2:2:1,共40份样品。

    ②泰国茉莉香米含量为92%~98%的样品:取金健顶佳泰香米、柬埔寨茉莉香米、泰国大米分别与五种泰国茉莉香米配比,使混合后的大米中泰国茉莉香米含量分别为92%、94%、96%、98%,共60份样品。泰国茉莉香米样品为香米含量为92%以上的样品,加上五种纯种泰国茉莉香米,故总泰国茉莉香米样品包括155份。

    ③泰国茉莉香米含量为20%~80%的样品:取金健顶佳泰香米、柬埔寨香米、泰国大米分别与五种泰国茉莉香米配比,使混合后的大米中泰国茉莉香米含量分别为20%、40%、60%、80%,共60份样品。加上134种非泰国茉莉香米,故总非泰国茉莉香米样品包括194份。

    (3)近红外光谱采集及光谱预处理:仪器预热30min后进行仪器自检、性能测试和白板参比,然后将大米样品倒入样品盒中,装满,用样品盒盖压平,将样品放入指定位置,开始光谱测定。光谱测定条件:扫描温度为15~25℃,扫描波长为1000~1799nm,扫描间隔1nm,仪器带宽1nm,光谱数据点数800,光谱重复性小于0.2nm,信噪比大于2000:1,扫描次数3次,每个样品重复装样扫描6次,取平均值,作为该样本的原始数据,图1显示了155个泰国茉莉香米样品的近红外光谱(a)及194个非泰国茉莉香米样品的近红外光谱(b)。采用一阶导数对样品的原始光谱进行光谱预处理得到预处理光谱数据。图2显示了349个大米样品一阶导数预处理后的近红外光谱图,由图2可知,一阶导数处理后的近红外光谱重叠峰分开、分辨率提高、信息量增加。

    (4)大米常规指标检测:称取10克大米样品,平铺于大米外观检测仪的扫描仪上扫描大米外观图片,利用大米外观品质检测分析仪系统计算大米千粒重、面积、周长、长宽比、长、宽、整精米面积、整精米周长、整精米长宽比、完整米粒长宽比、整精米长、完整米粒长、整精米宽、完整米粒宽、整精米率、整精米千粒重、小碎米率、碎米率、透明度、精度、垩白粒率、垩白度、圆度及整精米圆度24个大米常规指标。白度的检测使用色差仪。将样品放入石英比色皿中,用色差仪测量样品的l*、a*、b*,并用以下公式计算白度:其中,l*为黑(0)至亮(100),a*为红色(60)变成绿色(-60),b*为黄色(60)变成蓝色(-60)。泰国茉莉香米和非泰国茉莉香米常规指标的检测结果见表1。

    表1

    注:不同的小写字母代表泰国茉莉香米和非泰国茉莉香米的常规指标存在差异(p<0.05)。

    由表1可知,泰国茉莉香米的各性质值变化范围较小,说明泰国茉莉香米的常规指标间差异较小。非泰国茉莉香米的各性质值变化范围较宽,幅度较大,基本上能覆盖大米常规指标的范围,能用于鉴别泰国茉莉香米和非泰国茉莉香米。

    (5)主成分分析:在模型建立之前,需要采用主成分分析对大米样品的常规指标以及预处理后的大米样品近红外光谱数据进行降维处理,提取特征数据,使各个主成分的特征值大于1、主成分的累计贡献率大于85%,并根据累计贡献率确定主成分保留数,将主成分得分作为样本特征向量形成支持向量机分类器的输入向量矩阵。表2为大米样品常规指标及一阶导数预处理后近红外光谱信息主成分分析的累计贡献率。

    表2

    由表2可知,采用主成分分析对大米的常规指标进行降维处理,将原来具有一定相关性的多变量组合成一组新的相互无关的变量来代替原来的变量,常规指标的7个主成分累计贡献率为87.93%,包含了大米样本大部分信息,因此,前7个主成分能作为数据分析的有效成分。采用主成分分析对预处理后的大米近红外光谱数据进行降维处理,提取光谱的特征数据,原来的800个光谱点被压缩成7个主成分,消除了大量重叠信息。

    (6)建立泰国茉莉香米掺伪鉴别模型:使用matlab建立支持向量机的分类器模型,采用特征层融合结构将信息融合,使用径向基函数作为核函数。模型为:其中,xi为样本的支持向量,x为待预测标签的样本的特征向量,n为支持向量个数,g为核函数参数,wi为支持向量的系数,b*为支持向量对应的参数,f(x)为±1,其中xi、n、wi为matlab软件在建模时获得。当f(x)=1时为泰国茉莉香米,当f(x)=-1时为非泰国茉莉香米。

    将主成分分析得到的主成分得分作为样本特征向量形成支持向量机分类器的输入向量矩阵,采用kennard-stone法以4:1的比例划分校正集和验证集。

    对校正集的样本数据使用mapminmax函数进行归一化处理,使用网格搜索法和k-折叠交叉验证法对支持向量机参数优化。k-折叠交叉验证法主要是将原始数据均分为k组,使每组数据分别作一次验证集,其余的(k-1)组作校正集,以得到的k个模型最终验证集的分类准确率的平均数作为分类器的性能指标,取分类准确率最高时对应的惩罚参数c和核函数参数g为最佳参数,其中k取5,c和g的取值范围定为[2-10,210]。图3为支持向量机的参数c、g的参数优化图,由图3可知,c=27.8576,g=0.3299时,模型的识别效果最好,识别正确率为100%。

    (7)掺伪鉴别模型的验证:将样品验证集的样本数据进行归一化处理,得到验证集的样本的特征向量x,其中x为1×14矩阵,由待测样本常规指标信息提取的7个主成分得分和一阶导数预处理后近红外光谱信息提取的7个主成分得分经归一化处理组成。代入鉴别模型进行预测,得到是否为泰国茉莉香米的预测值,与验证集的真实值进行比对,得到模型预测的正确识别率。表3为泰国茉莉香米掺伪鉴别模型的判别结果,由表3可知,模型校正集和验证集的正确识别率均是100%,故此模型能够有效准确鉴别泰国茉莉香米。

    表3

    以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。


    技术特征:

    1.一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:包括以下步骤:

    s1.近红外光谱数据采集及光谱预处理:对待测样品进行近红外光谱数据采集,得到吸光值,满足光谱测定条件,选用一阶导数对原始光谱吸光值进行预处理,得到预处理吸光值;

    s2.利用大米外观品质检测分析仪系统检测大米的常规指标,利用色差仪测量样品的l*、a*、b*,其中l*为黑至亮,a*为红色变成绿色,b*为黄色变成蓝色,并用公式计算出白度;

    s3.采用主成分分析对大米的常规指标以及一阶导数预处理后的大米近红外光谱数据进行降维处理,提取特征数据,使各个主成分的特征值大于1、主成分的累计贡献率大于85%,并根据累计贡献率确定主成分保留数、主成分得分;

    s4.建立泰国茉莉香米掺伪鉴别模型:建立支持向量机分类器模型,使用径向基函数作为核函数,建立校正集和验证集,再对校正集进一步处理;

    s5.掺伪鉴别模型的验证:将所述步骤s4划分出的验证集的样本数据进行归一化处理,得到验证集的样本的特征向量,带入所述步骤s4的鉴别模型进行预测,得到是否为泰国茉莉香米的预测值,与验证集的真实值进行比对,得到模型预测的正确识别率。

    2.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s1中的光谱测定条件为:扫描波长为1000~1799nm,光谱数据点数800,扫描温度为15~25℃,扫描间隔1nm,仪器带宽1nm,光谱重复性小于0.2nm,信噪比大于2000:1。

    3.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s2中的常规指标为:千粒重、面积、周长、长宽比、长、宽、整精米面积、整精米周长、整精米长宽比、完整米粒长宽比、整精米长、完整米粒长、整精米宽、完整米粒宽、整精米率、整精米千粒重、小碎米率、碎米率、透明度、精度、垩白粒率、垩白度、圆度及整精米圆度。

    4.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s2中的计算白度的公式为:

    5.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s4中的掺伪鉴别模型为:f(x)的值为±1,当f(x)=1时为泰国茉莉香米,当f(x)=-1时为非泰国茉莉香米。

    6.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s4中建立校正集和验证集的过程为:

    将所述步骤s3得到的主成分得分作为样本特征向量形成支持向量机分类器的输入向量矩阵,采用kennard-stone法以4:1的比例划分校正集和验证集。

    7.根据权利要求1所述的一种多源信息融合的泰国茉莉香米掺伪鉴别方法,其特征在于:所述步骤s4中对对校正集进一步处理的过程为:

    将校正集的样本数据进行归一化处理,使用网格搜索法和k-折叠交叉验证法确定径向基函数的惩罚参数c、核函数参数g,用校正集样本对支持向量机分类器进行训练,得到模型分类准确率最高时的c、g值。

    技术总结
    本发明公开了一种多源信息融合的泰国茉莉香米掺伪鉴别方法,包括以下步骤:S1.对大米进行近红外光谱数据采集及光谱预处理;S2.检测大米的常规指标,计算白度;S3.采用主成分分析对大米的常规指标及近红外光谱降维处理再提取特征值,确定主成分得分;S4.建立泰国茉莉香米掺伪鉴别模型;S5.掺伪鉴别模型的验证。本方法具有无需任何化学试剂、无损、稳定快速、环境友好、准确率高、检测成本低廉、重复性好的特点,能有效应用于泰国茉莉香米市场的质量监管与检测,对于促进优质大米产业的可持续健康发展具有重要的意义,应用前景广阔。

    技术研发人员:张宾佳;陈燕雨;赵思明;林利忠;乔冬玲;刘也嘉;曹珍珍
    受保护的技术使用者:华中农业大学
    技术研发日:2020.11.20
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-5582.html

    最新回复(0)