一种应用于产地溯源的肉类鉴别模型的构建方法以及装置与流程

    专利2022-07-07  79


    本发明涉及肉类鉴别领域,尤其涉及一种应用于产地溯源的肉类鉴别模型的构建方法以及装置。



    背景技术:

    传统的肉类鉴别方法包括生物鉴定法和感官评定法,而对于生物鉴定法一般比如采用聚合酶链式反应(pcr)、酶联免疫分析(elisa)等,该类检测方法虽然检测精度很高但存在着工序复杂、成本高、破坏样本、检测时间长等缺点;而对于感官评定法,需要人工丰富的经验,误差较大。



    技术实现要素:

    为了克服现有技术的不足,本发明的目的之一在于提供一种应用于产地溯源的肉类假冒鉴别方法,其能够解决现有技术中家畜肉类假冒鉴别的成本高、检测时间长、误差大等问题。

    为了克服现有技术的不足,本发明的目的之二在于提供一种应用于产地溯源的肉类假冒鉴别装置,其能够解决现有技术中家畜肉类假冒鉴别的成本高、检测时间长、误差大等问题的问题。

    本发明的目的之一采用以下技术方案实现:

    一种应用于产地溯源的肉类鉴别模型的构建方法,其特征在于,包括以下步骤:

    步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;

    步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始光谱数据;

    步骤3:对所述原始光谱数据使用ost划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集;

    步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别进行归一化预处理;

    步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波段,剔除冗余光谱波段;

    步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过校正集和检测集分别对基于cnn-lstm-softmax网络的鉴别模型进行训练和检测。

    优选地,步骤3中,在采用ost划分算法时,需要以下三个步骤:

    步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;

    步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;

    步骤33:根据异常分值识别出奇异点并剔除。

    优选地,步骤31具体包括如下步骤:

    步骤311:假设同一肉类原始光谱样本集为x,从x中随机选择ψ个作为光谱子样本,放入一棵孤立树的根节点;

    步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数据中指定维度的最大值与最小值之间;

    步骤313:所述切割点p的选取生成了一个超平面,将当前光谱节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点放在当前节点的右分支;

    步骤314:在当前光谱节点的左分支和右分支递归步骤2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续切割或二叉树已经生长到了所设定的高度。

    步骤315:重复步骤311-314过程,构建多颗二叉树。

    优选地,在所述步骤32中,采用以下公式计算异常分值:

    其中h(x)为光谱样本x在每棵树的高度,

    e(h(x))为在n课树中的高度平均值,

    h(ψ)=ln(n-1) 0.577,

    c(ψ)为ψ个子样本下该棵树的平均高度,因此,e(h(x))/c(ψ)为光谱样本x在n课树中的高度平均值的归一化值。

    通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接近1来判断该光谱样本x是否为异常点。

    优选地,在步骤5中,通过sparseadaptivelasso算法寻找光谱重要特征波段:

    假设y=xβ σβε

    其中y=(y1,y2,...yn)为光谱因变量向量,x为光谱自变量矩阵,β为未知参数,ε为随机误差,则:

    sparseadaptive-lasso的代价函数为:

    其中来限定该方程的稀疏性,为求该代价函数的最小值

    求λn使下列表达式最小:

    输出:

    全局最优解为:

    由于为代价函数的最优解,同时为光谱自变量x的系数,由于代价函数中稀疏的限定,导致大部分趋近于0,这说明光谱全波段中的大部分波段的重要性为0,因此剩余的对应的光谱波段即为重要的特征波段。

    优选地,在步骤6中,包括模型的搭建,所述模型搭建的步骤具体包括:

    1)根据不同肉类的鉴别任务建立不同的cnn卷积网络模型并拓展卷积层和maxpooling层的个数,所述卷积层和maxpooling的个数也是根据不同的肉类进行确定;

    2)搭建lstm模型,根据不同肉类的鉴别任务适当调整lstm层数和每层lstm模型的输出个数,将cnn卷积网络模型的输出特征合并为一维序列作为lstm模型的输入

    3)使用多分类softmax作为输出层,将lstm模型的输出作为多分类softmax的输入,softmax的输出为肉类的源地,完成鉴别模型的搭建。

    优选地,在步骤6中还包括对搭建好的模型的训练,具体包括如下步骤:

    a)将所述校正集转换为一维序列数据作为cnn模型的输入;

    b)使用一维卷积提取校正集中的光谱特征信息,使用maxpooling对所述光谱特征信息进行池化以保留边缘特征;

    c)将步骤b中的得到的光谱特征信息输入到lstm模型中,并使用softmax输出分类结果。在训练过程中,选择分类交叉熵作为损失函数,adam作为优化器,relu为cnn激活函数,预测准确率和roc为评价指标;

    d)在所有的校正集执行完所述步骤a)-c)之后,将所述检测集输入训练好的cnn-lstm-softmax模型,通过鉴别模型输出的结果来判断鉴别模型鉴别的准确性。

    相比现有技术,本发明具有以下有益效果:

    本发明通过红外光谱技术结合相应的建模方法对不同种类的肉类进行鉴别判断,解决了现有技术中肉类假冒鉴别时的成本高、检测试剂、误差大等问题。

    附图说明

    图1为本发明提供的鉴别方法的流程图。

    具体实施方式

    下面,结合附图以及具体实施方式,对本发明做进一步描述:

    实施例

    一种应用于产地溯源的肉类鉴别模型的构建方法,包括以下步骤:

    步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;

    将猪肉、牛肉和羊肉等不同种类的精瘦肉购买后放到实验室冰箱冷藏或立即进行样本制作。制作方法为对每个样本切成薄片并放入45度恒温箱烘干48小时,研磨成粉末后装入干燥保鲜膜中保存。

    步骤2:分别采集步骤s1中每个检测样本的原始光谱数据;

    使用傅里叶变换红外光谱仪对制作的样本进行透射光谱采集,扫描的波数范围为4000-450cm-1、分辨率为4cm-1、扫描环境温度为25℃、湿度为30±5%,对每个样本连续扫描多次求平均值得到每个样本的原始光谱数据。

    步骤3:对所述原始光谱数据使用ost划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集。

    由于样本制备过程中被污染或光谱采集过程中受设备、环境等因素的影响,可能存在个别样本成为奇异点样本,其对建模的稳健性、精度都有较大的影响,因此本发明采用ost划分算法首先将奇异点样本从该肉类的样本集中剔除,以免影响后建模,影响鉴别结果。

    对于在剔除奇异点样本与不剔除奇异点样本的两种情况对鉴别的结果性能影响进行了检测,检测结果如表1所示。

    表1剔除奇异点样本与不剔除奇异点样本的两种情况的检测结果对比

    从表1可以看出校正集决定系数r2cal、检测集决定系数r2val、校正集均方根误差rmsec和检测集均方根误差rmsecv均有所提高,说明奇异点样本对建模模型有较大影响,排除奇异点样本后进行建模模型鉴别时,其性能更好。

    步骤4:对多个剩余样本集中所有样本的原始光谱数据分别进行预处理来消除畸变、噪声影响。

    预处理方法为多元散射校正(msc)预处理、标准正则变换(snv)预处理、一阶求导预处理、二阶求导预处理、sacitzky-golay平滑预处理以及归一化六种预处理方法中的一种。

    对上述六种预处理的方法进行分析后得到每种预处理的方法对鉴别结果的影响性能,如表2所示。

    表2不同预处理方法对鉴别结果的影响性能

    从表2中可以看出,一阶求导预处理方法和二阶求导预处理方法不仅放大了特征吸收波段,同时也放大了噪声,导致模型性能和准确率反而下降,而归一化处理由于能够排除不同样本之间厚度、透过率的影响,因此更能有效消除同种肉类样本间的差异,效果最好。其中,r2cal为校正集决定系数、r2val为检测集决定系数、rmsec为校正集均方根误差、rmsecv为预测集均方根误差。另外,从表2中的数据还可以看出,归一化预处理方法的校正集决定系数r2cal、检测集决定系数r2val均为0.99、校正集均方根误差rmsec为0.06、预测集均方根误差rmsecv为0.08、检测集预测准确率为100%,由此可以看出归一化预处理应用于建模时使得预测准确率最高。因此,归一化预处理为最为优选地预处理方法。

    步骤5:对步骤4中得到的每个预处理后的光谱数据寻找对cnn-lstm-softmax模型具有一定影响程度的光谱波段,剔除冗余波段,即光谱数据中的光谱波段仅仅为具有一定影响程度的光谱波段。通过步骤5的处理能够增加鉴别模型的鲁棒性和稳定性。

    步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过建模方法对校正集建立基于cnn-lstm-softmax网络的鉴别模型。

    校正集和检测集划分方法为随机法:将特征提取后肉类光谱样本进行随机按比例2:1分为两部分,校正集和检测集占比为2:1,使用校正集来搭建光谱鉴别模型,检测集不参与模型搭建,使用检测集来测试模型对外部样本的检测性能。

    步骤3中,在采用ost划分算法时,需要以下三个步骤:

    步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;

    步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;

    步骤33:根据异常分值识别出奇异点并剔除。

    进一步,步骤31又具体包括如下步骤:

    步骤311:假设同一肉类原始光谱样本集为x,从x中随机选择ψ个作为光谱子样本,放入一棵孤立树的根节点;

    步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数据中指定维度的最大值与最小值之间;

    步骤313:所述切割点p的选取生成了一个超平面,将当前光谱节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点放在当前节点的右分支;

    步骤314:在当前光谱节点的左分支和右分支递归步骤2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续切割或二叉树已经生长到了所设定的高度。

    步骤315:重复步骤311-314过程,构建n颗二叉树。

    在所述步骤32中,采用以下公式计算异常分值:

    其中h(x)为光谱样本x在每棵树的高度,

    e(h(x))为在n课树中的高度平均值,

    h(ψ)=ln(n-1) 0.577,

    c(ψ)为ψ个子样本下该棵树的平均高度,因此,e(h(x))/c(ψ)为光谱样本x在n课树中的高度平均值的归一化值。

    通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接近1来判断该光谱样本x是否为异常点。

    在步骤5中,sparseadaptivelasso算法通过以下公式寻找光谱重要特征波段:

    假设y=xβ σβε

    其中y=(y1,y2,...yn)为光谱因变量向量,x为光谱自变量矩阵,β为未知参数,ε为随机误差,则:

    sparseadaptive-lasso的代价函数为:

    其中来限定该方程的稀疏性,为求该代价函数的最小值

    求λn使下列表达式最小:

    输出:

    全局最优解为:

    由于为代价函数的最优解,同时为光谱自变量x的系数,由于代价函数中稀疏的限定,导致大部分趋近于0,这说明光谱全波段中的大部分波段的重要性为0,因此剩余的对应的光谱波段即为重要的特征波段。特征提取后对肉类假冒鉴别起决定性作用的特征波段为:

    [451-453cm-1,472-474cm-1,619-622.8948cm-1,642cm-1,657-670cm-1,661cm-1,698-707cm-1,829-831cm-1,860-862cm-1,910-918cm-1,946-963cm-1,1070-1072cm-1,1191-1194cm-1,1880-1898cm-1,1922-1938cm-1]。

    在步骤6中,通过建立cnn-lstm-softmax光谱鉴别模型,对特征提取后的光谱波段进行预测,实现不同肉类的假冒鉴别。

    cnn-lstm-softmax模型搭建和训练过程如下:

    模型的搭建:

    1)根据不同肉类的鉴别任务建立不同的cnn卷积网络模型并拓展卷积层和maxpooling层的个数,所述卷积层和maxpooling的个数也是根据不同的肉类进行确定;

    2)搭建lstm模型,根据不同肉类的鉴别任务适当调整lstm层数和每层lstm模型的输出个数,将cnn卷积网络模型的输出特征合并为一维序列作为lstm模型的输入

    3)使用多分类softmax作为输出层,将lstm模型的输出作为多分类softmax的输入,softmax的输出为肉类的源地,完成鉴别模型的搭建。

    对模型的训练:

    a)将所述校正集转换为一维序列数据作为cnn模型的输入;

    b)使用一维卷积提取校正集中的光谱特征信息,使用maxpooling对所述光谱特征信息进行池化以保留边缘特征;

    c)将步骤b中的得到的光谱特征信息输入到lstm模型中,并使用softmax输出分类结果。在训练过程中,选择分类交叉熵作为损失函数,adam作为优化器,relu为cnn激活函数,预测准确率和roc为评价指标;

    d)在所有的校正集执行完所述步骤a)-c)之后,将所述检测集输入训练好的cnn-lstm-softmax模型,通过鉴别模型输出的结果来判断鉴别模型鉴别的准确性。

    对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。


    技术特征:

    1.一种应用于产地溯源的肉类鉴别模型的构建方法,其特征在于,包括以下步骤:

    步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;

    步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始光谱数据;

    步骤3:对所述原始光谱数据使用ost划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集;

    步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别进行归一化预处理;

    步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波段,保留需要的光谱波段,剔除冗余光谱波段;

    步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过校正集和检测集分别对基于cnn-lstm-softmax网络的鉴别模型进行训练和检测。

    2.根据权利要求1所述的构建方法,其特征在于,步骤3中,在采用ost划分算法时,需要以下三个步骤:

    步骤31:随机抽取多个所述原始光谱数据,构建多棵二叉树;

    步骤32:根据构建的多棵二叉树,计算每个光谱的异常分值;

    步骤33:根据异常分值识别出奇异点并剔除。

    3.根据权利要求1所述的构建方法,其特征在于,步骤31具体包括如下步骤:

    步骤311:假设同一肉类原始光谱样本集为x,从x中随机选择ψ个作为光谱子样本,放入一棵孤立树的根节点;

    步骤312:随机指定一个光谱子样本的测量维度,在当前光谱节点数据范围内,随机产生一个切割点p,切割点p产生于当前节点数据中指定维度的最大值与最小值之间;

    步骤313:所述切割点p的选取生成了一个超平面,将当前光谱节点数据空间切分为2个子空间,把当前所选维度下小于切割点p的光谱节点放在当前节点的左分支,把大于等于切割点p的光谱节点放在当前节点的右分支;

    步骤314:在当前光谱节点的左分支和右分支递归步骤2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据、无法再继续切割或二叉树已经生长到了所设定的高度。

    步骤315:重复步骤311-314过程,构建n颗二叉树。

    4.根据权利要求1所述的构建方法,其特征在于,在所述步骤32中,采用以下公式计算异常分值:

    其中h(x)为光谱样本x在每棵树的高度,

    e(h(x))为在n课树中的高度平均值,

    h(ψ)=ln(n-1) 0.577,

    c(ψ)为ψ个子样本下该棵树的平均高度,因此,e(h(x))/c(ψ)为光谱样本x在n课树中的高度平均值的归一化值。

    通过s(x,ψ)得到光谱样本x的异常分值后,通过判断该值是否接近1来判断该光谱样本x是否为异常点。

    5.根据权利要求1所述的构建方法,其特征在于,在步骤5中,通过sparseadaptivelasso算法寻找需要的光谱波段:

    假设y=xβ σβε

    其中y=(y1,y2,...yn)为光谱因变量向量,x为光谱自变量矩阵,β为未知参数,ε为随机误差,则:

    sparseadaptive-lasso的代价函数为:

    其中来限定该方程的稀疏性,为求该代价函数的最小值

    求λn使下列表达式最小:

    输出:

    全局最优解为:

    为代价函数的最优解,同时为光谱自变量x的系数,趋近于0对应的光谱波段即为冗余波段,非趋近于0对应的光谱波段即为需要的光谱波段。

    6.根据权利要求1所述的构建方法,其特征在于,在步骤6中,包括模型的搭建,所述模型搭建的步骤具体包括:

    1)根据不同肉类的鉴别任务建立不同的cnn卷积网络模型并拓展卷积层和maxpooling层的个数,所述卷积层和maxpooling的个数也是根据不同的肉类进行确定;

    2)搭建lstm模型,根据不同肉类的鉴别任务适当调整lstm层数和每层lstm模型的输出个数,将cnn卷积网络模型的输出特征合并为一维序列作为lstm模型的输入

    3)使用多分类softmax作为输出层,将lstm模型的输出作为多分类softmax的输入,softmax的输出为肉类的源地,完成鉴别模型的搭建。

    7.根据权利要求6所述的构建方法,其特征在于,在步骤6中还包括对搭建好的模型的训练,具体包括如下步骤:

    a)将所述校正集转换为一维序列数据作为cnn模型的输入;

    b)使用一维卷积提取校正集中的光谱特征信息,使用maxpooling对所述光谱特征信息进行池化以保留边缘特征;

    c)将步骤b中的得到的光谱特征信息输入到lstm模型中,并使用softmax输出分类结果。在训练过程中,选择分类交叉熵作为损失函数,adam作为优化器,relu为cnn激活函数,预测准确率和roc为评价指标;

    d)在所有的校正集执行完所述步骤a)-c)之后,得到训练后的cnn-lstm-softmax模型,即为鉴别模型;

    e)将所述检测集输入到训练好的cnn-lstm-softmax模型中,通过鉴别模型输出的结果来判断鉴别模型鉴别的准确性。

    8.一种应用于产地溯源的肉类鉴别装置,其特征在于,包括采用权利要求1-5所述的构建方法构建的模型。

    技术总结
    本发明提供了一种应用于产地溯源的肉类鉴别模型的构建方法,包括以下步骤:步骤1:分别制备多个不同肉类的样本集,每个样本集包括多个检测样本;步骤2:采用红外光谱仪分别采集步骤1中每个检测样本的原始光谱数据;步骤3:对所述原始光谱数据使用OST划分算法进行奇异点检测,然后将奇异点样本从每种肉类的样本集中剔除后得到对应的剩余样本集;步骤4:对多个所述剩余样本集中所有样本的原始光谱数据分别进行归一化预处理;步骤5:获取步骤4中得到的每个预处理后的光谱数据的光谱波段,保留需要的光谱波段,剔除冗余光谱波段;步骤6:将步骤5得到的光谱数据随机划分为校正集和检测集,通过校正集和检测集分别对基于CNN‑LSTM‑SOFTMAX网络的鉴别模型进行训练和检测。所述构建方法能够构建出对肉类进行溯源的模型。

    技术研发人员:吴霆;杨灵;钟南
    受保护的技术使用者:仲恺农业工程学院
    技术研发日:2020.12.02
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-5578.html

    最新回复(0)