1. AI新视界首页
  2. AI食品

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

今天介绍一篇由中国肉类食品综合研究中心的Jing Qi等人发表于Food Chemistry的一篇研究型文章。作者对中国七个地区的猪肉样品进行矿物元素分析,并引入机器学习方法,得到了一个高性能的产地可追溯性模型(前馈神经网络,95.71%的整体准确率和曲线下面积接近1),证明了通过矿物元素指纹分析可追溯一个国家内不同猪肉产地的可行性。

今天介绍一篇由中国肉类食品综合研究中心的Jing Qi等人发表于Food Chemistry的一篇研究型文章。作者对中国七个地区的猪肉样品进行矿物元素分析,并引入机器学习方法,得到了一个高性能的产地可追溯性模型(前馈神经网络,95.71%的整体准确率和曲线下面积接近1),证明了通过矿物元素指纹分析可追溯一个国家内不同猪肉产地的可行性。

1. 简介

        消费者对优质肉的需求与日俱增,而优质肉可能与其原产地或生产系统有一定关联的特定价值,如肉类食品上的产地标注。中国市场上目前已出现了许多具有产地标注的猪肉,而猪肉追溯体系尚未完善,这不仅对食品安全和质量有潜在的风险,还可能会限制猪肉出口贸易。肉源认证现已采用了多种分析方法,包括稳定同位素比分析,微量和稀土元素,光谱技术,核磁共振和有机成分指纹分析。但由于生物中元素的组成直接受到区域气候条件、生物环境相互作用和生物代谢的影响,所以多元素分析被认为是追踪食物来源的最可靠的技术方法之一。作者研究证实机器学习可以从数据本身中挖掘信息,并更好地反映数据的自然机制,多元数据分析和机器学习技术是进行食品鉴伪的有力工具。

2. 材料和方法

2.1  样品信息

       作者研究的猪肉样品采集自中国七个地区:北京,广东,福建,辽宁,山西,河南和湖南。每个产地收集了10个样品,总共70个样品,所有猪的样品均在传统的饲喂系统下饲养,屠宰后在采样地直接收集后腿肌肉并保持在-20°C直至处理。

2.2  样品准备和分析

       作者将样品切成小块后用搅拌机切成均匀混合物,使用微波消解仪进行酸解。0.50g 样品,6 mL 65%硝酸和2mL 30%过氧化氢溶液倒入微波消解罐,样品消解为澄清溶液。后转移至塑料样品管中,并用超纯水稀释至15mL。使用ICP-MS测定矿物元素(Na, K, Mg, Ca, B, Ti, Al, Mn, Fe, Co, Cu, Zn, As, Se, Rb, Li, Be, V, Cr, Ni, Mo, Ag, Cd, Sr, Sn, Sb, Ba, La, Ce, Pb, U, Tl和Bi)的浓度,最佳操作条件为:射频功率1550 W,氦气流量4.35 mL / min,动能歧视消除模式(KED),石英玻璃同心雾化器,采样时间0.1 s,重复两次。Rh, Re, In和Ge的内标物10 µg / L用于消除基质效应和仪器偏差。采用外标法进行定量分析,标准曲线的测定系数大于0.99。所有结果均表示为两次测试结果的平均值。在与猪肉样品相同的步骤下,对试剂空白进行11次重复测量以计算检出限。

2.3  数据分析

       从元素分析获得的数据报告为平均值±标准误差。变异系数(CV)用于评估数据的分散性。检测限计算如下:

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

       其中SD是11次重复的试剂空白的CPS(每秒计数)值的标准偏差,b是分析曲线的斜率,v是样品溶液的体积(v = 15 mL),m是测试部分的质量(m = 0.5g)。

   使用Statistical Package for Social Sciences software (version 22.0, IBM, USA)进行统计分析。进行了方差分析(ANOVA),PCA,CA,Duncan多重比较分析和CDA,以确定来自不同产地的样本中元素数据的不同表现。这些方法需要对数据进行归一化预处理(9个元素×7个产地,每个产地10个样本)。为了从数据集中消除系统性偏差,将方差分析用作所有参数的显著性分析的非参数比较。当F值在方差分析中显著时,进行Duncan多重比较以确定各个产地之间的显著差异。CA用于衡量对象之间的相似性。距离和相似性的度量基于欧氏距离的平方。使用PCA进行降维,并通过向前逐步分析选择最重要的变量。 CDA计算了不同的独立判别函数。通过绘制第一函数和第二函数来检查判别空间中各组之间的间隔。为了验证模型的功能和稳定性,执行了“留一法”交叉验证判别分析。预测分类模型(RF, SVM, FNN)是基于R语言建立的。混淆矩阵和接收器工作特征(ROC)曲线(AUC)下的面积用作机器学习算法的性能指标。

3. 结果与讨论

3.1  猪肉中的矿物元素含量

        排除含量低于或接近检出限的元素后,共选择了13种元素进行统计分析(见表1)。显然,猪肉中的K含量最高,超过3000 mg / kg ,Na其次。Mg的含量为255至330mg / kg。Rb和Sr体现了地球化学行为,它们的含量随地表地质而变化,从而提供了更好的产地判别指标。通过来自同一产地的10个样品的相对SD来得出CV,从而评估样品分散度。Co和Ti的CV高意味着来自同一产地的猪肉样品中Co和Ti的含量不同,因此不适合用作可追溯性元素。选择K,Na,Mg,Fe,Ca,Cu,Zn,Mn,Se,Rb和Sr进行后续统计分析。

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

3.2  分析猪肉样品种矿物元素的地域性差异

      方差分析的结果表明,样品中Na,Mg,Zn,Fe,Ca,Rb,Cu,Se和Sr的p值均小于0.05,这表明这9种元素在不同产地之间具有显著差异。进一步进行Duncan多重比较分析以寻找差异来源,发现每个产地都有一个特征性的元素含量分布(见图1)。结果表明与其他产地的样本相比,北京样本的特征是Fe, Cu, Zn和Rb的含量最低,而Se的含量最高;广东样品中Se含量最低,而Ca, Zn, Rb和Sr含量最高;福建省样品中的Ca和Sr含量明显低于其他地区,而Na含量较高;辽宁样品较独特,Mg含量最低,而Na和Fe含量最高;山西样品中的Fe和Cu含量低;湖南样品中的Mg,Fe和Zn含量高。

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

图1.每个区域的特征元素含量(Z分数标准化)的概况

注意:根据Duncan的多重比较,用相同的小写字母标记的列表示没有显着差异(p> 0.05)的子集

       通过PCA降维功能,所有信息都可以用几个综合变量来描述,产地之间特征元素的差异可以更直观,更容易理解。使用ANOVA选择的具有明显产地差异的九种元素进行PCA。前四个主成分(PC)的方差贡献为29.9%、26.1%、14.4%和11.8%,累积方差贡献为82.2%,可以完全解释原始数据信息。PC1中的主要元素为Zn、Fe和Cu;PC2中为Sr、Ca和Na;PC3中为镁;PC4中为Rb。

      为了更好地可视化来自不同地区的猪肉样品的相对分布,将前四个PC标准化得分用于CA。根据距离5.3的树状图切割,将来自不同区域的样本分为7个簇(见图2)。第一簇:河南7个,山西4个,湖北1个,北京1个;第二簇:北京7个;第三簇:北京10个,山西4个;第四簇:福建6个,湖南2个,北京2个;第五簇:湖南5个,福建3个,山西2个,辽宁一个;第六簇:河南2个,湖南2个,辽宁1个;第七簇:辽宁8个,河南1个,福建1个。很明显,猪肉样品中矿质元素的含量存在地区差异,这在追踪其产地方面具有潜在的应用前景。

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

图2 聚类分析

      用11种元素(K,Na,Mg,Fe,Ca,Cu,Zn,Mn,Se,Rb和Sr)进行CDA。进行留一法交叉验证以验证判别模型的效果和稳定性。在标准判别函数图中绘制了来自不同区域的样本(见图3)。得到的分类结果的总体准确度为85.7%,交叉验证的准确度为72.9%。可见,广东样品完全被分离出来,只有1个被鉴定为山西样品。正确识别了湖南的8个样本,2个分别被识别为福建和山西样本。北京,辽宁,河南和山西这四个地区相对较近,因此存在数据点交集,但他们都有7个正确分类的样本。福建的样本相对分散,只有6个样本被正确分类。这些结果与先前的CA结果一致。尽管证实了矿物质元素分析对猪肉产地可追溯性的可行性,但分类性能却不理想。这可能是由于某些产地非常接近。因此,有必要提高分类模型的性能。

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

3.3  机器学习用于产地评估

        机器学习在食物产地追溯领域中具有潜在的应用。此研究对三种不同的分类算法(FNN,SVM和RF)进行了评估,以根据矿质元素的含量对不同产地的猪肉进行分类。在没有真实测试集的情况下,交叉验证是避免出现偏差的有效方法。除了计算出的评价标准外,ROC和AUC作为机器学习算法的性能度量标准,优先于总体精度。图4显示了不同分类模型的ROC和AUC值。表2显示了样本不同分类模型的整体准确性,这三种算法的分类准确率存在显著差异,FNN为94.3%,SVM为98.57%,RF为78.57%。

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

图4. 接收器运行特性下方的区域(ROC)曲线(AUC)

用于(a)RF,(b)SVM,(c)FNN

机器学习技术协助矿物元素分析对中国不同地区的猪肉进行产地判别

       神经网络是一种用于信息处理的数学模型,其使用的结构类似于大脑的突触连接,具有非线性动态特性。神经网络在食品来源可追溯性方面的出色表现已得到多次验证。作者使用了Sigmoid激活函数的FNN,隐藏层节点数为8。FNN模型获得了最佳的精度,从ROC图表中可以看出,AUC接近于1。FNN比SVM更好,这是因为FNN是找到有效映射的一种主动方式,而SVM是一种被动的方式。

4. 结果与讨论

       作者使用矿物元素分析的方法来区分中国不同地区的猪肉样品,并结合机器学习算法的多元统计分析,使用有限的样本数据获得了优秀性能的分类模型。未来需要更大的数据集来构建系统性的可追溯性数据模型,这方面将会有更广泛的应用。

原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/pork-identify.html

注意:本站原创指的是原创编译,并不主张对所介绍的工作的版权,如有侵权,请联系删除!

发表评论

邮箱地址不会被公开。 必填项已用*标注