今向大家介绍一篇来自武汉轻工大学的刘言等人在SPECTROCHIM ACTA A上发表的一篇论文。该研究基于食用油的二维相关光谱并设计卷积神经网络(CNN)对食用油的同步相关谱和异步相关谱进行分析。用一组不同产地的芝麻油和另一组掺有其他植物油的橄榄油对该方法进行了评价。两个数据集的预测准确率分别为97.3%和88.5%。
摘要 ABSTRACT
今向大家介绍一篇来自武汉轻工大学的刘言等人在SPECTROCHIM ACTA A上发表的一篇论文。该研究基于食用油的二维相关光谱并设计卷积神经网络(CNN)对食用油的同步相关谱和异步相关谱进行分析。用一组不同产地的芝麻油和另一组掺有其他植物油的橄榄油对该方法进行了评价。两个数据集的预测准确率分别为97.3%和88.5%。
01 介绍
食用油是我们日常生活中必不可少的产品。由于不同种类、甚至不同产地的食用油价格差异很大,一些不法商家用便宜的食用油来冒充昂贵的食用油,或者用劣质食用油掺假上等食用油。因此,真实性成为食用油的重要质量标准,建立快速、准确的食用油鉴别和掺假分析方法势在必行。
在一些实际应用中,由于掺假成分的多样性和微量性,以及掺假成分与食用油特征峰的重叠,传统的一维光谱很难提取食用油中掺假成分的特征信息。对于近红外光谱分析而言,由于其信号强度低、信号峰高度重叠等缺点,在油脂分析中表现得尤为明显。因此,二维(2D)相关光谱被提出。二维(2D)相关光谱通过特殊的外部扰动(温度、溶剂等)将交叉峰扩展到第二个维度。二维相关光谱中出现的交叉峰提供了有关光谱强度变化之间的相似或不同的额外信息。因此,与传统的一维光谱相比,二维相关光谱更适合于分析详细的光谱数据。
本研究将二维相关光谱和卷积神经网络相结合,提出了一种食用油产地溯源和掺假分析的新方法。用溶剂微扰法获得了食用油的二维相关光谱,然后设计卷积神经网络对食用油的同步相关谱和异步相关谱进行分析。利用一组不同产地的芝麻油和一组掺有其他植物油的橄榄油数据,分别对该方法的产地和掺假鉴别能力进行了评价。
02 材料和方法
2.1 二维相关光谱
由一组一维谱X (m×n)得到,其中m和n分别表示样本数和数据点(波数)。矩阵X的每一行都可以看作在给定波数下光谱强度变化的向量。由方程计算可得同步和异步二维相关光谱。
2.2 数据集和计算
制备了两组食用油的二维相关光谱数据。数据集1包含来自三个不同地理来源(A区、B区和C区)的900个芝麻油样品,每个区域分别涉及300个样品。数据集2包含600个纯橄榄油样本(150个样本)和掺有10%-20%大豆油(150个样本)、玉米(150个样本)和菜籽油(150个样本)的橄榄油样本。对于每个数据集,样本被随机分为校正集和预测集。对于数据集1和数据集2,校正和预测集分别涉及600个和300个、400个和200个样本。用校正集对CNN进行训练,用预测集评价所构建CNN的准确性。
近红外光谱仪在透射模式下测量了掺杂5%(V/V)、10%(V/V)和15%(V/V)丙酮的样品的一维光谱。对于数据集1中随机选取的样品,纯油的光谱和不同程度的丙酮掺杂油的光谱如图所示。从图中可以看出。1(A)大多数峰位于4000~4500 cm−1和5500~6000 cm−1处,且4000~4500 cm−1处的峰强度较大。
对于每个样品,通过使用方程计算四个一维谱来计算相应的同步和异步二维相关光谱。图1(B)和(C)分别绘制了所选样本的同步和异步二维相关光谱。
图1 数据集1中随机选取样本的一维和二维谱,纯油、不同程度掺丙酮油的1D光谱(a)、同步2D相关谱(b)和异步2D相关谱(c)。
3 结果与讨论
3.1 食用油的二维近红外光谱
为了显示不同产地芝麻油的差异,在数据集1中随机选择了来自3个地域的3种芝麻油(α,β和γ)。图2分别绘制了它们相应的同步和异步二维相关光谱。从图2(A)、(B)和(C)中可以看出,来自不同产地来源的三个样品的同步二维相关光谱是相似的。从图2(D)、(E)和(F)中看出,同步二维相关光谱略有不同,三种芝麻油的峰位置相似,但峰强度略有不同。
只有三个样品的同步和异步二维相关光谱可能不能反映来自三个地理区域的芝麻油光谱差异的全貌。为了更清楚地显示光谱的差异,将校正集中600个样本的同步光谱和异步光谱的二维矩阵(250×250)排列成一维矩阵(600×125,000),然后用主成分分析将矩阵分解为分数矩阵和负载矩阵。
图2 样品α (a)、β (b)和γ (c)的同步2D相关谱和样品α (d)、β (e)和γ (f)的异步2D相关谱
3.2 确定神经网络层数
具有不同层次序列类型的CNN的构建,以用于区分不同地理区域的食用油。对于每种类型的CNN,还设计了具有不同数目滤波器的卷积层。以精度为标准,利用校正集中的样本对网络进行优化。卷积层中的滤波器数目也会影响精度,如图3。结果表明,具有较长层序列的网络可能具有较高的预测精度。但当层序达到某一阈值时,预测精度将保持稳定。另一方面,卷积层中的滤波器数目对预测精度的影响可能会根据不同的层序而有所不同。对于数据集1,选择9层网络4个滤波器的网络对预测集里的食用油数据进行判别是合理的。
3.3 网络层的输出
采用9层网络(CNN 2)和卷积层4个滤波器对芝麻油的产地来源进行判别。将同步和异步二维相关光谱输入网络。图4绘制了校正和预测集合的混淆矩阵。A区、B区和C区的真阳性分别为99%、100%和98.5%。校正样品的准确度为99.2%。此外,对于预测集中的样本,预测结果也是相似的。A区、B区和C区样品真阳性分别为99%、100%和93%。预测样本的准确率为97.3%。
图3. 不同结构的CNN的优化结果。具有不同层序列和不同过滤器的CNN(A)。具有不同过滤器的CNN 1(B),CNN 2(C)和CNN 3(D)。
图4. 数据集1中校正集(a)和预测集(b)的混淆矩阵
3.4 数据集2的结果
使用数据集2对掺假分析结果进行进一步评价。对数据集2的优化结果表明,9层卷积层和6个滤波器的网络具有较好的预测效果。对于优化后的网络,图5绘制了校正和预测集合的混淆矩阵。可以看出,对于预测集中的样本,纯橄榄油、掺有豆油、玉米油和菜籽油的真阳性率分别为88%、94%、88%和84%。预测样本的准确率为88.5%。与数据集1相比,用于掺假分析的数据集2的预测结果的正确度和准确性似乎较低。但在实际应用中其结果仍是可以接受的。
图5. 数据集2中校正集(A)和预测集(B)的混淆矩阵。
4 结论
该研究将二维相关光谱和卷积神经网络相结合,提出了一种食用油鉴别和掺假分析的新方法。用溶剂微扰法获得了食用油的二维相关光谱。然后设计卷积神经网络(CNN)对食用油的同步相关谱和异步相关谱进行分析。研究发现,通过该网络可以放大食用油地理区域或类型的差异。另一方面,对于不同的网络,卷积层的层序和滤波数也许会影响分析结果。实验中用一组不同产地的芝麻油和另一组掺有其他植物油的橄榄油对该方法进行了评价。两个数据集的预测准确率分别为97.3%和88.5%。结果表明,该方法为实际应用中食用油的鉴别和掺假分析提供了一种新的方法。
参考文献
- Yan Liu, Liyun Yao, Zhenzhen Xia, Yonggui Gao, Zhiyong Gong,Geographical discrimination and adulteration analysis for edible oils using two-dimensional correlation spectroscopy and convolutional neural networks (CNNs), Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy 246 (2021) 118973.
微信号|FoodAI
原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/spectrum-cnn.html
注意:本站原创指的是原创编译,并不主张对所介绍的工作的版权,如有侵权,请联系删除!