今天介绍一篇由Sandra Pradana-López等人于2022年8月发表在Food Chemistry上的文章。本文提出了一种基于人工智能的实时快速检测掺杂扁豆粉的方法。将“无麸质”小扁豆粉与小麦粉或开心果粉混合,然后,拍摄纯的和受污染的小扁豆粉的数字图像,并用于训练基于转移学习的模型(即ResNet34),该模型旨在根据小麦和开心果含量对图像进行分类。本文获得的结果旨在作为概念验证,以评估数字成像与深度学习技术相结合的食物过敏原检测的真正潜力。
今天介绍一篇由Sandra Pradana-López等人于2022年8月发表在Food Chemistry上的文章。本文提出了一种基于人工智能的实时快速检测掺杂扁豆粉的方法。将“无麸质”小扁豆粉与小麦粉或开心果粉混合,然后,拍摄纯的和受污染的小扁豆粉的数字图像,并用于训练基于转移学习的模型(即ResNet34),该模型旨在根据小麦和开心果含量对图像进行分类。本文获得的结果旨在作为概念验证,以评估数字成像与深度学习技术相结合的食物过敏原检测的真正潜力。
摘要
基于卷积神经网络和迁移学习(即 ResNet34)的数学模型已经过训练,可以识别含有微量小麦(麸质)或开心果(坚果)的扁豆粉样本,可帮助两类相关人群(分别患有乳糜泻和坚果过敏的人)。该技术基于对简单反射相机拍摄的照片的分析,并进一步分类为掺杂物类型和数量(高达50ppm)的组。训练了两种不同的算法,每种掺杂物一种,每个神经网络总共使用2200张图像。使用盲数据集(10%的收集图像;最初和随机分离)来评估模型的性能导致了强大的性能,因为99.1%的含有开心果的小扁豆粉样品被正确分类,而96.4%的准确度是达到对含有小麦粉的样品进行分类。
材料和方法
本文将“无麸质”小扁豆粉与小麦粉或开心果粉混合,浓度在5 mg/kg(ppm)到50 mg/kg之间。将整个数据库(2200 张照片)随机分成三组,连续两次分离。在第一种情况下,它将被随机分为大约 90% 和 10%。∼10% 代表将用于盲目验证最终模型的图像。另一方面,~90% 将再次分为大约 75% 和 15%,分别是学习和验证数据集。这些算法允许更大的泛化和更高的计算速度,因为它们基于对估计误差的最大最小值的识别。
这项研究中,使用了一种称为残差神经网络的 CNN(即ResNet34)。 该模型深度为 34 层,主要用于图像分类。这些网络与传统卷积网络的主要区别在于,信息流可以从一层传递到下一层,也可以跳到更下游的另一层。在这项工作中,使用了一种基于先前通用学习过程的学习技术,称为“迁移学习”。 最初的学习是使用大型数据库进行的,与这里研究的系统无关,然后进行微调以实现作者的目标。
结果
为了找到一种检测扁豆中开心果(坚果)和小麦(麸质)掺杂的方法,对三种纯产品和各自的扁豆混合物进行了拍照。具体来说,300个纯样品(100个小扁豆粉、100个小麦粉和 100个开心果粉)和 1800个掺杂小扁豆样品(900个小麦粉和900个开心果粉)的图像。三种纯面粉的代表性图像如图 1 所示。
图 1 . 研究中使用的三种纯产品的图像(扁豆粉和使用的 掺杂 物、小麦粉和开心果粉)。
在图2中,显示了制备的所有掺杂小扁豆类别的图像的随机示例(掺杂浓度:5、7.5、10、15、20、25、30、40和50ppm)。在这种情况下,虽然纯食品存在明显差异( 图 1 ),但当掺入微量浓度的扁豆粉中时,这些差异变得难以察觉,肉眼无法知道是否扁豆粉是掺杂的,更不用说量化这种掺杂的程度了。
图 2 . 以不同浓度掺入小麦粉和开心果粉的扁豆粉样品图像示例。 每个准备好的类别显示一张图像
CNN 用于开心果量化——避免坚果过敏。CNN 使用裁剪到 224 × 224 × 3 的小扁豆样本图像进行训练,其中最后一个值代表颜色通道(红色、绿色和蓝色)。 测试了一组介于 10 -5 和 10 -4 之间的学习系数值。在这些模型条件下,内部验证数据集(197)的所有图像都被分类,没有任何错误。在内部验证期间获得了有希望的结果之后,对用于此目的的 113 幅图像进行了盲验证。得到唯一错误分类的照片,这导致所有11个分类组的总体准确率为 99.1%。这种错误会导致经济损失,但不会危害健康,因为它将纯样本归类为掺杂。
用于小麦量化的 CNN——保护对麸质敏感的人。在这种情况下,第二个 ResNet34 按照与前一个模型相同的程序(相同的图像大小、学习系数范围、时期数等)进行了优化。内部验证样本的 196 张图像的分类准确率为 98.0%。列出了四个错误分类的图像。可以看出,在内部验证期间错误分类的所有图像都被归类为高浓度的混合物,不会造成任何健康风险。考虑到在内部验证中获得的高度准确性,接下来评估了盲验证。 在盲验证集中收集的 112 幅图像中,模型正确分类了 108 幅,总体准确率为 96.4%。图3显示了 4 个错误分类的图像。
图3 . 在对经过训练以检测小麦粉的 ResNet34 进行盲验证期间错误分类的图像(显示的图像是原始图像,在为模型裁剪之前)。
应该注意的是,除了一张错误分类的图像外,所有图像都被归类为小麦浓度较高的样本,包括纯样本,这并不意味着任何健康问题,因为无论如何这些样本都会被丢弃。
这项工作中提出的方法只需用普通相机拍摄面粉样品的照片,然后将它们输入经过训练的 CNN,即可在几秒钟内收到结果。
结论
在这项工作中,提出了两个基于 CNN 的模型,可以检测和量化豆类中 ppm 范围内的两种掺杂。具体而言,开心果粉和小麦粉在扁豆粉中进行量化。一组随机盲样本的训练深度学习模型的准确率分别为 99.1% 和 96.4%。 所有分类错误的样品,除了一个以外其余都被确定为掺入较高浓度坚果或小麦的样品,进一步加强了这些工具在食品安全方面的能力。
参考文献:
Pradana-López S, Pérez-Calabuig AM, Otero L, Cancilla JC, Torrecilla JS. Is my food safe? – AI-based classification of lentil flour samples with trace levels of gluten or nuts. Food Chem. 2022;386:132832. doi:10.1016/j.foodchem.2022.132832
微信号|FoodAI
原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/ai-lentil.html
注意:本站原创指的是原创编译,并不主张对所介绍的工作的版权,如有侵权,请联系删除!