1. AI新视界首页
  2. AI食品

豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

今天介绍一篇由弗吉尼亚理工大学食品科学与技术系Dajun Yu等人于2021年8月发表于Food Chemistry的一篇文章。文中通过研究毛豆发育过程中理化性质的变化,并应用基于光谱学的机器学习(ML)技术来确定毛豆最佳采收期。对R5(始籽)、R6(满粒)和R7(初熟)生长期采收的毛豆进行了理化特性分析,并用手持式分光光度计测量了豆荚的光谱反射率(360-740nm)。根据毛豆样品的特征特性将其采收期分为“早期”、“准备期”和“晚期”,使用豆荚的光谱反射率的机器学习方法随机森林进行分类,研究结果证明该方法可以确定毛豆的最佳采收期。

摘要

今天介绍一篇由弗吉尼亚理工大学食品科学与技术系Dajun Yu等人于2021年8月发表于Food Chemistry的一篇文章。文中通过研究毛豆发育过程中理化性质的变化,并应用基于光谱学的机器学习(ML)技术来确定毛豆最佳采收期。对R5(始籽)、R6(满粒)和R7(初熟)生长期采收的毛豆进行了理化特性分析,并用手持式分光光度计测量了豆荚的光谱反射率(360-740nm)。根据毛豆样品的特征特性将其采收期分为“早期”、“准备期”和“晚期”,使用豆荚的光谱反射率的机器学习方法随机森林进行分类,研究结果证明该方法可以确定毛豆的最佳采收期。

1. 介绍

毛豆,也称为菜用大豆,几个世纪以来在东亚被广泛消费,在美国也是一种流行的大豆产品。适时采收毛豆可确保其的最佳形态和食用品质。虽然已有许多研究结果清楚地展示了毛豆或大豆种子的物理和化学属性在整个生殖发育过程中是如何变化的,然而利用这些差异来预测最佳采收时间的研究却很少在毛豆上进行。

毛豆

本文研究了毛豆在发育过程中理化性质的变化,并应用基于光谱学的机器学习技术来确定其合适的采收时间,对R5至R7期采收的毛豆的物理性质和化学成分进行了量化。物理特性包括豆荚重量、20粒豆重量、豆荚尺寸和颜色。化学成分包括可溶性糖和游离氨基酸、低聚糖、新鲜豆类的水分、蛋白质、淀粉、脂肪、中性洗涤纤维(NDF)和灰分。使用手持便携式分光光度计在采收的毛豆荚上测量360和740 nm之间的光谱反射率。使用测量的光谱和基于收集的光谱反射率,使用机器学习方法来确定毛豆的采收程度。

2. 材料和方法

2.1.植物材料

研究使用的是2019年5月22日种植在弗吉尼亚州怀特索恩的肯特兰农场的三种基因型(R15-10280,V16-0547,UA-Kirksey)的毛豆。豆荚在六个不同的时间点手工采收,对应于生长阶段的R5-1、R5-2、R6-1、R6-2、R7-1和R7-2。

2.2.毛豆豆荚和豆类的物理特性

在实验室中,使用数字分数卡尺(Husky Tools)测量每个豆荚的长度、宽度和厚度,从每个基因型和重复中随机选择豆荚,打开直到有20粒豆子可用,并记录20粒豆子的重量。

2.3.基于光谱的预测采收时间的机器学习方法

在测量20个豆的重量之前,使用便携式Konica Minolta CM-700d分光光度计测量每个毛豆样品的10个豆荚在360和740 nm之间的光谱反射率。基于所获得的物理和化学数据,对毛豆样品的状况进行评估,并且将所有540个样品分为三类,并标记为“早期类”、“准备期类”和“晚期类”。

数据集以80:20分成训练和测试数据子集,并对训练数据应用10倍重复交叉验证。RF分类器被训练以将每个光谱分配给三个类别(即早期、准备期和晚期)中的一个或两个类别(例如早期对晚期),并且基于交叉验证结果比较由分类器准确度测量的模型性能。

3.结果和讨论

3.1.毛豆和豆荚的物理特性

在毛豆从R5到R7的发育过程中记录物理特性,包括豆荚重量、20粒豆重量、豆荚宽度、长度、厚度和颜色(表1)。

Table 1不同采收期毛豆的物理特性豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

每列的不同字母(abc)表示基于Tukey‘s的HSD检验的单向ANOVA的显著差异(p < 0.05)。

3.2.游离糖、丙氨酸和甘氨酸

图1显示了对甜味有贡献的游离糖(蔗糖、果糖和葡萄糖)的结果。与果糖和葡萄糖相比,蔗糖是毛豆中含量最高的糖。图1(D)-(F)显示了从R5到R7的游离丙氨酸和甘氨酸的变化。从R5到R7说明丙氨酸的积累不受菜豆发育阶段的显著影响。豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

Fig.1.不同采收期毛豆游离蔗糖、果糖、葡萄糖、丙氨酸、甘氨酸、棉子糖和水苏糖浓度(mg/g干重)的变化。每行的不同字母(abcd)表示基于Tukey‘s的HSD测试的单向ANOVA的显著差异(p < 0.05)。无显著水平的同一直线上的点无显著水平。

3.3.常量营养成分

除了外观和甜味,毛豆中的常量营养元素对消费者也非常重要。为此,作者对淀粉、蛋白质、脂肪、纤维、灰分和水分含量进行了量化(表2) 总体而言,基于理化特性,R6前期(R6-1)是毛豆的最佳采收时期。

Table 2不同采收期毛豆的化学成分豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

基于湿重计算鲜豆的水分含量,基于干重计算其他成分。每列不同字母(abc)表示单因素方差与Tukey‘s HSD检验的差异有统计学意义(p<0.05)

3.4.基于光谱学的机器学习分类器

图2对前期、成熟期和后期的光谱数据进行了平均和绘制。分类结果表明使用反射光谱结合机器学习技术可以实现“早期”、“准备期”和“晚期”豆荚阶段的分类。且使用FOD光谱数据训练的模型比使用Prim光谱数据训练的模型表现更好。

豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

Fig. 2.使用机器学习的光谱反射率分析

该模型在对“准备期”类别的光谱数据进行分类时表现不佳;但在将“早期”类别与“后期”类别分开时表现较好,对数据进一步分析,分别使用每两个类别之间的两类分类,仅使用原始光谱数据,对于分离“早期”和“晚期”类别,模型精度显著增加到0.95,对于区分“早期”和“准备期”类别,模型精度显著增加到0.87(图3b)。用于区分“晚期”和“准备期”的模型精度低至0.68。

豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

Fig. 3. 不同分类方法的模型精度比较

 总体而言,通过使用手持便携式光谱仪收集的光谱,证明了RF分类方法可以合理地识别毛豆采收的早期、晚期和准备期阶段。

4.结论

本研究调查了毛豆在发育过程中的物理和化学性质的变化,并应用基于光谱学的机器学习方法来识别毛豆的最佳采收时间。考虑到豆类发育过程中所有物理性质和化学组成的变化,R6早期(R6-1)被确定为采收毛豆的最佳时期。如果需要更长的采收期,R6-2也是可接受的,并且优于R5和R7。

基于豆荚的光谱反射率的机器学习方法对于分类“早期”和“晚期”样品具有0.95的分类精度,对于分类“早期”和“准备期”样品具有0.87的分类精度。然而,对于“晚期”和“准备期”样本的分类,只有0.68的相对较低的准确度。综上所述,本研究证明了基于豆荚光谱反射率的机器学习方法能够识别出毛豆的最佳采收期。

参考文献

Yu, D., Lord, N., Polk, J., Dhakal, K., Li, S., Yin, Y., … Huang, H. (2022). Physical and chemical properties of edamame during bean development and application of spectroscopy-based machine learning methods to predict optimal harvest time. Food Chemistry, 368, 130799. doi:10.1016/j.foodchem.2021.130799

微信号|FoodAI

合作/投稿|biomed@csu.edu.cn

原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/soybean-ml.html

发表评论

邮箱地址不会被公开。 必填项已用*标注