1. AI新视界首页
  2. AI食品

使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

今天给大家介绍一篇由Astraya等人合著,于前段时间发表在Food Chemistry上的一篇研究型文章。文章中作者为了模拟酚类化合物在不同储存条件下的降解动力学,建立了3种机器学习模型。

今天给大家介绍一篇由Astraya等人合著,于前段时间发表在Food Chemistry上的一篇研究型文章。文章中作者为了模拟酚类化合物在不同储存条件下的降解动力学,建立了3种机器学习模型。

1. 介绍

使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

在过去的几十年里,一些研究者从水果成分中提取了一系列生物活性化合物,其主要是酚类化合物,现主要用于功能食品或食品添加剂的制作。比如草莓树的果实中含有大量的酚类化合物,特别是黄酮-3-醇(儿茶素、没食子儿茶素等)。由于黄酮-3-醇具有抗氧化和抗菌等生物活性,以及它们的食用与各种人体健康有关(包括预防肥胖症、心血管疾病或癌症等),人们对黄酮-3-醇的关注越来越多。这些化合物,特别是儿茶素,已经被证明了它们可以在食品中作为天然防腐剂的潜力;但是,加工和储存的pH和温度会加速它们降解,这可能会限制它们在食品工业中的使用。为了模拟这些化合物在不同储存条件下的降解动力学,作者建立了3种机器学习模型:随机森林模型、支持向量机模型和人工神经网络模型。所选模型可用于追踪不同化合物的动力学和所研究的性质,而不需要对反应体系的先验知识。

2. 结果和讨论

2.1 用于研究粉末状提取物稳定性的模型

作者用不同的pH值(2、4、5、6、7、8和9)溶液溶解不同纯度的提取物(约5 mg)。然后,提取物被冷冻干燥,在四个不同的温度(-20,5,25和45°C)下保存0,10,20和30天。用此步骤获得112个实验案例(7pH×4T×4t),然后根据其在黄烷醇中的含量、儿茶素的含量和剩余的抗氧化活性来了解富含儿茶素的粉末状提取物的贮存稳定性。

作者采用反复验证法找出各模型参数的最佳组合,该方法需要建立大量的模型。一旦所有模型都完成,就会根据验证阶段的调整选择机器学习(ML)模型的最佳模型。然后用查询数据案例对每个最佳ML模型进行测试。

2.1.1粉末存储儿茶素模型

表1 开发模型的调整参数使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

如表1所示,用于确定粉末儿茶素储存稳定性的模型在每个研究阶段均具有相似的行为。人工神经网络(ANN)模型是在验证阶段呈现最低RMSE(均方根误差)的模型。该模型具有良好的确定系数,其值为0.9256。在验证阶段观察到的良好性能也可以在训练阶段看到,ANN模型的R2为0.9289,RMSE为1.32 mg儿茶素/g。对于训练阶段,ANN模型不是呈现最小误差的模型。随机森林(RF)模型在训练阶段的RMSE更好,在验证阶段,其RMSE非常接近ANN的RMSE。考虑到验证阶段的结果,可以说ANN是具有最大预测能力的模型。

作者研究证明在查询阶段,可以观察到ANN模型是调整效果最好的模型(与验证阶段提供的调整值一致)。ANN模型是预测粉末儿茶素的储存稳定性的最佳ML模型。由ANN模型提供的良好调整可以在图1-A中看到,它呈现了实验值与预测值。由此可见,人工神经网络模型对实验数据的预测是相当可靠的。使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

图1所示模型获得的观测值与预测值之间的相关性。

A-粉末储存儿茶素采用ANN模型,B-粉末储存黄酮-3-醇采用ANN模型,C-粉末储存DPPH采用ANN模型,D-粉末储存RP采用RF模型。

2.1.2 粉末储存黄酮-3-醇类模型

作者确定了粉末黄酮-3-醇储存稳定性的模型呈现出每个阶段不同的行为。在这种情况下,随机森林模型是训练和验证阶段调整最差的模型(见表1)。RF模型验证阶段的误差较大,对应的测定系数为0.9553。在训练阶段,误差保持在较低的水平。结果表明,随机森林模型不是一个可以用来确定粉末储存黄酮-3-醇稳定性的模型。在验证阶段,支持向量机(SVM)模型获得的RMSE低于RF模型,并且其R2略有增加。根据训练和验证阶段的改进SVM模型在查询阶段表现出良好的行为,表1所示的调整说明了这一事实。

作者最后认为,最佳模型是人工神经网络模型。在训练阶段,该模型的RMSE为1.44 mg 黄酮-3-醇/g,R2为0.9949。对于验证阶段,该模型具有较高的R2,而具有较低的RMSE。根据作者实验的调整,可以说ANN模型可能是确定粉末存储黄酮-3-醇稳定性的良好模型。实验良好的调整可以在图1-B中看到,它们表示了实验值与预测值之间的关系。所有的点都与坡度为1的直线(红线)吻合得很好。因此,作者肯定了人工神经网络模型是一种可以确定黄酮醇粉末贮存稳定性的可靠模型。还有第二个ANN模型,它提供了与所选模型相似的调整。在这种情况下,对于训练阶段,它是一种神经网络,它比选择的模型提供了更好的调整,而对于验证阶段,调整略差。但该模型对其查询阶段进行了更好的调整,这是因为其对位于图中间区域的点有更好的预测。  

2.1.3 粉末存储DPPH模型

作者的表1显示出了第三组模型,用于确定DPPH的稳定性。在这种情况下,开发的最差模型是SVM模型,该模型呈现出最高的训练误差和验证阶段。考虑到训练和验证阶段的错误,可以认为此模型在实际情况下是不可用的。随机森林模型改善了训练阶段的调整,但在验证阶段,与SVM模型的差异很小。在查询阶段,与SVM模型相比,RF模型的调整幅度较小。

        作者的实验证明,最好的模型是ANN模型,它在模型开发的所有阶段都提供了最好的调整。良好的调整可以在图1-C中看到,它给出了DPPH的实验值和预测值。神经网络模型对实验数据的预测精度较高。可以看出,数据的离散度很低,可以很好地预测DPPH值高和低的点。根据调整和图形表示,可以确认ANN模型可用于确定粉末存储DPPH的稳定性。

2.1.4 粉末存储RP模型

表1的下半部分显示了为粉末状态开发的最后一个模型。与以前的情况不同,ANN模型不是在验证阶段调整最佳的模型。最好的模型是RF。该模型在验证阶段的RMSE最低(0.20 nM Fe2+ / mg C,R2为0.9802),但是,在训练阶段,该模型产生的误差是三个最佳选择模型中最大的误差(0.27 nM Fe2+/mg C)。在实际测试中,该模型在0.9647左右呈现出良好的R2,这将对应于0.27 nM Fe2+/ mg C左右的均方根误差。RF模型提供的调整结果如图1-D所示。可以看出,RF模型可以准确地预测实验数据。最后,确认RF模型可用于确定粉末存储RP的稳定性。

2.2 研究在模拟食品基质的水溶液体系中提取物稳定性的模型

作者将不同的纯化提取物(约1g)溶解成溶液并调节溶液至不同的pH值(3、5、7和9)。将提取物溶液在五个不同温度(25、40、55、70和85°C)的水浴中储存0、1、3、5、12和24小时。该步骤总共进行了120个实验案例(4 pH×5 T×6 t),用于根据其在黄醇-3-醇和儿茶素中的含量来了解富含儿茶素的提取物的水溶液稳定性。

如上所述,反复试验法最终找到了每个模型的最佳参数组合。此方法意味着要开发大量模型。制作完所有模型后,将根据验证阶段的调整为ML方法选择最佳模型,并通过查询数据案例进行测试。

2.2.1 儿茶素水溶液模型

表2显示了为模拟儿茶素在水溶液系统中的稳定性而开发的最佳模型。SVM模型是在训练阶段和验证阶段均显示最大误差的模型。考虑到这些结果,可以说SVM模型是具有较低预测能力的模型。表2显示了RF模型如何显著减少其在训练阶段和验证阶段的错误。这两个阶段的良好性能都可以与查询阶段的调整值进行对比,在该阶段,RF模型以较低的误差和较高的确定系数调整预测值。

作者根据RMSE,在验证阶段的最佳模型是ANN模型。该模型为验证阶段提供了最小的误差(6.78μg儿茶素/ mL),它对应于R2的高值(0.9919)。在训练阶段,ANN模型再次具有较高的R2值(0.9793)和较低的RMSE误差(9.58μg儿茶素/ mL)。对于查询阶段,该模型的RMSE低(13.57μg儿茶素/ mL,高于RF模型),并且其测定系数保持较高的值(0.9620)。在图2-A中可以看到此模型提供的良好调整。人工神经网络模型可以合理地预测实验数据。但是,可以看出某些点与斜率为1的线(红线)存在偏差。尽管如此,可以肯定的是ANN模型是确定水溶液系统中儿茶素稳定性的有用模型。

2.2.2 黄酮-3-醇水溶液模型

本研究中开发的最后一组模型是确定黄酮-3-醇水溶液系统稳定性的模型组。

表2本研究中开发的模型的调整参数:随机森林(RF),支持向量机(SVM)和人工神经网络(ANN),RMSE是均方根误差,R2是训练(T),验证(V),查询(Q)和整体阶段(所有数据,OV)的确定系数。使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

考虑到表2所示的结果,可以肯定的是基于神经网络的模型在验证和查询阶段对所开发的每个模型进行了最佳调整。同样,在预测儿茶素在水溶液体系中稳定性的模型中,SVM模型在所有阶段的预测结果都是最差的,SVM模型是一种预测能力较低的模型。RF模型比SVM模型有更好的效果,不仅体现在模型的验证上,也体现在训练阶段。使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

图2.表2所示模型获得的观测值和预测值之间的相关性,在水溶液体系中,A-ANN模型测得的A-水儿茶素和B-ANN模型测得的B-水黄烷-3-醇最后,根据验证阶段中的RMSE,得出最完善的模型是ANN模型,该模型具有最小的RMSE(8.30μg黄酮-3-醇/mL),对应于高测定系数(0.9959)。在训练阶段,该模型呈现出良好的R2值,均方根误差低;对于查询阶段,RMSE表示最小值,而测定系数值较高。其可以在图2-B中看到良好的调整,其中神经模型可以准确地预测实验数据。综上,ANN模型可以用于确定黄酮-3-醇在水溶液中的稳定性。

2.3 机器学习模型与动力学数学模型的比较

在作者的研究小组中,先前已经使用t,pH和T建立了多变量模型来确定化合物在粉末和水溶液系统中的稳定性。从这个意义上讲,将与动力学模型和本研究开发的所选ML模型提供的调整进行比较(表3)。此外,由Albuquerque等人(2017)年进行的模型的开发均使用了所有数据(没有对模型进行保留数据检查)。考虑到这一点,将与Albuquerque等人(2017)的数据进行模型比较。

表3本研究中选择的模型-人工神经网络(ANN)和随机森林(RF)-以及先前研究中开发的模型的调整参数(以*标识的模型)。 RMSE是均方根误差,R2是训练(T),验证(V),查询(Q)和整体阶段(所有数据,Ov)的确定系数。使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

建立的测定儿茶素粉剂贮存稳定性的动力学模型具有较好的调整性(R2=0.8592,均方根误差为2.86mg儿茶素/g)。从这个意义上说,如果将这些调整与人工神经网络查询阶段的调整进行比较,可以看出,ANN模型改进了Albuquerque等人 (2017年)开发的动力学模型。与ML模型整个阶段的调整相比,改进幅度更大。Albuquerque等人(2017)开发的下一个模型是用于确定粉末黄酮-3-醇的储存稳定性的模型,该模型显示出良好的调整性。这些调整与所选ANN模型获得的调整一致。总体阶段的调整时,ML模型改进了Albuquerque等人(2017)开发的模型。

由Albuquerque等人(2017)开发的用于确定DPPH储存稳定性的动力学模型显示出相对较好的调整。所开发的ANN模型在查询阶段的R2为0.9143,RMSE为10.57 nM DPPH / mgC。这些调整改善了动力学模型。ML模型的整个阶段的R2为0.9611,RMSE为8.27 nM DPPH / mgC。

由Albuquerque等人(2017年)开发的最后一个模型确定了粉末的储藏稳定性,RP表现出良好的调整(R2为0.9578,RMSE为0.31 nM Fe2 + / mg C)。本研究开发的RF模型根据查询阶段和整体阶段的调整改进了动力学模型。可以得出结论,ML模型比动力学模型具有更好的性能,可以确定粉末存储特性的稳定性。

为确定儿茶素和黄烷-3-醇在水溶液体系中的稳定性而开发的模型表现出了不同的行为。与Albuquque等人 (2017年)建立的动力学模型相比,用于确定儿茶素稳定性的ANN模型具有更好的调整性。然而,用于确定黄酮-3-醇在水溶液体系中稳定性的ANN模型比Albuquque等人 (2017)开发的动力学模型的调整更差。在此基础上,考虑到测定黄酮-3-醇稳定性的模型对整体阶段的调节作用与动力学模型的值接近,因此基于机器学习的模型可以说是测定水溶液体系中儿茶素和黄酮-3-醇稳定性的有效模型。  

最后,从6个研究系统获得的结果,可以得出结论,对于这种类型的动力学机制,ML模型具有良好的预测能力。考虑到最佳模型(5个ANN模型和一个RF模型),可以肯定的是,与RF和SVM模型相比,ANN模型具有强大的预测能力。

3. 结果与讨论

作者使用了机器学习方法,能够确定粉末和溶液体系中儿茶素和黄酮-3-醇的稳定性,以及粉末体系中DPPH和RP的稳定性。对于选定的最佳模型,作者在0.9128至0.9909之间获得了总体确定系数。这些模型在R2值介于0.9084和0.9912之间的情况下,在实际使用中具有很好的调整能力。有了这种预测能力,可以使用不同的ML来选择模型跟踪所研究的不同化合物的动力学和性质,而无需反应系统的先验知识要求。因此,ML模型可以大大简化这些化合物稳定性监测系统的开发。但这些模型的最大限制是调整系统所需的时间,尤其是ANN模型。此外,本研究中开发的模型可以通过添加更多实验案例,分析另一个数据库随机分割,使用不同的归一化策略,研究另一系列训练周期和中间神经元,甚至可以考虑到新的变量等方式进行改进。

参考文献

  • A G A , B B R A , C M A P , et al. Stability assessment of extracts obtained from Arbutus unedo L. fruits in powder and solution systems using machine-learning methodologies[J].Food Chemistry, 2020, 333.

关注我们使用机器学习方法评估草莓树果实提取物在粉剂及溶剂系统中的稳定性

原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/strawberry-stability.html

注意:本站原创指的是原创编译,并不主张对所介绍的工作的版权,如有侵权,请联系删除!

发表评论

邮箱地址不会被公开。 必填项已用*标注