拉曼光谱与机器学习结合应用在单细胞水平上快速检测食品传播病原体

ifyoung • 2022年4月7日 pm10:00 • AI食品 • 阅读 1702

今天给大家介绍一篇由Shuaishuai Yan等人，于2021年5月1日上发表在Talanta（IF=6.057）的一篇研究性文章。该文章表明拉曼光谱结合基于指纹的机器学习是快速诊断病原菌的一种前瞻性策略。在这项研究中，在单细胞水平上获得了常见菌株单细胞拉曼光谱（SCRS）。然后，利用核主成分分析(KPCA)提取原始数据的非线性特征，并利用决策树（DT）算法在血清型水平上对单个细菌细胞进行评价和识别。

摘要

1. 背景介绍

由食源性病原体通过食物或水引起的食源性疾病是引发全球公共卫生问题和食品安全事件的主要原因之一。尽管已建立的病原体检测方法表现出极好的可靠性，包括传统的生化检测、免疫学分析(如酶联免疫吸附试验)、基因组分析等，但并不能快速获得检测结果。因此，迫切需要一种快速、准确和具有成本效益的方案来探索食品供应中的潜在病原体。

近年来，利用红外和拉曼光谱等显微光谱技术，可以获得生物体生化成分的独特指纹。此外，利用拉曼光谱检测食品中的致病菌时，具有不需前处理和预培养，以及所需生物样本少等快速区分物种的优势。然而，因为SCRS峰值易受影响，多变量分析困难，细菌异质性等问题，所以根据SCRS对不同的细菌种群进行分类不是一件容易的事情。因此，采用合适的化学计量学方法对不同菌株进行SCRS分类是解决上述障碍的有效途径之一。对于类似的和复杂的多变量SCRS，机器学习通过识别它们的特征提供了前所未有的分类能力。核主成分分析(KPCA)可以提取线性以及非线性特征。该算法不仅消除了原始信息冗余的障碍，而且保持了原始数据的完整性。

本研究收集了7个常见属23株食源性致病菌的SCRS图谱。利用核主成分分析决策树(KPCA-DT)对每个菌株的特征进行识别，对未知细菌进行分类，并与PCA-SVM的分类性能进行比较。结果表明，化学计量学方法通过对数千条SCRS谱带的分析，在快速鉴别食品安全相关细菌方面具有很大的应用前景。

2. 研究结果

2.1单细胞拉曼光谱(SCRS)采集条件的优化

SCRS的信号非常微弱，这与极少的入射光子可以产生非弹性散射密切相关。在不破坏单个细胞的情况下提前获得可接受的拉曼信号是后续分类和测序的关键。图1评估了不同属的单个细胞在不同拉曼采集参数条件下可能的“破坏阈值”。如图1A所示，SCRS的强度随着照射时间的延长而增加。此外，还评价了不同种类的单细胞在不同激光照射时间下的损伤情况 (图1B)。

图1.多种细菌SCRS采集条件的优化。(A)不同照射诱导时间下单细胞1002cm-1 SCRS强度的变化和(B)单个细菌细胞的完整性评价。

2.2 单个细菌细胞的拉曼光谱表征

基于光谱特征代表某一菌株整个生物体指纹的SCRS被用于分类和鉴定。为了通过拉曼光谱实时监测从农场到餐桌过程中食源性致病菌的污染情况，建立了一个详细的典型食源性致病菌拉曼光谱参考数据库。考虑到数据库的广泛适用性，该文库对来自不同属、种和血清型的7种不同病原菌的23株菌株进行了研究。为了最大限度地减少细胞异质性和同一物种的生理状态造成的偏差，作者获得了大量的SCRS。

2.3 一个分类模型中的所有菌株

采用合适的机器学习方法能够准确地解析海量数据，对于消除基于复杂多变的拉曼光谱的分类障碍具有重要意义。作者使用了KPCA从冗余的原始光谱数据中提取特征，并通过DT对每个菌株的生化特征进行判断，从而达到对菌株进行分类的目的。如图2B所示KPCA的特征提取过程。KPCA在捕捉多变量中的非线性关系方面表现出比线性PCA更好的性能，因为它不涉及非线性优化，并且不需要在建模之前指定特征的数量。在此基础上，通过DT的熵准则，找出最优的分支策略，实现更精细的识别。

图2.核主成分分析-决策树模型(KPCA-DT)的建立。(A)10折交叉验证过程中的数据集分布示意图。(B)KPCA-DT的结构示意图。(C)通过混淆矩阵（confusion matrix）和受试者工作特征(ROC)曲线对所建立的模型进行了评估。

2.4 多层次分类模型

为了在单细胞水平上实现对菌株的精细分类，推荐了四级分类模型，该模型根据生物分类的范围来确定鉴定关系。通过10折交叉验证评估了每个KPCA-DT模型在层次结构中的识别性能，并与PCA-SVM进行比较。首先，将数据集分为G+和G-细菌组。KPCA-DT和PCA-SVM的识别结果令人满意，这可能与G+和G-细菌细胞壁结构的显著差异有关。在第二级分类程序(属水平)中，正确地预测了分配给各自属的独立测试集。在第三级分类中，鉴定出李斯特菌和沙门氏菌的种类繁多(种水平)。最后，进一步尝试在血清型水平上识别多株单核细胞增生李斯特氏菌。

图3.通过4级KPCA-DT分类模型对独立测试集的预测结果

KPCA-DT和PCA-SVM的区分策略能够准确地预测未知样本进行类属分类。在菌种甚至血清型水平上进行菌株识别时，KPCA-DT识别方法表现出较好的分类性能。

基于KPCA从原始数据中提取的非线性特征，不同的传统机器学习算法分别用于细菌组、属和种水平的食源性病原体识别。在图S1中，为识别不同水平的菌株而引入的不同算法的分类性能差异很大，但KPCA-DT的识别精度总是令人满意的。同时，KPCA-SVM的交叉验证精度与PCA-SVM 相比较低。这可能是由于KPCA从原始数据中提取的非线性特征过于复杂和细化，不利于SVM的识别和归纳。

图S1.在采用KPCA对原始数据进行预处理的前提下，通过不同的分类模型比较了不同水平下菌株的预测精度。

结果与结论

拉曼光谱结合机器学习方法的分类方案可以根据单个细胞的拉曼光谱成功匹配相应的菌株。无论是通过整体分类模型还是多层分类模型对所研究菌株进行识别，KPCA-DT的综合判别性能都优于PCA-SVM。因此，对于具有多变量的海量数据集的识别和分析，KPCA-DT可能是一个很好的替代CNN的方法。结果表明，该技术可以通过探索单个细胞来快速识别受污染食品中的食源性病原体。此外，进一步的研究将扩大光谱数据库的深度和广度，并尝试分析食品样品中的混合细菌。

参考文献

Yan S , Wang S , Qiu J , et al. Raman spectroscopy combined with machine learning for rapid detection of food-borne pathogens at the single-cell level[J]. Talanta, 2021:122195.

长按关注我们

微信号｜FoodAI

原创文章，作者：ifyoung，如若转载，请注明出处：https://www.drugfoodai.com/raman-ml.html

注意：本站原创指的是原创编译，并不主张对所介绍的工作的版权，如有侵权，请联系删除！

拉曼光谱机器学习病原体食品检测

ifyoung

0 0

微信扫一扫

支付宝扫一扫

豆类中毛豆的理化特性及基于光谱学的机器学习方法在最佳采收期预测中的应用

« 上一篇 2022年3月21日 pm10:13

重磅干货：食品科学数据库资源汇总（国内篇）

下一篇 » 2022年4月9日 pm8:54

AI食品

中国科学院蒋长龙团队:基于集成纸基传感器的便携式智能手机的无酶和快速视觉定量检测农药残留

今天介绍一篇由Qianru Zhang、蒋长龙等于2022年6月发表在Journal of Hazardous Materials上的一篇论文。该研究构建了一个简单、快速、可视化的无酶辅助的草甘膦(Gly)荧光定量检测平台。并且在设计的智能手机平台的辅助下制备了荧光试纸条，显示出作为便携式光学分析终端的潜力，用于定量跟踪真实样品中的Gly。该传感平台为Gly的定量检测提供了可靠的方法，可推广到分析科学领域的其他分析物或污染物筛选。

FoodAI01
2022年8月8日 0 0 829 0
AI健康

基于牛奶营养分子数据集的婴幼儿配方奶粉人性化全息分析方法的建立与评价

今天介绍一篇来自东北农业大学食品科学系张英华，王玉堂课题组于2022年4月发表在Food Chemistry（IF=7.514）上的文章。文中通过研究编制的牛奶营养分子数据集，结合机器学习提出了一种识别婴儿配方奶粉人性化程度的新方法。

ifyoung
2022年7月13日 0 0 1.2K 0
可容忍传感器故障等因素的机器学习模型用于食品质量预测

今天给大家介绍土耳其坎卡亚大学计算机工程系、软件工程系，土耳其伊斯坦布尔巴赫塞希尔大学计算机工程系，荷兰瓦赫宁根大学信息技术组合作，于2020年6月3日发表于Sensors期刊上的一篇研究型文章。文章中作者提出了一种单复数投票系统(SPVS)分类方法，可以通过忽略传感器故障或其他类型的故障来提高对食品质量的评估。为了说明该方法，作者使用了牛肉切割质量评估的案例研究。

ifyoung
AI食品 2020年10月31日 0 0 1.6K 0
AI食品

系统综述人工神经网络在食品加工过程中的建模应用

今天给大家介绍一篇由G. V. S. Bhagya Raj等人合作的，于近期发表在Critical Reviews in Food Science and Nutrition的一篇综述，文章中作者系统综述了ANN在食品加工等领域的应用进展并进行了展望。

ifyoung
2021年1月19日 0 0 3.0K 0
AI食品

植物油中化学物质污染的安全风险评估和预警

今天介绍一篇由上海大学生命科学学院发表于Food Control的一篇文章。文中针对中国的实际情况，分析了三种食用植物油的化学危害污染状况，通过建立多种膳食暴露评价模型，对食用植物油中的苯并芘、黄曲霉毒素B1和重金属进行了风险评价。在此基础上，对食用植物油化学危害的综合风险评价进行了研究，并利用AHP-BP方法建立了食用植物油化学危害程度的预测模型。

ifyoung
2021年4月6日 0 0 2.0K 0
AI食品

goFOOD：用于膳食评估的人工智能系统

作者利用深度神经网络对两个图像进行处理，实现了对食物的检测、分割和识别，以及利用3D重建算法估计食物量。作者提出的膳食评估系统goFOODTM支持319种细粒度的食品类别，并且已经在包含非标准和快餐食品的MADiMa和“Fast food”数据库中进行了验证。goFOODTM在MADiMa数据库中的表现优于经验丰富的营养师，而与“Fast food”数据库中的营养师相当。goFOODTM可为最终用户提供简单有效的膳食评估解决方案。

ifyoung
2020年12月11日 0 3 2.1K 0
AI健康

使用人工神经网络和煮熟米饭的质地特性准确预测米饭的食用和烹饪质量

今天介绍一篇由四川农业大学农学院任万军教授团队于2022年12月发表在Food Chemistry（IF=9.23）上的文章。这篇文章主要讨论了使用人工神经网络（ANN）和米饭的质地特性来预测米饭的食用和烹饪质量（ECQ）的模型开发。

ifyoung
2023年4月27日 0 0 465 0
AI食品

FOOD CHEM|海南大学云永欢课题组：高光谱成像技术结合数据融合的罗非鱼鱼片新鲜度快速检测研究

该文研究了两种波段范围的高光谱成像系统（可见-近红外光谱（Vis-NIR）和近红外光谱（NIR））在冷藏期间测定罗非鱼鱼片中挥发性盐基氮（TVB-N）含量的潜力。利用Vis-NIR和NIR数据，建立了高光谱图像中罗非鱼鱼片平均光谱与其TVB-N含量之间的校正模型，并采用数据融合和多种变量选择方法对模型进行优化。最后，采用优化的模型来实现罗非鱼鱼片中TVB-N含量的可视化分布。结果表明，高光谱成像技术结合数据融合和变量选择等化学计量学方法在罗非鱼鱼片新鲜度无损评价分析中具有可行性。

FoodAI01
2022年6月19日 0 0 1.3K 0
AI食品

混合计算智能算法及其在食品质量检测中的应用

今天介绍一篇由Lavika Goel等人近期发表在Artificial Intelligence Review上的论文。作者介绍了各种用于发现食物变质的图像分割技术，并开发了新颖的混合算法并进行了验证和比较，最后展望了今后的应用场景。

ifyoung
2021年1月24日 0 0 1.3K 0
AI食品

基于多元素筛选的化学计量学和创新多维数据分析的意大利牛肝菌产地溯源

“食品原产地认证”和“食品欺诈”一直以来都是令人感兴趣的话题。今天介绍一篇由Antonio Francesco Mottese等人发表于Food Control 的文章。该研究基于来自意大利、中国和波兰采集的牛肝菌样品的元素特征，结合主成分分析(PCA)、逐步典型判别分析(stepwise-CDA)、分类回归树(CART)、偏最小二乘判别分析(PLS-DA)和创新多维分析(MDA)建立统计模型，通过标准化学计量学技术和创新化学计量学技术的结合为预测食用牛肝菌(Boletussect.Boletus)的地理来源建立了一套可靠的系统。

FoodAI01
2021年10月13日 0 1 1.7K 0