1. AI新视界首页
  2. AI食品

机器学习揭示食品-药品和辅料-药品相互作用

今天介绍一篇由麻省理工David H. Koch整合癌症研究所、MIT-IBM Watson AI实验室、机械工程学院和哈佛医学院附属布莱根妇女医院数据,于2020年3月发表在Cell Reports上的一篇实验型文章。文章应用了机器学习的方法对GRAS和IIG化合物的未知生物活性进行了研究。研究发现维生素A棕榈酸酯和松香酸分别是P-糖蛋白和UGT2B7的抑制剂,并通过一系列的实验进行了验证确认。他们的模型可以预测常见食用化学物质的生物学效应,并对食品-药品和辅料-药品相互作用以及功能性药物制剂的开发产生了新的影响。

| 作者:杨正飞 编辑:肖冉

今天介绍一篇由麻省理工David H. Koch整合癌症研究所、MIT-IBM Watson AI实验室、机械工程学院和哈佛医学院附属布莱根妇女医院数据,于2020年3月发表在Cell Reports上的一篇实验型文章。文章应用了机器学习的方法对GRAS和IIG化合物的未知生物活性进行了研究。研究发现维生素A棕榈酸酯和松香酸分别是P-糖蛋白和UGT2B7的抑制剂,并通过一系列的实验进行了验证确认。他们的模型可以预测常见食用化学物质的生物学效应,并对食品-药品和辅料-药品相互作用以及功能性药物制剂的开发产生了新的影响。

机器学习揭示食品-药品和辅料-药品相互作用

1.介绍

由FDA收录的公认的安全化学药品(GRAS)和非活性成分(IIG)常被认为可作为药品和食品中安全的添加剂。现在,越来越多的研究和临床报告对它们的生物学惰性提出了质疑,但目前不管是有害还是有益的生物效应都未被重视。重要的是,GRAS / IIG化合物的生物效应可以为药物发现和功能性食品或药品的配方设计提供新的想法。
但鉴于目前面临的实验鉴定高昂成本以及高通量的限制,作者使用机器学习方法来预测GRAS / IIG化合物的生物靶点,可深入了解这些基本化合物类的生物学效应,并为药物发现和药物配方研究提供创新的起点。

2.结果

2.1 IIG和GRAS化合物类似于药物,并已在以前的生物测定中进行测量

作者通过对799种IIG / GRAS化合物的分子特性和结构进行研究,发现IIG / GRAS化合物的许多重要的分子性质均类似于已批准的药物(见图1B),并且其化学空间存在大量重叠(图1C)。这些数据表明,GRAS / IIG化合物与批准的药物之间似乎没有潜在的物理化学或化学(亚)结构区别,这支持了GRAS / IIG具有发挥相关生物学效应的潜力。根据ChEMBL22数据,总共有877个阳性的检测结果已被确认为GRAS / IIG化合物(见图1D)。其中,排名前四的阳性测定化合物是对乙酰氨基酚(39种活性)、咖啡因(34种活性)、L-谷氨酸(26种活性)和鞣酸(23种活性)。而最受GRAS / IIG化合物调控的蛋白质家族是酶(160种活性),裂解酶(129种活性),电化学转运蛋白(122种活性)和核受体(98种活性)(见图1E)。

2.2机器学习预测IIG和GRAS化合物的生物关联

作者将877种已知GRAS / IIG化合物以及对应的1334128条阳性和阴性测量值,构建了1776个机器学习模型。其中,随机森林模型表现最优,MAE值为0.95。此外,分子量与pAffinity之间存在正相关关系,这可以更加准确的预测每种蛋白质的活性。作者最终共得到1903个GRAS / IIG化合物的预测配体-靶标关联(见图1F),其结果比目前已知的这些分子活性多了2倍(见图1D)。
GRAS / IIG化合物的三个最常预测的靶点是聚腺苷酸结合蛋白1(127个预测值),脂肪酸结合蛋白3(95个预测值)和鞘氨醇1-磷酸酯受体Edg-3(89个预测值),它们分别与眼-咽肌营养不良、心脏利用脂肪酸和多发性硬化症有关。重要的是,以前报道的生物活性数量与GRAS / IIG化合物的预测生物活性数量之间没有强相关性(Pearson线性相关r = 0.17;见图1C),这表明安全化合物存在大量未知的多药理学空间,并且作者的机器学习方法独立于先前获取的GRAS和IIG化合物的生物活性数据。

机器学习揭示食品-药品和辅料-药品相互作用
图1.非活性成分(IIG)和安全(GRAS)化合物类似于FDA批准的药物,并具有已知或潜在的新型生物活性

(A)显示了研究的总体流程和所利用的数据集。(从FDA网站(https://www.fda.gov)提取并整理了通常被认为是GRAS和IIG化合物的CAS号,并使用CACTUS NIH网络服务器(https://cactus.nci.nih.gov)将其转换为SMILES结构表示形式。这些化学表示被用来计算其理化特性(http://rdkit.org),并与批准的药物(https://www.drμgbank.ca)进行性质分布的比较。从ChEMBL22(http://ebi.ac.uk/chembl)中提取生物活性数据,以鉴定先前报道的GRAS / IIG化合物活性,并建立机器学习模型(https://scikit-learn.org)以预测其他GRAS / IIG化合物的生物活性。)
(B)比较GRAS(浅蓝色)、IIG(深蓝色)和存储在DrμgBank数据库中FDA批准的药物(药物,橙色)之间的分子量,计算的logP以及旋转键的比例的分布。通过箱线图表示的统计结果表明这三种不同的分布有很大的重叠。
(C)将GRAS(浅蓝色)和IIG(深蓝色)所包含的化学空间与存储在DrμgBank5.0数据库中的批准药物(橙色)进行比较。(显示了利用Morgan指纹(R = 4, 2048位; RDKit)基于t-SNE的投影)
(D)GRAS和IIG的药理学网络(化合物显示为浅蓝色(GRAS)或深蓝色(IIG)节点; 蛋白质靶标(ChEMBL22)以红色显示。化合物和靶标之间的连接基于先前已测量化合物与蛋白质相互作用时(黑线),或者基于机器学习模型预测该化合物可能与蛋白质相互作用(Z score> 4;灰线))
(E&F)以前报告的(左,E)和计算预测的(右,F)活性数量在不同蛋白质家族(内部饼图)水平上的分布。前七个家族被标记;外部饼图可直观显示每种蛋白质的报道或预测的活性数量;注释了已报道或预测有超过10种可被GRAS或IIG化合物调节其活性的蛋白质。

2.3松香和松香酸在试管和中抑制UGT2B7

作者将UGT2B7抑制的机器学习模型在10折交叉验证中显示了可接受的准确性(MAE = 0.3;见表S4)。模型预测松香酸可以抑制UGT2B7,其IC50值为2.8 μM,并在体外实验得到证实(见图2B-2C)。同源建模对接发现,最可能的结合模式是将松香酸定位在催化位点和辅助因子结合结构域之间的界面上,从而抑制UGT2B7的代谢(见图2D)。

机器学习揭示食品-药品和辅料-药品相互作用
图2. 松香和松香酸抑制UGT2B7活性

(A)松香酸(1)和训练数据化合物异长叶酸(2)的化学结构。
(B)体外验证显示,松香(黑圈)和松香酸(橙色方块)抑制微粒体中的UGT2B7活性。
(C)在复杂的组织肝裂解物中证实了松香酸(橙色)对UGT活性的影响,其中松香酸减缓了UGT底物的转化(Biovision K692;灰色)。
(D)计算对接表明松香酸具有在底物(金色)和辅因子结合(青色)结构域的界面与UGT2B7相互作用的潜力。

2.4维生素A棕榈酸酯抑制P-gp活性

作者的模型在10折交叉验证中显示的MAE为0.45。模型预测维生素A棕榈酸酯可以抑制P-gp,IC50值为5 μM(见图3B),该预测并在实验中得到了验证(见图3C-3G)。同源建模对接发现这种抑制效应可能是由于棕榈酸酯尾部占据了ATPase位点引起的,并与P-gp的1047位点的精氨酸残基形成稳定的氢键(见图3H)。

机器学习揭示食品-药品和辅料-药品相互作用
图3.维生素A棕榈酸酯调节P-gp活性

(A)P-gp参与了所批准药物的8%的运输,涉及范围广泛的不同适应症(DrμgBank 5.0)。 完整的条对应于170种已批准的药物;右侧仅显示至少包含三种药物的子类。
(B)维生素A棕榈酸酯(3)的结构。
(C)维生素A棕榈酸酯在HepG细胞中抑制P-gp活性的IC50为2.9±3.6 μM。(Biovision K507)数据绘制为均值和标准差,使用标准三参数方程式在Prism中拟合“抑制剂和反应”曲线。
(D)(E)中的离体组织渗透性实验的示意图。
(E)维生素A棕榈酸酯增加了四种已知P-gp底物的伊立替康,雷尼替丁,秋水仙碱和洛哌丁胺在猪肠道组织中的渗透性。P≤0.001;包含Holm-Sidak校正的两尾t检验。
(F)(G)中的体内实验示意图。
(G)小鼠口服给药后,维生素A棕榈酸酯显示华法林(一种已知的P-gp底物)轻度增加。(p = 0.04;单尾t检验)
(H)计算对接表明,维生素A棕榈酸酯可以与P-gp的ATPase位点结合(蓝色网格),并与ARG1047形成的稳定氢键结合(黄色虚线;见黑色箭头)

3.结论

作者通过实验发现基于公开可用的生化数据的最新机器学习可以有效地利用它来快速发现GRAS和IIG化合物的药理学相关靶点。这进一步展示了快速且易于部署的数据科学工具在预测天然产物在复杂生物系统中的效应方面的潜在应用。但此类算法将在很大程度上依赖于高质量数据的可用性,表明通过此类方法,对GRAS / IIG的生物大分子靶标的识别在本质上局限于具有已知小分子调节剂的蛋白质。此外,运用先进的高通量检测技术和专门的目标蛋白结构或表型结果的预测算法可能会进一步增加该类化合物的范围和预测能力。
但仅仅是计算机和体外数据是不足以证明GRAS / IIG的生物活性的临床相关性的。作者在此处虽然包括了一系列离体和体内验证,以提供更多的生物学背景,但是其他验证试验(例如临床数据分析)如果运用的话将进一步增加此类关联的相关性的可信性。
总之,GRAS / IIGs的生物活性是目前被忽视但与临床相关的研究领域,智能算法有潜力推动和加速此类的发现,从而实现个性化治疗设计和药物配方开发。

参考文献:

  • Reker D, Shi Y, Kirtane AR, et al., Machine Learning Uncovers Food- and Excipient-Drug Interactions[J]. Cell Reports, 2020, 30(11).

原创文章,作者:ifyoung,如若转载,请注明出处:https://www.drugfoodai.com/food-drug-interaction.html

注意:本站原创指的是原创编译,并不主张对所介绍的工作的版权,如有侵权,请联系删除!

发表评论

邮箱地址不会被公开。 必填项已用*标注