欢迎来到化学加!萃聚英才,共享化学!化学加,加您更精彩!客服热线:400-8383-509

化学加_专业的精细化工医药产业资源供需及整合平台

浙江大学化学系洪鑫教授课题组Nat. Commun.:化学信息增强的图模型实现反应活性和选择性的精准预测

来源:浙江大学化学系      2023-07-11
导读:近日,浙江大学化学系洪鑫课题组基于有机化学中的立体与电子效应,设计了化学信息增强的分子图模型(sterics- and electronics-embedded molecular graph, SEMG),并开发了体现反应组分协同效应的MIGNN框架,为反应活性和选择性预测提供一个全新的通用架构SEMG-MIGNN。

随着化学大数据和人工智能模型跨越式的发展,数据驱动的合成反应精准预测近年来引起了广泛关注。由于合成反应构效关系高维且复杂的特性,催化剂、反应物、甚至溶剂细微的结构变化都可能引起反应活性和选择性的显著改变。因此,开发一种高效、可靠的AI预测模型对于合成反应的智能设计至关重要。

近日,浙江大学化学系洪鑫课题组基于有机化学中的立体与电子效应,设计了化学信息增强的分子图模型(sterics- and electronics-embedded molecular graph, SEMG),并开发了体现反应组分协同效应的MIGNN框架,为反应活性和选择性预测提供一个全新的通用架构SEMG-MIGNN。 该策略实现了活性和选择性的精准预测,尤其展示了出色的外推能力,为数据驱动的合成反应预测和智能设计提供了新技术。相关研究发表在Nature Communications(网址: https://www.nature.com/articles/s41467-023-39283-x)

在此项工作中,针对立体位阻和电子信息设计了相应的编码技术,从而优化了模型对化学信息的捕捉能力(图1)。位阻信息的编码基于课题组之前开发的球面投影技术(Synlett202132, 1837),将原子周围的范德华表面表达为一个可视化的二维编码图。电子信息的编码则通过原子周围的电子密度采样,以一个三维张量的形式进行编码。针对分子图的每个原子节点进行化学信息的编码和嵌入,最终得到化学信息增强的分子图SEMG。此外,为了在建模中体现反应组分对于构效关系的协同影响,该工作提出了一个新型的模型架构——分子交互图神经网络(Molecular Interaction Graph Neural Network, MIGNN)。此架构通过注意力机制提升模型对于局部结构的捕捉能力,并运用矩阵算法让分子信息充分交互,从而提升模型对于多因素协同控制的学习能力。

1. SEMG-MIGNN的架构概览

SEMG-MIGNN被应用于Pd催化Buchwald-Hartwig偶联反应的产率预测以及手性磷酸催化的亚胺加成反应的对映选择性预测(2)中。随机划分的预测结果表明,SEMG-MIGNN策略在产率和对映选择性的预测上均展示出了良好的准确性。此外,SEMG-MIGNN模型对于训练集中未出现的底物和催化剂表现出了优秀的外推预测能力,在大多数任务中超过了常见的反应建模手段。

2. SEMG-MIGNN模型的对映选择性预测表现.

SEMG-MIGNN模型在高预测精度的同时,提供了追溯立体效应及电子效应影响的评估能力(图3)。在Pd催化的Buchwald-Hartwig反应中,位阻信息编码的消除对产率预测影响较小,而电子信息编码的消除则影响较大。这表明电子效应对该反应产率起主导作用。而对于亚胺的不对称加成反应则恰恰相反,位阻信息对立体选择性的影响尤其显著,这也与之前该反应的机理模型Goodman Model一致。上述结果充分体现了化学信息的针对性嵌入对于模型化学可解释性的提升。

5. SEMG-MIGNN 模型的化学可解释性

综上所述,本研究基于立体位阻和电子效应的编码嵌入,发展了化学信息增强的SEMG分子图,并通过强化分子之间的信息交互,设计了MIGNN架构。SEMG-MIGNN策略表现了反应活性和选择性的精准预测能力,且在外推预测任务中展示了优秀的表现。同时,由于立体和电子信息的明晰表达,该模型的化学可解释性得到了提升,能够区分立体位阻及电子效应对于构效关系的定量贡献。该工作为数据驱动的合成反应建模预测和智能设计提供了有力的技术支持。




洪鑫研究员简介

洪鑫,2010 年本科毕业于中国科学技术大学(导师:傅尧教授), 2014 年博士毕业于加州大学洛杉矶分校(导师:K. N. Houk 教授)。 2014-2016 年分别于加州大学洛杉矶分校(导师:K. N. Houk 教授)与 斯坦福大学(导师:Jens K. Nørskov 教授)从事博士后研究工作。2016年加入浙江大学化学系,任百人计划研究员,2022 年晋升为长聘制副教授。作为课题组负责人长期从事合成反应机制与构效关系方向的研究工作。以基元过程的分子形变和结合作用为核心,建立了基元转化的机理模型,明确了相关反应活性和选择性的控制因素,并将机制认识与数据建模相融合,在合成反应的数据库、编码技术和预测应用上开展了一系列工作,为相关反应的理性设计提供了智能方案。自独立工作以来以通讯和共同通讯作者身份于 Nature Chemistry, Nature Catalysis, Nature Synthesis, JACS, ACIE 等国际高水平期刊发表论文 100 余篇。曾获 Thieme Chemistry Journals Award 2022)、国家优秀青年基金项目(2021)、首届浙江省青年科技英才奖(2021)、 中国化学会青年化学奖(2020)与物理有机化学新人奖(2021)。现任中国化学会物理有机化学专业委员会委员、《Chemistry-An Asian Journal》、《National Science Open》与《Chemical Synthesis》青年编委。


Reaction performance prediction with an extrapolative and interpretable graph model based on chemical knowledge

Shu-Wen Li, Li-Cheng Xu, Cheng Zhang, Shuo-Qing Zhang & Xin Hong

Nat. Commun., 2023,14, 3569, DOI:https://doi.org/10.1038/s41467-023-39283-x


声明:化学加刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 电话:18676881059,邮箱:gongjian@huaxuejia.cn