【摘要】 化学反应过渡态(TS)搜索依赖专家经验且计算成本高?本研究提出基于机器学习(随机森林)的构象向下选择新策略,在四个反应基准(Zimmerman, Ireland-Claisen, 酮硫酯DA, 四肽环化)上验证成功。显著提升TS定位率至73.4%,发现竞争路径,降低计算成本10倍,实现预算内高效自动化构象采样与TS搜索。突破高通量反应预测瓶颈。
化学反应过渡态(TS)的精确表征是理解反应机理和预测反应速率的关键。然而,对于大型体系和复杂反应,传统过渡态搜索过程往往脆弱且高度依赖专家经验,阻碍了其在高通量计算和反应发现中的应用。一个核心挑战在于:构象细节(分子在空间中的不同排列方式)对过渡态的结构、能量势垒乃至最终产物都有着深远影响。虽然构象采样的必要性已被认识,但其高昂的计算成本(尤其涉及成百上千次TS搜索时)限制了其在自动化工作流中的普及。
本研究[1]提出并验证了一种基于计算预算优化的创新策略,旨在将构象采样经济高效地整合到自动化过渡态搜索流程中。核心思路是:在昂贵的量子化学TS搜索之前,利用机器学习分类器(随机森林RF)对生成的反应构象对进行快速筛选(“构象向下选择”),优先选择那些最有可能通向目标过渡态的构象。该策略在四个具有代表性的反应基准上进行了严格测试:
1.简单有机反应基准(Zimmerman数据集 & KHP分解):涵盖基础反应类型,是测试自动化性能的起点。
2.Ireland-Claisen重排:具有更高的构象复杂性和多步特征,是验证方法鲁棒性的理想选择。
3.大环酮硫酯的竞争Diels-Alder(DA)反应:涉及多个竞争性环化途径,考察发现最低能量路径的能力。
4.四肽环化:构象极其复杂且存在竞争途径,代表了极具挑战性的应用场景。
方法流程:三步实现自动化与构象整合
1.构象采样与共形体生成 (Conformer Generation & Alignment):
-
首先对反应物和产物分别进行构象采样,获得各自可能的构象集合。
-
然后生成所有可能的反应物-产物构象对(称为“共形体对”)。
2.构象向下选择 (Conformer Downselection - ML Classification):
-
使用训练的随机森林(RF)分类器对步骤1生成的大量构象对进行快速评估和排序。
-
分类器预测每个构象对成功定位到相关过渡态的“潜力”。
-
核心创新点: 这一步大幅减少了需要进入昂贵TS搜索的构象数量,显著降低成本。
3.过渡态表征 (TS Characterization):
- 仅对经过ML筛选后排名靠前的少量构象对进行精确的量子化学过渡态搜索和能垒计算。

图1 概述了将构象采样纳入自动TS搜索的方法
突破性成果:效率与覆盖率的双重提升
-
显著提升成功率: 在简单有机反应基准(如Zimmerman数据集和KHP分解)上,该方法将预期过渡态的成功定位率从之前方法的~56%大幅提升至73.4%和70.2%。

图2 简单有机反应构象采样YARP性能综述
-
攻克复杂反应: 成功应用于构象复杂的Ireland-Claisen重排,精确计算了其多步反应路径中的中间体(INT)和过渡态(TS)能量,再现了所有关键步骤的过渡态。

图3 Ireland - Claisen重排中间体(INT)和TS能量使用YARP计算
- 发现竞争路径与最低能量产物:
- 在酮硫酯的竞争DA反应中,成功发现了文献报道的能量最低的立体异构体产物(从超过300种可能性中识别)。
- 在极具挑战性的四肽环化反应中,首次在DFT水平上成功收敛了其构象复杂且存在竞争的反应路径的过渡态。
- 揭示忽视构象的风险: 研究证实,忽略构象采样可能导致遗漏重要反应路径或得到不准确的能垒高度,这与多个应用领域的最新发现一致。
- 大幅降低成本: 虽然构象向下选择增加了前期成本,但相比对所有构象进行全TS搜索,其总体计算成本显著降低(约10倍于单次TS搜索成本,远优于无筛选的全面搜索)。这使得在有限预算下进行更全面的构象探索成为可能。
结论与展望:通往更智能TS搜索之路
本研究证明,利用机器学习(如RF分类器)进行构象向下选择是一种跨反应领域普适且高效的策略。它成功地将构象采样引入自动化过渡态搜索流程,大幅提高了成功率、发现了易被忽略的竞争路径,同时显著控制了计算成本,为高通量反应预测和复杂体系机理研究提供了实用解决方案。
未来优化方向包括:探索更低计算级别的初步TS筛选(如半经验方法)以进一步降低成本;开发更智能的排序算法识别并避免冗余TS搜索;制定更优化的构象采样策略。
参考文献:1.Zhao, Q.; Hsu, H.-H.; Savoie, B. M., Conformational Sampling for Transition State Searches on a Computational Budget. J. Chem. Theory Comput. 2022, 18 (5), 3006-3016.







您已经拒绝加入团体

