机器学习与专家数据的完美结合
在合成反应规划方面取得了前所未有的成果
2021年夏天,IBM欧洲研究所(IBM Research Europe)与 Thieme Chemistry 正式建立合作伙伴关系,在高质量数据(Science of Synthesis and Synfacts by Thieme)和最先进的有机化学合成预测机器学习模型(RXN for Chemistry by IBM)之间的协同作用上,创造了前所未有的用户体验。
RXN For Chemistry是IBM研究所(IBM Research)旗下的一个基于人工智能的云平台,经过Science of Synthesis和 Synfacts 高质量数据集的训练后, IBM欧洲研究所和Thieme Chemistry现已宣布合作的首批成果,这些成果由来自中国、德国、瑞士、新西兰和美国的七位著名合成化学专家及其研究小组进行了评估。
有机化合物可以以成千上万种不同的方式相互反应。经验知识是有机化学家避免在实验室中进行无数次试验和错误的关键。为了改进合成计划,IBM研究所和Thieme Chemistry合作,将世界上现有的最大的评估有机合成方法库Science of Synthesis和有机合成期刊Synfacts上高质量的详实数据,与IBM RXN for Chemistry名为 Molecular Transformer 的人工智能模型相结合。
Molecular Transformer 是一个神经机器翻译模型,起初用于可靠地预测化学反应结果,后来增强为包括逆合成分析,即首先确定创建给定目标分子所需的化学物质。 事实证明,该模型在学习化学反应数据集中存在的化学反应性信息方面非常成功。
提高预测精度
Science of Synthesis 和 Synfacts 涵盖了广泛的反应空间领域。
商用专利数据集训练的模型在许多此类反应中通常表现不佳。 Science of Synthesis 和 Synfacts 的化学记录质量更高,这反映在可用记录的比例更大。 Thieme 数据集的这种一致性促进了人工智能模型的学习过程,从而使预测更加一致:结果表明,在 RXN for Chemistry 平台上经过 Thieme 训练的模型将前向预测的预测准确度提高了三倍,将逆合成预测准确度提高了九倍。
Thieme和IBM欧洲研究所之间的合作展示了高质量化学反应数据对未来人工智能化学合成工具的影响。通过整合来自Science of Synthesis和Synfacts的高质量、精选数据,为RXN for chemistry的表现提升到前所未有的水平提供了一个独一无二的机会,因为它释放了包含在数十万个化学反应记录中的全部知识。
来自合成化学专家的反馈
来自世界各地的七位知名有机合成专家及其团队对重新训练的模型进行了评估。在此次合作期间,专家们将继续向IBM欧洲研究所和Thieme提供反馈,以改进模型及其使用,并为机器学习专家和合成有机化学社区之间的交流创建一个独特的论坛。
“这种创新的IBM/Thieme Chemistry 平台为合成化学研究人员提供了一种有效的工具,可以为他们自己的逆合成计划提供验证,同时还提供替代解决方案。它可以对给定合成的逆合成设计阶段进行严格评估,这无疑将在实施所选合成计划时带来回报”
Dame Margaret Brimble 教授
奥克兰大学,新西兰
“合成的可持续未来包括最大限度地减少非生产性策略的数量,这些策略只运行那些导致生产性结果的反应。这只有通过计算机设计和人工设计的结合才有可能实现,这使 IBM 和 Thieme Chemistry 的合作令人兴奋。”
Richmond Sarpong 教授
加州大学伯克利分校,美国
参与测试再训练模型的还有 Alois Fürstner 教授(MPI Mülheim,德国)、Karl Gademann 教授和 Cristina Nevado 教授(苏黎世大学,瑞士)、李昂教授(中科院上海有机化学研究所,中国)、 Dirk Trauner 教授(纽约大学,美国)及他们的研究团队。
关于IBM研究所
七十多年来,IBM研究所在五大洲的 16 个城市拥有 3000 多名研究人员,定义了信息技术的未来。IBM研究所的科学家团队已经产生了6位诺贝尔奖获得者,获得了10枚美国国家技术奖章,5枚美国国家科学奖章,6项图灵奖,并有19名科学家成为美国国家科学院入选者,20名科学家入选美国国家发明家名人堂。
四年多来,IBM研究所一直在开发基于语言模型的数据驱动型化学解决方案。2018年,IBM发布RXN for Chemistry:使用一个名为Molecular Transformer的基于云平台的人工智能模型,应用神经机器翻译模型来预测化学反应的结果,从而改善有机化学的合成计划。
更多信息请访问:www.research.ibm.com
IBM RXN for Chemistry: https://rxn.res.ibm.com