MIT科学家创建新机器学习模型:开发新药的更明智方式

来源:cnBeta | 2022-05-10 15:59:41

制药公司正在使用人工智能来简化发现新药的过程。机器学习模型可以提出具有特定特性的新分子,这些特性可以对抗某些疾病,在几分钟内完成人类可能需要几个月才能实现的手动操作。但是,有一个主要障碍阻碍了这些系统的发展。这些模型经常建议新的分子结构在实验室中难以或不可能产生。如果化学家无法实际制造分子,就无法测试其抗病特性。

麻省理工学院研究人员的一种新方法限制了机器学习模型,因此它只建议可以合成的分子结构。该方法保证了分子是由可以购买的材料组成的,并且这些材料之间发生的化学反应遵循化学规律。

与其他方法相比,他们的模型提出的分子结构在流行的评价中得分很高,甚至更高,同时也保证可以合成。他们的系统还需要不到一秒钟的时间来提出一个合成途径,而其他单独提出分子然后评估其合成能力的方法可能需要几分钟。在拥有数十亿潜在分子的搜索空间中,这些时间的节省会增加。

“这个过程重新制定了我们如何要求这些模型产生新的分子结构。许多这些模型认为要逐个原子或逐个键建立新的分子结构。相反,我们正在逐个构件和逐个反应来构建新的分子,”麻省理工学院化学工程系和电子工程与计算机科学系的亨利-斯莱辛格职业发展副教授、该论文的资深作者Connor Coley说。

与Coley一起撰写该论文的还有第一作者研究生高文浩和博士后Rocío Mercado。该研究最近在国际学习表征会议上发表。

为了创建一个分子结构,该模型模拟了合成一个分子的过程,以确保它能够被生产。该模型得到了一套可行的构建模块,即可以购买的化学品,以及一个有效的化学反应列表,以便进行操作。这些化学反应模板是由专家手工制作的。通过只允许某些化学品或特定反应来控制这些输入,使研究人员能够限制一个新分子的搜索空间有多大。

该模型使用这些输入来构建一棵树,通过选择构件并通过化学反应将它们连接起来,一次一个,来构建最终的分子。在每个步骤中,随着更多的化学品和反应的加入,分子变得更加复杂。

它既能输出最终的分子结构,又能输出合成它的化学品和反应树。“我们不是直接设计产品分子本身,而是设计一个行动序列来获得该分子。这使我们能够保证结构的质量,”研究人员说。

为了训练他们的模型,研究人员输入一个完整的分子结构和一组构建模块和化学反应,模型学习创建一个合成分子的树。在看到几十万个例子后,该模型学会了自己想出这些合成途径。

分子优化

经过训练的模型可用于优化。研究人员定义了他们希望在最终分子中实现的某些特性,给定了某些构件和化学反应模板,模型就会提出一个可合成的分子结构。

“令人惊讶的是,用这么小的模板集,你实际上可以复制出很大一部分的分子。你不需要那么多的构件来产生大量的可用化学空间供模型搜索,” Mercado说。

他们通过评估该模型重建可合成分子的能力来测试该模型。它能够重现这些分子中的51%,并且重现每个分子的时间不到一秒钟。他们的技术比其他一些方法更快,因为模型没有在树上的每一步中搜索所有的选项。研究人员解释说,它有一套确定的化学品和反应来工作。

当他们用他们的模型提出具有特定属性的分子时,他们的方法提出了更高质量的分子结构,这些分子结构比其他方法的分子具有更强的结合亲和力。这意味着这些分子将能更好地附着在蛋白质上,并阻止某种活动,如阻止病毒复制。

例如,在提出一种能够与SARS-Cov-2对接的分子时,他们的模型提出了几种可能比现有抑制剂更能与病毒蛋白结合的分子结构。然而,正如作者所承认的,这些只是计算上的预测。

“有这么多的疾病需要解决,”研究人员说。“我希望我们的方法可以加速这一过程,这样我们就不必每次为一个疾病目标筛选数十亿的分子。相反,我们可以只指定我们想要的属性,它可以加速寻找该候选药物的过程。”

他们的模型也可以改善现有的药物发现管道。Mercado说,如果一家公司已经确定了一种具有所需特性的特定分子,但无法生产,他们可以使用这个模型来提出与之非常相似的可合成分子。

既然他们已经验证了他们的方法,该团队计划继续改进化学反应模板,以进一步提高该模型的性能。有了额外的模板,他们可以对某些疾病目标进行更多测试,并最终将该模型应用于药物发现过程。

“理想情况下,我们希望算法能够自动设计分子并同时快速给我们提供合成树,”Marwin Segler说,他在微软剑桥研究院(英国)领导一个从事机器学习药物发现的团队,没有参与这项工作。“Coley教授和团队的这一优雅方法是解决这一问题的一个重要步骤。虽然早先有通过合成树生成进行分子设计的概念验证工作,但这个团队真正使其发挥作用。他们首次在一个有意义的规模上展示了出色的性能,因此它可以在计算机辅助分子发现中产生实际影响。”

“这项工作也非常令人振奋,因为它最终可以实现计算机辅助合成规划的新范式。它很可能会对该领域的未来研究产生巨大的启发。”

标签: 机器学习模型 药物开发 人工智能 流程简化

责任编辑:techtoutiao

本文相关推荐