化学家测试AI算法完全预测的逆合成途径


据我所知,这是第一次,当计算机程序预测合成时,您就去实验室了! -并且有效
-这就是Bartosz Grzybowski描述他的Chematica程序的方式。

背景知识


化学合成的计算机辅助计划的想法远非新鲜。 哈佛大学的Elias J. Cory在1970年代开发了此类程序的第一个版本(应用于综合分析的逻辑和启发式方法),但从未辜负其期望。 Chematica是最近几年出现的几种新的竞争对手软件产品之一。 Bartosz Grzybowski(韩国蔚山国立科学技术学院和波兰科学院)从事该计划已有15年的历史,然后于2017年5月将其出售给MilliporeSigma。

通常,化学家完全依靠他们的经验和知识(化学直觉)来开发一系列反应,从而产生大分子的较小嵌段分子。 化学家还必须考虑各种限制,例如某些反应条件下官能团的不相容性。


Chematica成功地预测了八个合成复杂分子的合成,并且在某些情况下,能够提高反应产物的产率。

格里佐夫斯基(Grzybowski)表示,规划回溯合成就像下棋一样:有许多基本动作。 在游戏过程中,每个动作都会打开一个新分支,以得到不同的结果。 但是在有机合成中,“基本步骤的数量-主要反应类型-简直是巨大的。” 每次合成移动后,便会选择大约一百个下一个可能的步骤。 这意味着合成的阶段越多,可能的步骤越多。

但是化学家有偏见,莎拉·特里斯(Sarah Trice)(最近收购了凯美达的公司MilliporeSigma的化学信息技术技术业务开发技术负责人莎拉·特里斯)解释说,这就是使用过去成功的趋势。 Grzybowski相信Chematica将消除偏见。 在过去的15年中,已经对Chematica算法进行了50,000多个规则的培训,并提供了在广阔的化学空间中寻找选择并开发所需反应序列的方法。

测验


尽管该概念很吸引人,但没有证据可以证明它确实有效。 但是现在,Chemicala已被证明与实验室测试相关。 该算法找到了八个分子的重要路径:六个小生物活性化合物,一种重磅药物和一个天然化合物分子。

对于这六种药物中的大多数,先前提出的路线存在产品收率低的问题,并且其中一些根本没有合成。 Chematica仅使用常规试剂开发了少于10个合成步骤的路线。 尽管如此,与以前的尝试相比,该团队仍能够获得高收益的目标产品-在某些情况下为1%至60%-同时节省了实验室研究的时间和金钱。

该程序的某些逆合成分区是不寻常的-例如,三组分aza-Henry反应是通向喹诺酮表达的内酰胺的单一立体异构体的途径之一。 “对于化学家来说,进行合成的某些阶段是不寻常的,因为他们的直觉告诉他们在这里合成可能不起作用,” Tris笑着说。 Grzybowski说:“游戏规则是这样的:您不能更改逆合成分区,而需要遵循一般方法。”

局限性


由于Chematica并未提供每个反应的确切条件,因此在优化合成过程中,一切都必须经过反复试验。 但是,出于现实的考虑,每个反应的时间和财力限制为五次尝试,每个完整的合成过程最多可花费70小时。

抗心律不齐的重磅炸药药物决奈达隆是另一个问题的例子:其合成受到46项专利的保护。



Chematica能够计划针对抗心律不齐的药物决奈达隆的合成,从而避免了所有获得专利的选择。 该程序还知道如何考虑生产试剂的成本并选择更便宜的合成路线。

Richmond Sarpong(加州大学伯克利分校)和他的研究小组也有机会测试新工具。 “这些机会给我们留下了深刻的印象。 该算法在寻找某些结构片段的解决方案时特别有效。 在这一部分中,我发现该程序比人的功能更强大。”

但是,萨彭指出:“该程序正像人们一样,试图通过立体电子微妙出现的结构复杂分子的参与来进行预测。” Sarpong的小组目前正在研究Chematica预测的一种合成途径。

Grzhibovsky认为下一步将是复杂的天然化合物。 他的团队正在完成新分离的天然生物碱的15步合成。 “我从未认为自己是一位非常称职的有机化学家。 这是我生命中第一个完整的综合,”他说。 Tris补充说:“我相信,它确实可以帮助尚未接受合成化学家经典培训的人们。”

Grzybowski欣然指出,不应将Chematica视为对化学家经验的威胁。 由于该算法无法自学新的反应,因此“我们仍然需要大胆的有机化学家准备挑战像Chematica这样的程序,并找到非常规的方式来制造分子,”马里奥拉·托尔托萨(Mariola Tortosa)同意(该大学专门研究天然化合物的有机化学家西班牙马德里)。 她说:“但是,该程序可以显着加快[retrointez]的速度。”

Tango Therapeutics的化学副总裁John Maxwell认为,本文并未证明Chematica计划比化学家更好地合成。 他指出,选择合成进行比较的化学家并不一定要针对产物的收率或反应链的长度来优化合成。

一些化学家想知道Chematica和MilliporeSigma将如何解决知识产权问题。 里士满·萨蓬(Richmond Sarpong)表示,研究人员可能会犹豫是否要使用Chematica,因为目前尚不清楚该公司将对用户输入的分子具有何种访问权,或者谁将拥有Chematica产生的合成途径的知识产权。 莎拉·特里斯(Sarah Tris)解释说,只有用户才能看到目标分子,并且MilliporeSigma不会控制Chematica提供的合成选项的知识产权。

该公司已经与行业和学术伙伴合作测试软件,并希望在今年晚些时候发布商业版本。

原始文章是公开可用的。 10.1016 / j.chempr.2018.02.002

谁在乎, 您可以在这里阅读他们如何计划逆转录合成。

程序界面的视频示例


欢迎提出批评,指正和建议。
最好在私人消息中写些错误,以免分散正在寻找其他信息或评论中反馈的人们的注意力。 翻译不是文字的。 某些段落已缩短。

  1. 新闻https://cen.acs.org/articles/96/i10/Chemists-test-computer-planned-syntheses.html中的一段添加到背景故事中。
  2. 在帖子的末尾添加了两段带有注释的段落。
  3. 添加了视频。

Source: https://habr.com/ru/post/zh-CN410781/


All Articles