会议论文详细信息
文献类型:会议
作者单位:[1]北京大学化学与分子工程学院分子动态与稳态国家重点实验室 [2]北京大学前沿交叉学科研究院定量生物学中心
会议文献:2019中国化学会第十五届全国计算(机)化学学术会议论文集
会议名称:2019中国化学会第十五届全国计算(机)化学学术会议
会议日期:20191114
会议地点:中国上海
出版日期:20191100
学会名称:中国化学会
语 种:中文
摘 要:自从E. J. Corey提出逆合成分析,利用计算机来辅助合成路线设计一直是有机化学家的愿景。现有的大多数的方法都是基于反应规则模板来预测合成路线,主要分为两种,分别是专家手写规则和自动反应规则提取。但是,手写反应规则耗时耗力,而新的有机反应规则一直在不断增长,这也给这种基于模板的开发策略带来一定困难。而自动反应规则提取的提取算法本身存在一定缺陷,而且仅考虑了反应中心和邻近原子,很难准确的描述好化学反应。最近几年基于深度学习的seq2seq模型提供一种端对端的策略,只需要输入目标分子的SMILES表达式,就能预测出产物到原料的单步逆合成分析结果。在此,我们进一步报道了一种新策略来做逆合成路线预测。基于目前最好的机器翻译模型Transformer,我们发展的seq2seq深度学习方法在单步逆合成反应预测中获得了目前最好的top-1准确率(54.6%/63.0%)。进一步,以4个上市或者潜在的候选药物分子为例,利用启发性的蒙特卡洛树搜索(MCTS),我们的模型可以自动预测出完整的合成路线,很好的复现了文献报道的路线,证明了我们的模型具有逆合成路线预测的潜力。总的来说,我们突破了基于规则的传统思路,提出一种template-free的新策略来做逆合成路线预测,而且得到了很好的初步结果。
关 键 词:逆合成路线预测 深度学习 机器翻译模型 seq2seq 蒙特卡洛树搜索
分 类 号:TQ460.1[化工与制药类] TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...