史蒂文·洛佩兹

他正在训练计算机使用Facebook和谷歌使用的机器学习算法来寻找新分子

十多年来,Facebook和谷歌算法一直在尽可能多地了解你。这就是他们如何完善他们的系统来传递你读的新闻,你喜欢的小狗视频,以及你参与的政治广告。

这些相同类型的算法可用于发现数十亿个分子,并催化目前由昂贵和有毒金属诱导的重要化学反应,他说史蒂文·a·洛佩兹他是东北大学化学和化学生物学的助理教授。

Lopez正在与一组研究人员合作,训练机器学习算法来发现分子模式,这可以帮助大量快速地发现新分子。这是一种比在没有精简流程的情况下扫描数以十亿计的分子更聪明的方法。

“我们正在教机器学习我们已经掌握的化学知识,”洛佩兹说。“为什么我自己要有化学直觉?”

洛佩兹说,使用昂贵金属的替代品是有机分子,尤其是无处不在的塑料。根据它们的分子结构和吸收光的能力,这些塑料可以通过化学反应转化为更好的材料,以解决当今最重要的问题。

洛佩兹说,他们的目标是找到具有正确性质和类似金属催化剂结构的分子。但为了实现这一目标,洛佩兹需要探索大量的分子。

到目前为止,科学家们只能合成大约一百万个分子。但保守估计,可以分析的可能分子的数量是10的18次方,也就是数字1后面跟着18个零。

洛佩兹认为,这种巨大的可能性就像一个由数十亿个未被探索的分子组成的浩瀚海洋。如此巨大的分子空间实际上是不可能导航的——即使科学家们将实验与超级计算机分析结合起来。

洛佩兹说,计算机所做的所有计算加起来大约是10亿,也就是10的9次方。这比可能的分子要少一百万倍。

“算了吧,没有机会,”他说。“我们只需要使用更智能的搜索技术。”

这就是为什么洛佩兹要带领一支队伍,由资助其中包括塔夫茨大学、圣路易斯华盛顿大学、德雷塞尔大学和科罗拉多矿业学院的研究。这个团队正在使用对公众开放的数据库有机分子的VERDE材料DB,洛佩兹和同事最近发表来改进他们的算法,找到更多有用的分子。

Lopez说,该数据库还将记录新发现的分子,并可以作为跨几个不同领域的研究人员的信息数据中心。这是因为它可以促使研究人员寻找具有许多新特性和新应用的不同分子。

与数据库相结合,算法将允许科学家更有效地使用计算资源。在找到感兴趣的分子后,研究人员将重新校准算法,以找到更多相似的分子群。

主动搜索算法是由圣路易斯华盛顿大学的罗曼·加内特(Roman Garnett)开发的经典桌游《战舰》,在游戏中,两名玩家在网格中猜测隐藏的位置,以瞄准并摧毁海军舰队中的船只。

在这个网格中,玩家将容器放置得尽可能远,以使对手错过目标。一旦一艘船被击中,玩家可以重新调整他们的策略,将他们的攻击重新导向击中的坐标。

这正是洛佩兹对探索浩瀚分子海洋这个概念的看法。

他说:“我们正在寻找这片海洋内的区域。”“我们正开始建立所有可能分子的坐标。”

找到合适的候选分子也可能扩大化学家对这一未知化学领域的理解。

洛佩兹说:“也许我们会通过这种分析发现,我们在我们所谓的海洋的边缘有一些东西,我们可以在那个地区把海洋扩大一点。”“这些东西是我们用蛮力、试错的方法(无法通过搜索)找到的。”

本文最初发表于(电子邮件保护)2020年1月6日。

化学与化学生物学