近日,密苏里大学机械与航天工程系林见副教授课题组在材料领域顶刊《Progress in Materials Science》(2021年影响因子48.165) 发表了题为“人工智能与实验自动化的融合:自主实验室”(Toward autonomous laboratories: Convergence of artificial intelligence and experimental automation)的长篇综述。本文总结了自主实验在过去十几年的发展状况,首先介绍了如何将人工智能应用在材料研究领域,随后系统讨论了在材料自动合成、表征数据分析和决策算法的研究进展,最后讨论了当前面临的挑战,并展望了下一代自主实验室以期实现全自主实验。全文共44页,含18幅图、5个表格和565篇参考文献。
人类社会日新月异的发展对具有新功能新特性的功能材料研发提出了挑战。过去几十年间,材料的研发仍然以受过良好训练的科学家开发为主,辅之以领域知识和物理化学原理。尽管如此,材料研发过程仍以试错为主,需要大量的人力物力投入。此外,由于人为参与,可重复性与偏差仍然存在。这些客观存在的诸多问题与挑战使得研发进度大幅落后于生产制造和消费者迫切需求的进度。因此,大力推进当前研究范式的演进以加快材料研发进度成为当务之急。
实验自动化通过借助先进的科学仪器与统计方法,实现自动筛选,因而在学术和工业届,尤其是制药和有机化学领域,得到广泛应用。实验自动化因其擅长重复操作,极大地提高了待研究材料的通量。更为重要的是,它可以将研究者从繁琐复杂的日常实验室操作中解放出来,可以更好地投入到更具创造性和挑战性的科研任务中去。然而,当前的实验自动化仍然面临三方面的挑战。(1)实验中搜集的图谱与波谱表征数据的分析速度与收集速度不匹配。(2)重度依赖于研究者的过程与性能探索毫无疑问地拉低探索效率。(3)考虑到成千上万种组合的高维度与非线性,自动化不可能探索所有可能的组合。因此,智能表征数据分析与决策算法的研发成为驱动自主实验的当务之急,这将构成自主实验的重要一环。
近年来兴起的机器学习尤其是深度学习已经在包括计算机视觉、自主驾驶、语音识别、推荐系统、蛋白质折叠和生物医学成像等领域取得了非凡的成果。区别于传统基于物理模型,被称作“从数据中学习”的机器学习可以不借助任何公式与定理,就可以将从海量数据中学到的隐藏信息用于预测新数据。机器学习的重大突破得益于海量数据的获得、超强的计算力和更为强大的算法三方面在内的进步。过去的几年间学术界见证了机器学习在材料与化学领域的应用,这包括材料的物理化学性质预测、加工-结构-性能关系的定量分析、材料制备的引导、有机化学合成规划和表征数据的分析。
作为新出现的研究范式,自主实验将机器学习与实验自动化有机结合形成的有机结合,已经在材料研发展现了巨大的应用前景。自主实验通过有效探索化学和反应空间,极大地减少需要操作的实验总量,从而缩短材料研发的周期。机器学习算法通过分析累积的实验结果与表征数据,快速决定自动化设备如何操作下一步实验,成为自主迭代的闭环重要组成部分。自2010年以来,与自动化和自主化实验在材料与化学领域的研究论文数量呈现快速增长的趋势,并在可预见的未来继续保持这个势头。
图1 材料研发的全自主实验流程示意图。
图2 构建机器学习模型的流程示意图。
图3 连续流反应器示意图及其应用案例。
图4 桌面机器示意图及其应用案例。
图5 波谱类数据的快速分析。
他们依据算法机理将决策算法分为贝叶斯优化、强化学习、演进算法等,又根据待优化目标的数量将决策算法分为单目标和多目标优化。同时讨论了怎么把物理,化学的规律,和人的直觉等引入到这些优化模型当中。
原文链接:https://www.sciencedirect.com/science/article/abs/pii/S0079642522001244