搜索:  
密苏里大学林见课题组《Prog. Mater. Sci.》:人工智能与实验自动化的融合 - 自主实验
2022-12-04  来源:高分子科技


  近日,密苏里大学机械与航天工程系林见副教授课题组在材料领域顶刊《Progress in Materials Science(2021年影响因子48.165发表了题为“人工智能与实验自动化的融合:自主实验室”(Toward autonomous laboratories: Convergence of artificial intelligence and experimental automation)的长篇综述。本文总结了自主实验在过去十几年的发展状况,首先介绍了如何将人工智能应用在材料研究领域,随后系统讨论了在材料自动合成、表征数据分析和决策算法的研究进展,最后讨论了当前面临的挑战,并展望了下一代自主实验室以期实现全自主实验。全文共44页,含18幅图、5个表格和565篇参考文献。


  人类社会日新月异的发展对具有新功能新特性的功能材料研发提出了挑战。过去几十年间,材料的研发仍然以受过良好训练的科学家开发为主,辅之以领域知识和物理化学原理。尽管如此,材料研发过程仍以试错为主,需要大量的人力物力投入。此外,由于人为参与,可重复性与偏差仍然存在。这些客观存在的诸多问题与挑战使得研发进度大幅落后于生产制造和消费者迫切需求的进度。因此,大力推进当前研究范式的演进以加快材料研发进度成为当务之急。


  实验自动化通过借助先进的科学仪器与统计方法,实现自动筛选,因而在学术和工业届,尤其是制药和有机化学领域,得到广泛应用。实验自动化因其擅长重复操作,极大地提高了待研究材料的通量。更为重要的是,它可以将研究者从繁琐复杂的日常实验室操作中解放出来,可以更好地投入到更具创造性和挑战性的科研任务中去。然而,当前的实验自动化仍然面临三方面的挑战。(1)实验中搜集的图谱与波谱表征数据的分析速度与收集速度不匹配。(2)重度依赖于研究者的过程与性能探索毫无疑问地拉低探索效率。(3)考虑到成千上万种组合的高维度与非线性,自动化不可能探索所有可能的组合。因此,智能表征数据分析与决策算法的研发成为驱动自主实验的当务之急,这将构成自主实验的重要一环。


  近年来兴起的机器学习尤其是深度学习已经在包括计算机视觉、自主驾驶、语音识别、推荐系统、蛋白质折叠和生物医学成像等领域取得了非凡的成果。区别于传统基于物理模型,被称作“从数据中学习”的机器学习可以不借助任何公式与定理,就可以将从海量数据中学到的隐藏信息用于预测新数据。机器学习的重大突破得益于海量数据的获得、超强的计算力和更为强大的算法三方面在内的进步。过去的几年间学术界见证了机器学习在材料与化学领域的应用,这包括材料的物理化学性质预测、加工-结构-性能关系的定量分析、材料制备的引导、有机化学合成规划和表征数据的分析。


  作为新出现的研究范式,自主实验将机器学习与实验自动化有机结合形成的有机结合,已经在材料研发展现了巨大的应用前景。自主实验通过有效探索化学和反应空间,极大地减少需要操作的实验总量,从而缩短材料研发的周期。机器学习算法通过分析累积的实验结果与表征数据,快速决定自动化设备如何操作下一步实验,成为自主迭代的闭环重要组成部分。自2010年以来,与自动化和自主化实验在材料与化学领域的研究论文数量呈现快速增长的趋势,并在可预见的未来继续保持这个势头。


  本文系统性地总结了过去十来年间研究者在自主实验领域取得的研究进展。首先,文章介绍了机器学习的入门教程,包括学习资料、概念及算法种类、模型构建及评估。随后,文章从自主实验三个重要组成部分(图1),即自动化实验、数据快速分析和决策算法,重点总结了各自领域的重大进展,同时也给出可行的解决方案以应对出现的问题与挑战。最后,文章也总结了当前自主实验面临的诸多挑战,并展望自主实验的发展未来。非常期待本综述可以作为指导手册以帮助新入门者快速领略该领域的基础知识及应用到更广泛的研究领域。 


材料研发的全自主实验流程示意图。


  首先针对想在机器学习领域跃跃欲试的新手,文章介绍了机器学习的概念、分类、算法及选择。其次,介绍了如何构建机器学习模型,包括数据的收集与预处理、模型训练和评价指标,如图2所示。最后,为应对材料研究中面对的数据匮乏的情况下保持模型的鲁棒性和普适性,文章介绍了包括数据扩增、维度变换、迁移学习和压缩感知等策略。 


图2 构建机器学习模型的流程示意图。


  随后,他们介绍了自主实验的三个重要组成部分:自动化实验、表征数据的快速分析和决策算法。首先,依据展现形式将自动化实验分为三类:连续流反应器、桌面机器和移动机器(图3,4 )。其次,依据数据类型将快速分析分为两类:波谱和图谱数据分析(图5)。 


3 连续流反应器示意图及其应用案例。 



4 桌面机器示意图及其应用案例。



 5 波谱类数据的快速分析。


  他们依据算法机理将决策算法分为贝叶斯优化、强化学习、演进算法等,又根据待优化目标的数量将决策算法分为单目标和多目标优化。同时讨论了怎么把物理,化学的规律,和人的直觉等引入到这些优化模型当中。


  文章最后,如图6所示,列出了自主实验面临的挑战和可行的解决方案,包括数据标准化与分享、用于知识提取的文献挖掘、逆向材料设计的集成、可解释的机器/深度学习模型、人机交互和自主实验的数字化(虚拟实验室、云实验和数字孪生)。期待本文可以作为指导手册以帮助新入门者快速领略该领域的基础知识及应用到更广泛的研究领域。 


融合大数据、集成物理知识的深度学习、人机交互和数字化的自主实验。


  原文链接:https://www.sciencedirect.com/science/article/abs/pii/S0079642522001244

版权与免责声明:中国聚合物网原创文章。刊物或媒体如需转载,请联系邮箱:info@polymer.cn,并请注明出处。
(责任编辑:xu)
】【打印】【关闭

诚邀关注高分子科技

更多>>最新资讯
更多>>科教新闻