Journal of Materials Informatics创刊综述—北京工业大学宋晓艳研究团队:计算材料学与材料信息学相融合研究合金的相稳定性


背景介绍

材料的性能在很大程度上取决于其物相组成和微观组织结构,而主相的稳定性对于材料实现并保持优异的性能尤为重要。对相稳定性和相变行为的研究有助于我们深入理解物相组成与性能之间的构效关系、性能变化机理以及性能稳定化的控制要素,从而指导开发性能优异并保持长期稳定的材料。

从物理本质上来说,相稳定性取决于相的成分组成、结构特征和能量状态。在传统的计算材料学领域,已经发展了多种方法研究材料的相稳定性。随着近年来大数据和人工智能技术的快速发展,材料信息学框架下的数据驱动研究方法发展成为材料科学研究和高效开发的新范式,大大加速了新材料研发和智能制造的进程。

最近,北京工业大学宋晓艳教授研究团队关于合金相稳定性研究进展的综述文章,以“Integrating computational materials science and materials informatics for the modeling of phase stability” (计算材料学与材料信息学相融合研究合金的相稳定性)为题,发表于最新创刊的《Journal of Materials Informatics》第一期,全文阅读:https://doi.org/10.20517/jmi.2021.06

该综述以物相种类极为丰富的两大著名稀土永磁合金体系之一的Sm-Co合金为例,系统介绍了合金材料相稳定性计算研究的进展,特别关注了从传统计算材料学到材料信息学研究模式的发展,阐述分析了第一性原理、热力学和数值计算等方法研究相稳定性和相变行为的特点,进而介绍了以机器学习为代表的数据驱动相稳定性研究方法。本文提出,基于相稳定性物理基础、材料科学认知的计算材料学模型和方法,与机器学习等数据驱动新方法相耦合,增强机器学习模型的物理可解释性,可望大力推进相稳定性理论研究进展,并促进基于性能主导相稳定性的高性能新材料的准确高效设计与开发。这种相稳定性的研究模式可推广应用于更多材料体系,在缩短材料研发周期、降低试验过程中的错误率和研发成本、加速新材料开发等方面具有突出优势和前景。

内容简介

计算材料学研究方法

由材料科学与计算机科学与技术交叉形成的计算材料学,是一门利用计算、模拟技术研究材料组成、结构、性能的学科。自上个世纪80年代计算材料学研究手段兴起以来,以第一性原理、分子动力学、蒙特卡洛模拟、相场模拟、CALPHAD相图与热力学计算、有限元方法等为代表,分别在微观、介观、宏观不同尺度上的计算模拟方法,极大地推动了计算材料学与材料设计的发展。然而,传统的计算材料学方法主要是针对单一尺度下材料科学技术问题的个体化计算,通常,随着材料体系中元素种类增多、物相组成及某些特定物相的晶体结构复杂程度增加,计算的难度大幅增加、计算周期显著延长,甚至某些计算任务受制于计算技术瓶颈和计算效率而无法完成。

针对相稳定性的研究,在传统计算材料学方法中,通常利用第一性原理计算、热力学计算和确定性数值模拟方法等,研究合金组成元素之间的交互作用、物相形成、分解或转化相关的能量变化等,来判断物相的存在形式、稳定的成分和温度区间以及转变的趋势和临界条件。作者团队在应用计算材料学方法研究存在不同程度稳定性的多元多相合金体系时,提出了合金亚稳相稳定性的热力学计算模型,引入“相活度”的概念,比较合金体系中相组元与其参考态的化学势,从而定量描述亚稳相的稳定性随温度、成分和晶粒组织的变化规律。

对于一个多晶合金体系,其Gibbs自由能G是温度T、压力P和晶粒尺寸d,以及组分相摩尔数的函数,即

G=G(T,P,d,ni,nj,nk, …) (1)

其中,ni,nj,nk…为体系中组分相i,j,k, …的摩尔数。系统的能量状态取决于式中的所有因素,且这些因素并不是彼此完全独立的。对于特定的某一过程,当一个或者多个因素发生变化,体系的平衡就会相应发生改变。例如,当TPd恒定时,由于组分间相互作用导致不同组分相的摩尔数发生变化,系统将会向新的平衡态转变,直到系统新的状态的Gibbs自由能降到最低。

如果系统中各组分的摩尔数保持不变,对式(1)求解全微分,可得

(2)

其中SV分别是合金体系的熵和体积,且都是温度、压力和晶粒尺寸的函数。上式中第三项Σ(∂G/dni)T,P,d,nj,…dni即为体系中所有组分的偏摩尔Gibbs函数求和。可以将偏摩尔Gibbs函数(∂G/dni)T,P,d,nj,…项定义为体系中组分i的化学势,用符号μi表示,即

(∂G/dni)T,P,d,nj,…=μi(3)

(4)

由于式(4)考虑了体系中各相物质的量和晶粒尺寸的变化对热力学状态函数的影响,因此该方程既适用于与环境有物质交换的开放性合金体系,也适用于有成分和晶粒尺寸变化的封闭性合金体系。

引入物相的活度来描述体系中某一组分与其处于参考态的状态差异:

μi(d)=μio(d)+RTlnai(d) (5)

式中ai为组分i的活度。式(5)表明任何改变化学势的因素都会对活度产生影响,这包括了温度、压力、化学环境和晶粒尺寸等。当晶粒尺寸一定时,如果以纯物质在温度为298K、压力为1 atm条件下的状态为参考状态,那么ai≡1对应μi(d)=μio(d)(处于参考状态的组分i的化学势,或称标准化学势)。因纳米晶合金体系中晶粒尺寸的变化对系统能量状态的影响显著大于粗晶体系,该式更适于纳米晶合金体系。一方面,对于给定的纳米晶体系中某个晶粒尺寸,ai=1代表纳米晶体系中组分i处于热力学亚稳平衡状态,即组分i可以稳定存在于纳米晶体系中;另一方面,随着晶粒尺寸的变化,纳米晶体系中的组分i的标准化学势也发生变化,每一个晶粒尺寸都有一个μio(d)相对应。这样,具有尺寸依赖关系的活度就可用来描述组分在纳米晶体系中的化学势,从而也就可以表征尺寸效应对系统能量状态的影响。图1示出上述热力学模型的计算结果,相应的实验验证结果示于图2。

图1. 基于“相活度”计算的不同物相的稳定性:(a) 室温下名义成分为SmCo7的合金体系中不同物相的活度随晶粒尺寸的变化;(b) 室温下该体系中不同相的摩尔分数。

图2. 室温下名义成分为SmCo7的合金体系中物相组成的实验测定结果:(a) 单个晶粒的明场像,晶粒等面积圆直径为166nm;(b) 该晶粒的电子衍射花样;(c) 暗场像显示物相组成为单相2:17R,不同颜色表示两个变体。

材料信息学研究方法

目前不管是第一性原理计算还是热力学计算,多是针对特定成分和结构的物相的个体化计算,缺乏对合金体系涵盖各种成分、物相结构的高通量计算和预测分析,更难以对各种各样的掺杂体系进行相组成和相稳定性的快速定量化研究。对Sm-Co体系来说,由于晶胞结构的复杂性、掺杂位点的多样化,通常计算周期非常长。如果要得到较为准确的含掺杂元素的晶胞结构及相关电子结构和磁结构,需要采用非常耗时的全电子方法求解波函数,才可能解决其他方法在处理4f电子时的收敛性差的问题。因此目前Sm-Co合金体系的第一性计算只局限于某些特定体系,尚难以进行大范围、考虑多种因素的规模化计算。

随着材料研究领域数据的积累、数据库技术的发展和计算机技术与数据应用技术的不断融合,数据驱动的材料信息学已成为材料科学研究的重要途径。在材料基因组计划的推动下,高通量计算和大数据技术不断在能源材料、生物医用材料、稀土功能材料、催化材料、特种合金材料等材料体系上开展应用示范,并取得了系列重要突破。

作者团队基于在稀土单质和Sm-Co合金体系十余年的计算和实验研究工作,建立了Sm-Co基多元合金数据库,集成了材料成分与物相组成、晶体结构、制备工艺、性能等多方面数据,建立了数据项之间的科学逻辑关联,数据的规范性、可读性和可重复利用性显著提高。进而,开发了“材料知识信息解析、关联与管理系统(MKI-AAM)”,围绕数据驱动材料设计的目标,可实现传统数据库难以突破的材料深层次信息检索、材料数据库融合汇交、高质量材料设计数据集抽取等功能。图3所示为面向数据驱动材料设计的合金类材料数据库的建设方案,主要包括数据库建模、信息管理系统开发和数据库应用三个方面,信息管理系统划分为数据源、数据集、材料三个层次,旨在提高数据收集的效率和数据质量,加速数据驱动材料设计用高质量数据集的生成。

图3. “材料知识信息解析、关联与管理系统(MKI-AAM)”的结构和功能

利用该系统,作者团队结合特征工程和机器学习方法,对一定名义成分的Sm-Co类合金的相组成、相平衡和相稳定性进行了研究,提出合金相稳定性由成分特特征()、组织特征(晶粒尺寸d)、制备工艺特征(Cproc)和材料形态特征(Cform)决定,即:

(6)

经过特征构建、特征筛选和模型优化等系列过程后,发现合金相组成与掺杂元素的熔点和掺杂元素与Co之间的电负性差密切相关,并依此对周期表中所有可能的掺杂元素进行了遍历,对不同掺杂量和晶粒尺寸的名义成分为SmCo7的合金具有单相特征的相稳定性进行了定量化预报,如图4所示。

图4. 名义成分为SmCo7的合金体系中形成单相稳定性的机器学习预测结果:(a) 平均AUC值随元素特征数的变化;(b) 数据集中SmCo7-xMx(M为掺杂元素)合金相组成基于掺杂元素的两个选定特征的数据分布;(c) 不同掺杂元素、不同晶粒尺寸的SmCo7-xMx薄带中单相稳定性的预测;(d) 不同掺杂元素、不同晶粒尺寸的SmCo7-xMx烧结块体中单相稳定性的预测。

相稳定性计算研究展望

计算材料学方法和以数据驱动研究为主要手段的材料信息学方法,两者并不能相互取代,而是可以相互融合、协同促进的。数据驱动建模是对传统计算材料学模拟研究范式的重要补充和拓展。为了提高数据驱动建模的科学性、准确性和效率,需要将机器学习算法与领域知识紧密结合,交融汇聚材料科学知识和数据处理应用技术。

关于相稳定性计算研究的发展趋势,从以下几个方面进行了展望:

(1)数据库建设与数据信息系统相结合

充足的材料数据是实施数据驱动模拟计算的基本前提,数据库中的数据应遵循可发现、可访问、可交互、可重复使用的FAIR原则。随着数据质量的提高,数据共享将变得更加容易,社会总成本将降低。随着计算模型和方法的发展,利用高通量计算可以快速获得大量的计算数据补充完善数据库。然而,实验数据的多源异构性可能导致数据库中数据质量的明显下降,这会制约数据驱动相稳定性研究的建模和基于相稳定性的新材料设计。因此,伴随数据库建设,研究数据收集、存储、传输、融合和数据应用的理论和技术是非常重要和必须持续开展的。同时,需要建立适用于数据驱动建模和材料设计的数据标准,将数据相关信息系统的建设纳入数据应用技术开发和数据驱动相稳定性研究的协同发展之中。

(2)基于高质量小数据集的机器学习

目前已经公开发布的材料数据库,已涵盖高温合金、粉末冶金材料、钢铁材料、有色金属及合金、稀土永磁合金等多种典型基础材料的系统数据,可以支撑这些材料体系中有关性能主导相的数据驱动相稳定性研究,并促进这些材料体系中新型高性能材料的快速设计开发。对于某些新型材料体系,因研究历程短、数据量不足,其数据库的建设还需要经历相对较长时间的架构和检验的过程。在此情况下,基于高质量小数据集的机器学习值得重视。高质量的小数据集,数据主要来自于单一研究组或者相近的实验制备和测试条件,可能最大限度减少实验过程中的不确定因素和可控变量。高质量的数据集是获得准确可信的机器学习结果的必要条件之一。面对数据量小的问题,数据的选择和机器学习方法的选择就很关键,同时,结合领域知识开展数据驱动的建模尤为重要。

(3)高通量计算模型与算法

随着计算能力和集成计算软件功能的提高,高通量计算必将以越来越快的速度发展。高吞吐量计算在多通道、多目标、多任务以及高并发计算和数据管理等方面具有先进性,能够生成大量数据用于机器学习。利用高性能计算集群和已开发的高通量计算程序,已有高通量第一性原理计算数据并以之指导设计了多种新材料。然而,对于一些包含复杂结构和多组分的材料体系,即使是单任务计算也非常耗时,目前尚难实现高通量计算。因此,迫切需要开发和优化多目标、多任务的计算模型和算法,结合多尺度、多状态的模拟计算,获得高效的高通量计算结果。

(4)物理可解释性机器学习建模

虽然目前已有大量材料的机器学习研究获得了成功,但是机器学习的算法和结果仍普遍缺乏深入的理论基础和可解释性,这尤其限制稳定性敏感多变的合金体系的机器学习研究。随着机器学习方法在材料组织结构模拟、性能预测和材料设计中越来越多的应用,机器学习模型的可解释性越来越受到重视。最近报道了一些结合机器学习和第一性原理计算来揭示合金组成元素的作用并提出多组分材料设计方案的重要研究进展。对材料成分、相组成和相结构、制备工艺和材料性能之间的关系,进行数据驱动的建模计算,是研究物理可解释性机器学习模型和方法的有效途径。将机器学习方法与计算材料学模型和材料科学理论基础紧密结合,可能是可解释性机器学习的未来发展趋势。

本文研究得到了国家重点研发计划项目(2018YFB0703902)和国家杰出青年科学基金“金属纳米材料的稳定性”(51425101)的资助。

Journal of Materials Informatics(www. jmijournal.com)是聚焦材料信息学领域的国际英文学术期刊。旨在通过紧密集成和智能化的方式将理论、实验、计算和人工智能协同结合,以推进和加速材料发现、设计和部署的步伐。该刊综合了物理,化学,数学,力学,计算机科学与工程,材料科学与工程以及新兴的实验,为研究人员提供了一个展示、发表和交流材料信息学相关研究的平台,寻求打破材料科学与工程、数据科学与工程及人工智能之间的壁垒。

JMIOAE出版公司主导创办,由中国科学院院士,香港工程科学院院士张统一教授担任创刊主编

期刊主页:www. jmijournal.com

投稿地址:https://oaemesas.com/jmi/

联系编辑:editorialoffice@jmijournal.com

分享到