JAMIP:面向计算材料信息学的人工智能辅助、数据驱动的材料设计方法与软件|吉林大学Science Bulletin
材料信息学(Materials informatics)或材料基因工程作为新兴的材料研究与设计范式,通过深度结合材料大数据与人工智能机器学习算法,正在加速材料研究领域中新材料、新功能和新规律的创新发现。如何高效产生、收集、管理、学习和挖掘大规模材料数据是开展材料信息学或材料基因工程研究的关键。吉林大学张立军课题组为满足材料基因工程与材料信息学的研究需求,开发了人工智能辅助、数据驱动的材料设计方法与软件(JAMIP,全称为Jilin Artificial-intelligence aided Materials-design Integrated Package),涵盖半导体材料、介电材料、金属材料等材料体系,为基于功能材料大数据与人工智能机器学习算法结合的新材料发现和设计提供方法与软件支撑。软件包在基于发展的大规模高通量材料计算框架的材料设计方法基础上,深度结合了数据管理、分析及存储技术与机器学习数据挖掘算法,解决了系列材料信息学研究面临的关键技术难题。软件主体框架包含:
(1)以高通量材料计算为核心的数据产生。JAMIP具有强大的材料制造工坊,包含便于开展高通量材料计算的结构原型数据库,结构操作方法集(可快速构建缺陷、表面、晶界、异质结等复杂材料结构)。同时集成了高通量第一性原理计算引擎(支持VASP、Quantum Espresso等计算软件),可针对批量生成的材料结构进行高度自动化的计算模拟。此外,软件具有自动化任务递交、监控、纠错功能,内置了多种不同类型的材料性质计算流程模块。
(2)数据收集、管理工具及数据存储。针对材料信息学的材料大数据特点,JAMIP集成了以Django框架为基础的数据库平台接口,支持MySQL、Sqlite3、postgresql等多种主流关系型数据,实现了对高通量第一性原理计算结果的自动化数据提取、存储和分析。
(3)机器学习/数据挖掘。JAMIP集成了数据预处理、数据特征工程,以及常用机器学习算法的模型构建和性能评估子模块,可以为探索材料性质与结构之间的内在关系、不同物理性质之间的关联、主导材料高性能化的物理规律提供研究工具。
软件各功能模块之间实现了高度融合,能够高效产生、分析、管理和学习计算材料大数据,为开展材料信息学或材料基因工程研究、实现新材料设计,提供专业化方法与软件。
吉林大学赵信刚、周琨、邢邦昱、赵若廷为共同第一作者,张立军教授和付钰豪副教授为共同通讯作者,该文以“JAMIP: an artificial-intelligence aided data-driven infrastructure for computational materials informatics”为题发表于Science Bulletin2021年第19期。
图文摘要
Fig. 1 Overview of the JAMIP code framework. The grogram comprises three major parts based on the material data’s lifecycle: Data generation (blue), Data collection (yellow), and Data learning (green).
Fig. 2 The overall perspective of the material database.
Fig. 3 Detailed workflow of the HT calculations.
Fig. 4 Detailed workflow in the machine learning.
Xin-Gang Zhao, Kun Zhou, Bangyu Xing, Ruoting Zhao, Shulin Luo, Tianshu Li, Yuanhui Sun, Guangren Na, Jiahao Xie, Xiaoyu Yang, Xinjiang Wang, Xiaoyu Wang, Xin He, Jian Lv, Yuhao Fu, Lijun Zhang. JAMIP: an artificial-intelligence aided data-driven infrastructure for computational materials informatics. Science Bulletin, 2021, 66(19):1973-1985
https://www.sciencedirect.com/science/article/pii/S2095927321004163
本文由Science Bulletin期刊投稿。
文章评论(0)