南开大学胡献刚团队在机器学习-纳米环境生物效应领域取得进展
当前,纳米材料在电子机械、医疗化工、能源环境等诸多领域的研究、应用迅速发展,但纳米材料的环境效应预测存在高内涵数据库缺乏、环境转化情景遗漏、模型普适性弱等问题,严重制约了国家对危害性纳米材料的风险防控。
近日,南开大学环境科学与工程学院胡献刚教授团队在拓展机器学习算法预测纳米材料的生物效应,以及通过增强机器学习的可解释性,从而探索纳米材料生物效应的机理方面取得了突破,为上述问题的解决提供了新的研究思路。5月26日,介绍该科研成果的论文“Deep exploration of random forest model boosts the interpretability of machine learning studies of complicated immune responses and lung burden of nanoparticles”发表在国际知名期刊《Science Advances》上。
论文截图
目前,在对纳米材料的环境生物效应预测中,机器学习模型已广泛应用,但是受限于机器学习的可解释性,利用机器学习模型揭示复杂纳米毒理的机制仍具有很大的难度。
胡献刚教授团队在前期工作基础上(PNAS,2020, 117, 10492-10499;ES&T, 2018, 52, 9666-9676)创建了纳米材料—生物效应数据库,构建了纳米材料—生物效应回归模型,并提出了一个基于树的随机森林特征重要性和特征网络交互分析框架(TBRFA),该框架通过多指标重要性分析方法,克服了小型数据集导致的特征重要性分析偏差,并利用随机森林的工作机制建立了特征交互网络,揭示了潜在的影响纳米材料生物效应的交互因素。
图1. TBRFA框架示意图
TBRFA分析框架包含重要性分析与特征交互网络分析。TBRFA重要性分析采用多个重要性指标,以平衡传统的单一指标带来的偏见,并识别出暴露恢复时间、材料比表面积以及材料尺寸是影响纳米材料诱导生物效应的重要因素。TBRFA特征交互网络分析通过解析随机森林的树结构,计算出两两特征之间的交互作用系数,并识别出材料的比表面积与表面电荷、比表面积与长度、长度与直径之间在诱导生物效应过程中起着相互制约与影响的作用。
胡献刚教授表示,这项研究对研发环境友好型纳米材料具有一定的指导作用,将为纳米材料的生态环境安全性评估提供新的策略;该机器学习算法除了适用于纳米材料环境效应分析,也可用于重金属、有机物污染等环境生物效应的预测、评估。
南开大学为该成果论文独立完成单位,南开大学博士研究生于福波为第一作者,胡献刚教授为论文通讯作者。该研究得到了国家自然科学基金委优秀青年基金、国家重点研发计划、天津市滚球体育 局杰出青年基金等项目资助。
Yu, F.; Wei, C.; Deng, P.; Peng, T.; Hu, X.G.* Deep Exploration of random forest model boosts the interpretability of machine learning studies of complicated immune responses and lung burden of nanoparticles. Science Advances 2021,7,22,4130.
论文链接:https://advances.sciencemag.org/content/7/22/eabf4130
本文由作者投稿。
文章评论(0)