带领团队从事AI+能源化工材料的研究。在Nature Machine Intelligence、Nature Synthesis等期刊发表学术论文170余篇,包括15篇ESI高被引论文,被引10500余次,H-index 61。2011年本科毕业于清华大学化学工程系,2015年获加州大学戴维斯分校化学工程和控制科学博士,赴英国伦敦帝国理工学院任博士后研究员和硕士生导师。2017年起担任新加坡国立大学化工与生物分子工程研究员、博导,2021年人才引进回清华化工系担任课题组负责人。担任Applied Energy (IF:11.45)、Advances in Applied Energy (IF:13.0)等十本国际期刊副主编和编委,获美国化学会可持续化学与工程讲席奖、青年北京学者、Cell Press中国女科学家奖、侯德榜化工科学技术奖“青年奖”,福布斯中国科技女性50,新加坡杰出青年首席研究员奖、英国皇家学会国际交流奖等奖项。入选全球学者终身学术影响力榜,2024全球高被引学者,连续四年被Elsevier评为全球前2% 顶尖科学家。
成果1: 物质智造工业软件平台
新材料,尤其是复合材料、功能材料和能源新材料相关的数据信息,是智能时代材料技术创新的重要基础。利用知识图谱系统化地展示并调用材料数据,可以显著提升化工材料等领域科学研究者的工作效率,缩减其获取和使用材料数据的时间成本。但是,近年来关于化学材料知识图谱的研究均仅针对某一类特定材料,图谱涵盖材料种类比较单一,难以系统开展数据融合知识驱动的化工新材料开发。为解决上述问题,本项目为关键领域化工材料前沿技术创新搭建了一个有代表性、可解释性及通用性,国际领先,涵盖面广的化学化工材料“物质智造工业软件平台”,通过多层次的数据采集和算法处理,将不同数据源经标准化处理后存储于高效数据库中,建立多种类、多尺度、多模态的大化学材料知识图谱,并融合原创高效的主动学习算法,实现大语言模型适配及数据高效提取、数据平台可视化构建、智能交互、多模态扩展等优势功能。该知识图谱集成了有机、无机两大类,110小类400 余万条化学材料数据,涵盖600种以上重要性能指标标签,包含实体节点超过150 万个,关系数据超过300万条。同时,本工业软件整合了数据检索、主动学习算法和模块化大模型推理等工具,在实际的工业应用中,不仅能为研发人员提供化学材料深度检索的支撑,还可结合工业生产参数进行精确的模拟与推理,通过数据驱动与工业应用场景的无缝对接,提高研发效率,降低研发成本,加速科研成果的转化与应用,从而有效推动新材料的开发及产业化进程。
图1 工业软件平台架构图
成果2: 人工智能发现工业催化配方
催化剂在化学反应中扮演着核心角色,但新型催化剂材料和工业的设计过程极为复杂,传统研发方法耗时长、成本高,不能满足快速发展的需求,因此,本项目创新性地利用人工智能手段,开发了一种快速筛选和验证催化配方的新方法,该方法结合了“干实验”和“湿实验”,通过计算化学方法预测和优化催化剂的结构和性能,并在实验室和工业条件下对催化剂进行实际的化学反应测试。本项目以新能源器件关键材料 “聚烯烃弹性体(POE)” 工业生产必需的茂金属催化剂为示范,基于AI工作流程,成功评估了一系列潜在催化剂的活性。课题参与单位万华化学选取代表催化剂进行实验合成、表征,经过实际测试,项目组自研催化剂活性显著高于现有商业催化剂(中期第三方测评中活性指标提高了82.86%),高分子产物分子量,C8插入率等参数均满足作为聚烯烃弹性体材料在具体应用领域的实际要求,可用于年产20万吨POE的生产装置,产值达30亿元/年,具有良好的工业应用前景。本项目通过人工智能发现催化剂配方的创新方法,显著提升了催化剂开发效率,减少了试错环节,显著缩短了开发周期,研发成本和时间都缩短了50%以上,并通过创制全新结构的催化剂分子,打破了国外知识产权的垄断,提升了国产催化剂的自主程度。该项目成果展示了人工智能工作流程在简化和加速催化剂开发过程方面的巨大潜力,以及人工智能技术在工业生产场景中应用落地的良好前景。
图2 聚烯烃弹性体POE催化剂实验表征流程
成果3: 工业园区数字孪生
流程工业,尤其是化工行业,作为碳排放和民生主体,其产业减排具有重要意义。流程工业的低碳化转型在工业脱碳中发挥着重要作用,也面临着降低运营碳排放和保持经济可行性的双重挑战。生态工业园区是通过在特定区域上形成企业社区,企业之间通过物质、能源、水和副产品的交换来提高工业社区的竞争优势,园区内配备相应的基础设置和交易网络,能有效减少运输和沟通成本,减少产品碳足迹。本项目提出了一种具通用性的跨层级流程工业园区优化调度框架与数字孪生系统,以化工园区为研究对象,接收来自园区外部环境、市场、政策和社会的变化,在内部接收来自工厂的数据,设置经济和环境目标,通过优化算法构建内部交互网络管理外部市场,以园区为整体实现园区的环境和资源管理。同时,本项目采用大语言模型作为数据集成和管理工具,大幅度提升数据收集能力,为数据整合、扩展和自动化采集提供可能性。另外,本项目以园区为对象,构建跨尺度优化方法及其综合评估框架,建立实时双向数据传输的数字孪生平台,助力园区做出科学全面的决策,实现工业降碳目标。项目整体框架如下图所示,通过多方面场景模拟,该数字孪生平台的有效性已得到充分验证。
图3 工业园区数字孪生框架示意图