化学实验指令生成模型ChemActor问世

突破“语言壁垒”,让AI“读懂实验、指导操作”

中化新网讯 近日,上海交通大学人工智能研究院AI for Science团队推出业内首个融合链式数据生成和分布差异筛选的实验指令生成框架大模型——ChemActor。该模型基于70亿参数模型进行微调训练,可在不依赖人工标注的前提下,自动完成从单分子输入到完整实验流程生成的全过程。

据课题组相关负责人介绍,ChemActor可实现非结构化实验描述与结构化实验操作指令“双向翻译”,突破了化学实验自动化的“语言壁垒”,能够让AI真正“读懂实验、指导操作”。它并非只“能生成”,更能“写得真”。在两个公开化学实验数据集上,ChemActor相较现有方法在实验指令生成任务中性能提升平均超过10%,在语义对齐、逻辑合理性与结构还原等方面全面领先。

ChemActor具备“读懂实验语言、写出操作指令”的闭环能力,其主要核心创新点有3个:一是首次以LLaMA-2-7B大语言模型为基座,构建了具备化学实验语言理解能力的专用大语言模型,能够高效生成结构化实验指令;二是首次提出链式大语言模型合成数据框架,集成了“反应—描述文本—操作指令”三元组数据,能够缓解标注数据稀缺难题,显著拓展了模型的泛化能力和化学反应空间;三是采用多轮语言模型循环评测机制,让多个大语言模型组成“化学专家委员会”,围绕生成实验指令和标注实验指令的一致性、合理性进行多轮打分与交互评议,有效提升了评估结果的可信度和语义精度。

据悉,早在2023世界人工智能大会上,上海交通大学AI for Science团队推出首个具备反应条件生成与“人在环路”反馈优化能力、能够指导实验探索的化学大模型——“白玉兰科学大模型1.0版”。今年早些时候,该团队又推出首个利用化学反应实验数据发现反应动力学方程的人工智能模型——KinFormer,旨在实现未知复杂系统的动力学方程预测,帮助化学家破解未知化学反应机理。未来,研究团队还将持续优化模型,推动更多大语言模型在真实化学实验场景中的应用,引领化学动力学研究迈向更智能、更自动化的新时代。

相关推荐

我首套3千米级海管应急回收装置投用

7月18日,海洋石油工程股份有限公司(以下简称海油工程)发布消息,我国自主研发的首套3000米级超深水海管应急回收装置实现首次应用,设备整体性能达到世界先进水平。

2025-07-23     中国化工报

海辰化学数字化交付平台项目启动

近日,由中国化学天辰公司总承包的福建海辰化学有限公司年产40万吨己二腈及原料配套项目数字化交付平台建设与实施项目启动暨工作部署会召开。

2025-07-23     中国化工报

北京加速推动AI赋能科学研究

近日,北京市科学技术委员会、中关村科技园区管理委员会等部门印发《北京市加快人工智能赋能科学研究高质量发展行动计划(2025-2027年)》(以下简称《行动计划》)。

2025-07-23     中国化工报

石化化工首部数字化转型评估标准发布

近日,工业和信息化部发布公告,由中国工业互联网研究院石化化工行业数字化转型推进中心秘书处牵头组织60余家企事业单位编制的行业标准《石化和化工行业数字化转型成熟度评估》(HG/T6346—2025)于...

2025-07-23     中国化工报

山东新增354家先进级智能工厂

日前,山东省工业和信息化厅开展的2025年山东省先进级(省级)智能工厂、智能制造优秀场景评定发布,经企业申报、地市推荐、专家评审、社会公示等程序,确定浪潮电子信息产业股份有限公司(以下简称浪潮信息)等...

2025-07-23     中国化工报

中沙古雷乙烯项目首批进口设备进场

7月12日,中沙古雷乙烯项目首批进口设备运抵古雷石化园区施工现场。据福建中沙石化有限公司仓储物流经理周传友介绍,目前项目土建框架已基本完成,随着设备陆续进场,项目将全面转入设备安装高峰期。

2025-07-23     中国化工报