大模型与 Agent 技术正加速重塑科研范式。 诸如可生成科学假设的 Co-Scientist、自动化多智能体系统 Robin 等,正深度渗透至文献解构、假设生成、代码编写及数据分析等 “干实验” 环节。这表明,AI 已然超越单纯的辅助工具,正作为数字化 “研究伙伴” 深度参与科研流程。
然而,从产业落地的视角审视,自主科学发现必须实现湿实验闭环。 医药研发、化学合成及新材料创制等场景,本质上是与物理世界进行长程交互的复杂系统工程。这意味着,AI for Science 的下一步,不仅要求 AI “擅长构想实验”,更亟需探索如何让 AI 深度融入真实实验系统,确保物理装置能够长周期、高稳定、安全可控地运行。
晶泰科技联合复旦大学、浙江大学和同济大学等提出了 LabHarness 框架。 在通用智能体领域,“Harness” 作为运行框架,核心在于协助 Agent 进行工具调用、状态管理、过程追溯及异常容错。而在更为复杂的物理实验室场景中,面对设备协同、样品流转、环境状态及安全边界等多元异构要素,AI 生成的实验方案极难直接转化为稳定的物理流水线。因此,将 Harness 的 “状态控制与稳定保障” 思想延伸至实验室生态,构建起连接数字智能与实体装置的 “LabHarness”,正是我们当前致力于攻坚的关键技术路径。
LabHarness 是一种面向真实实验室的运行保障层。它位于科学智能与真实实验系统之间,尝试把 AI 生成的实验计划,转化为真实设备可以执行、系统可以监测、异常可以处理、过程可以追溯、关键节点可以审批的实验流程。如果说科学智能负责提出实验目标和策略,实验设备负责完成具体操作,那么 LabHarness 要做的是,让这两者之间的连接更加可靠。
为什么长周期自主实验室需要LabHarness?
真实实验室并不是一个稳定不变的环境,自动化执行过程中需要面对一个核心挑战:漂移。
• 设备会漂移:移液设备可能出现液面识别误差,机械臂位置可能发生细微偏移,传感器读数也可能随时间产生变化。
• 样品会漂移:样品位置可能发生变化,等待时间可能超出实验允许范围,温度、浓度、挥发、污染等因素也会改变样品状态。
• 流程会漂移:某个任务的延迟可能影响后续多个步骤,局部失败可能导致队列阻塞,某一步看似已经完成,但真实状态却尚未同步。
• 数据也会漂移:条码绑定、检测结果、设备日志、任务状态与样品状态之间可能出现不一致。
因此,当 AI 设计出一套实验方案后,不能直接假设自动化平台可以稳定、连续、无误地执行。其中一个解决思路,是借鉴世界模型的理念:在真实执行前,先对实验方案进行虚拟预演,以验证方案的可靠性和可执行性。在这一过程中,系统需要提前审查设备能力、孔位映射、称量阈值、UPLC 队列等关键约束。下面的 demo 展示了在 AI 完成实验流程设计后,LabHarness 如何对流程进行审查与虚拟预演,并在正式执行前成功识别出 “托盘偏移” 和 “A7 固体过量投料” 等潜在风险。
因此,当 AI 设计出一套实验方案后,不能直接假设自动化平台可以稳定、连续、无误地执行。其中一个解决思路,是借鉴世界模型的理念:在真实执行前,先对实验方案进行虚拟预演,以验证方案的可靠性和可执行性。在这一过程中,系统需要提前审查设备能力、孔位映射、称量阈值、UPLC 队列等关键约束。下面的 demo 展示了在 AI 完成实验流程设计后,LabHarness 如何对流程进行审查与虚拟预演,并在正式执行前成功识别出 “托盘偏移” 和 “A7 固体过量投料” 等潜在风险。
然而,静态的预演无法完全预测动态的未来。当实验真正开始、长达数天甚至数周的自动化流程运转起来时,物理世界的 “漂移” 依然会如期而至。因此,长周期自主实验的关键,并不是简单地 “让设备自动执行”,而是要解决以下问题:
• 系统如何精准捕获正在发生的、细微的漂移?
• 面对漂移,系统如何判断哪些操作可以继续,哪些必须暂停?
• 出现异常后,系统如何动态重规划(Re-planning),尽可能将实验过程自主纠正回来?
LabHarness如何支撑实验室运行?
LabHarness 不是一个单一模块,而是一套面向真实实验室的运行保障框架。
从整体上看,它需要把 AI 计划、实验知识、现场感知、设备能力和虚拟验证连接起来。为此,我们正在探索四类基础组件:
• 知识本体系统(LabOntology)让系统 “懂规则”。它把设备、样品、实验流程、操作规则和安全约束结构化。
• 多模态感知让系统 “看得见、接得上”。它深度融合真实实验环境中的视觉、语言和动作信息,帮助系统实时理解设备状态、样品位置、操作意图以及现场的瞬态变化。
• 标准技能库让系统 “会调用”。它把加料、控温、搅拌、检测、转运等实验动作封装成可自由组合、可定量评估、可高频复用的标准化技能单元,实现设备能力的统一调度与协同。
• 虚拟仿真让系统 “先排练”。它在真实实验执行前提供高精度的虚拟训练与验证环境,用于流程预演、异常注入、长程压测和安全通过性评估,从而最大程度降低实体运行的试错成本和安全风险。
这四类组件共同支撑起 LabHarness 的闭环运行机制:“多模态感知” 负责精准感知现场态势,“标准技能库” 负责输出灵活的设备操控能力,“虚拟仿真” 负责在执行前完成防错验证,而 LabOntology 则作为中枢,提供贯穿全程的知识结构与逻辑安全约束。
LabHarness 要应对长周期实验中的漂移,不能只靠流程编排。因为真实实验中的关键问题,往往不是 “下一步是什么”,而是 “在当前状态下,这一步还能不能做”。LabOntology 尝试把设备、样品、试剂、容器、实验步骤、操作规则、安全约束和数据结果结构化,形成可被机器理解和推理的实验知识网络。
有了 LabOntology,LabHarness 可以围绕 “漂移” 实现三类关键能力:
第一,检测。判断设备、样品、流程和数据状态之间是否出现不一致,及时识别潜在偏差。
第二,约束。判断当前操作是否仍然满足实验条件、设备能力、样品状态以及安全边界。
第三,纠正。当偏差出现后,辅助系统选择自动重试、替代路径、任务暂停,或提交人工审批。
例如,一个样品需要在特定温度区间内保存,并且离开恒温环境的时间不能超过规定上限。此时,系统不能仅按照预设流程顺序转运样品,而必须结合当前设备队列、转运路径、仪器可用性和样品实时状态,判断任务是否仍然满足实验约束。再比如,当 AI 建议调整某个关键反应参数时,系统需要判断该参数是否处于设备允许范围内,是否触及安全边界,是否会影响下游检测,以及是否需要科学家审批。
以下 demo 展示了这一过程:系统在虚拟预演中发现风险,例如 “托盘偏移”和 “A7 固体过量投料”;随后训练并生成对应的技能包,例如 “托盘定位纠偏” 和 “称量闭环重做”;加载技能包后,系统再次进行预演。重复预演通过后,系统会生成技能包、UPLC 检测队列和审计记录,并最终下发给真实的合成工作站设备执行。
因此,LabOntology 是 LabHarness 从 “流程驱动” 走向 “逻辑驱动” 的关键。它让 LabHarness 不只是 “会执行”,而是开始具备 “懂条件、懂边界、懂依赖、懂风险” 的能力。LabHarness 的目标,并不是让 AI 自由行动,而是在强逻辑约束下,让 AI 更稳妥、更可靠地参与真实实验运行。
从概念到初步验证
目前,LabHarness 仍处于前沿探索阶段。我们并不认为现阶段长周期自主实验室可以一步到位地在开放场景中实现完全自主。相反,真实实验室中的设备差异、样品差异、环境波动、安全要求以及数据一致性等问题,都需要长期积累、持续验证和逐步解决。
因此,我们的思路是从端到端流程较短、边界相对清晰的应用场景切入,构建覆盖 AI 规划、实验流程编排、设备执行、状态记录与数据反馈的最小闭环。通过自主实验在具体场景中持续产生学术价值和经济价值的过程,发现问题和进行工程化迭代,使 LabHarness 从概念逐步转化为可运行、可验证、可扩展的实验框架。在此基础上,LabHarness 后续可以逐步拓展至更长流程的实验场景,覆盖更多任务类型、更多异常情况以及更长时间尺度的运行测试。从一次性演示走向长期稳定运行,所需要的并不是单个模型、单台设备或单条流程,而是一套能够持续监测实验状态、施加运行。
用AI驾驭实验室, 还需要一条安全带
AI 自主实验平台的突破,不只是让 AI 更会设计实验,也不只是让设备更会自动执行。真正值得探索的问题是:当真实实验系统在长周期运行中不断发生漂移时,AI 如何保持实验过程尽可能准确、稳定、安全和可恢复。
LabHarness 正是沿着这一思路提出的前沿探索:把实验对象、操作规则、设备能力、安全边界和运行状态组织起来,使系统能够尝试检测漂移、施加逻辑约束、辅助异常纠正,并在关键节点引入人类审批。
真正的 AI 自主实验室,不只是有聪明的 Agent,也不只是有自动化设备,更需要一套能够帮助 AI 驾驭长周期实验运行的系统工程。