博客

医学世界模型：Steerable AI 与 Harness Engineering 的分界线

医学AI不能只依赖harness engineering的外部护栏；真正的医学世界模型必须进入state-action-transition-feedback的内部架构，使生物状态变化变得可表征、可推演、可审计、可修正。Harness engineering controls the AI system from outside. Steerable world modeling structures biomedical reasoning from inside.

熊江辉 · 2026-05-10

过去几年，AI系统的能力快速提升，也让一个问题变得越来越重要：

> 我们到底应该怎样控制一个强大的AI系统？

在通用AI、软件工程和智能体系统中，常见答案是：给模型加上外部约束。

- prompt模板；

- system prompt；

- RAG检索增强；

- tool calling；

- workflow编排；

- safety filter；

- output validator；

- human-in-the-loop；

- 审计日志；

- 沙盒执行环境。

这类方法可以统称为一种广义的harness engineering：

通过外部工程结构，把AI模型包裹、限制、调度和校验起来，使它更安全、更可靠地完成任务。

这当然非常重要。

但当AI进入医学，尤其进入医学世界模型这个问题时，外部护栏并不够。

因为医学AI的核心问题，不只是：

> 如何防止AI乱说？

更深层的问题是：

> AI是否真正理解一个生物系统的当前状态？

> 一个干预动作在这个系统中意味着什么？

> 施加这个动作后，状态可能往哪个方向移动？

> 如果没有按预期移动，失败原因能否被定位和修正？

这些问题不是单靠prompt、RAG或safety filter就能解决的。

它们需要一种更底层的结构：

steerable biomedical world model，也就是可驾驭的医学世界模型。

一、医学世界模型到底要解决什么问题？

在机器人或游戏智能体中，世界模型通常可以被简单理解为：

current state + action → predicted next state

机器人知道自己在哪里，采取某个动作后，预测自己下一步会在哪里。

但医学中的"状态"和"动作"都要复杂得多。

医学里的状态不是一个简单坐标，也不只是一个疾病标签。

一个人的生物状态可能包括：

- 分子网络状态；

- DNA甲基化状态；

- 免疫状态；

- 代谢状态；

- 器官功能状态；

- 炎症水平；

- 衰老模块状态；

- 既往病史；

- 环境暴露；

- 个体基线；

- 时间趋势。

医学里的动作也不只是"执行一个命令"。

一个医学action可能是：

- 干预顺序；

- 行为改变；

- 细胞治疗；

- 联合干预；

- 随访策略。

因此，医学世界模型真正要回答的问题不是"这个人会不会得病"，而是：

> 在当前状态下，如果施加某个干预，生物状态可能往哪个方向移动？

更进一步，它还要回答：

> 如果没有按预期移动，问题出在哪里？

这就是我在预印本 World Models for Biomedicine: A Steerability Framework 中提出"可驾驭性"问题的原因。医学世界模型不应该只是一个更大的预测器，而应该是一个可审计、可质疑、可修正的状态转移推理系统。

二、Harness Engineering是必要的，但不是医学世界模型本身

我并不反对harness engineering。

相反，我认为医学AI必须有非常强的harness engineering。

一个医学AI系统至少需要：

- 不越权诊断；

- 不直接替代医生决策；

- 不擅自给出处方；

- 不伪造文献；

- 不夸大疗效；

- 区分医学科普和医疗建议；

- 标注不确定性；

- 触发高风险转人工；

- 保留审计记录；

- 接受临床治理和合规约束。

这些都非常重要。

但这些主要解决的是AI行为风险：

AI是否乱说？

AI是否越界？

AI是否违规？

AI是否输出不安全建议？

它们不直接解决生物推理风险：

患者状态是否表征正确？

干预动作是否建模正确？

机制链条是否成立？

状态转移方向是否合理？

分子变化是否能传导到功能变化？

功能变化是否能传导到临床获益？

失败原因能否被定位？

这两类风险不能混在一起。

Harness engineering可以让AI的输出更安全。

但它不能自动让AI拥有医学世界模型。

三、一个"医学大模型+工具链"不等于医学世界模型

现在很多medical AI agent系统，本质上是：

+ 医学知识库

+ RAG检索

+ 工具调用

+ 报告生成

+ 安全过滤

+ 医生审核

这类系统可以很有用。

它们可以帮助医生读文献、整理病历、生成摘要、解释报告、查询指南、设计随访问卷。

但严格来说，这仍然不一定是医学世界模型。

因为它可能没有真正定义：

1. 当前生物状态是什么；

2. 一个干预动作如何被表示；

3. 当前状态在某个动作下如何转移；

4. 反事实路径如何比较；

5. 失败如何反馈到下一轮模型。

换句话说，它有workflow，但不一定有world model。

它有harness，但不一定有steerability。

一个系统能安全地回答医学问题，不等于它能模拟医学状态转移。

这一区分非常关键。

四、什么是Steerable Biomedical World Model？

我所说的steerable biomedical world model，不是一个"自动开药系统"，也不是一个"临床处方引擎"。

更准确地说，它是一种医学AI架构目标：

> 在明确状态表征、动作语义、转移假设、机制证据和反馈检查的基础上，帮助人类理解并检验生物状态可能如何被引导。

它不应该直接声称"这个干预一定有效"。

而应该更谨慎地说：

基于当前状态、候选动作和机制约束，

这个干预可能产生某种可检验的状态转移方向。

也就是说，早期医学世界模型更适合被理解为：

state-action-transition hypothesis system

validated clinical decision system

这是一个重要边界。

在当前阶段，很多医学世界模型还不具备足够的纵向干预数据，无法真正学习一个经验性的state + action → next state函数。

因此，更科学的表述应该是：

knowledge-constrained transition tendency

> 基于已有生物学机制、网络结构、个体状态和干预语义，提出一个可审计、可验证、可反驳的状态转移方向假设。

这比"预测疗效"更稳健，也更适合医学AI的早期发展阶段。

五、Steerable与Harness的核心区别

可以用一句话概括：

> Harness engineering controls the AI system from outside.

> Steerable world modeling structures biomedical reasoning from inside.

中文可以说：

> Harness engineering是外部约束；

> Steerable world model是内部可驾驭。

更具体地说：

| 维度 | Harness Engineering | Steerable Biomedical World Model |

|------|---------------------|----------------------------------|

| 核心问题 | 如何约束AI输出和行为？ | 如何表征并推演生物状态转移？ |

| 主要对象 | 模型、工具、权限、流程、输出 | 生物状态、干预动作、转移假设、反馈 |

| 典型组件 | prompt、RAG、validator、workflow、guardrail | state、action、transition、counterfactual、QC |

| 医学作用 | 降低AI输出风险 | 提高生物推理的可审计性 |

| 失败诊断 | 输出是否违规？工具是否调用错误？ | 状态测量错了吗？干预语义错了吗？转移假设错了吗？ |

| 本质 | 外部安全工程 | 内部状态动力学架构 |

| 是否构成医学世界模型 | 不充分 | 是核心条件之一 |

这并不是说二者互相排斥。

恰恰相反，医学AI需要两者同时存在。

但它们属于不同层级。

六、为什么医学AI不能只依赖Harness？

因为医学的核心对象不是文本，而是人体。

文本系统的错误，通常可以通过重新生成、人工审核、规则过滤来修正。

但医学系统面对的是：

- 动态生物状态；

- 个体差异；

- 多尺度机制；

- 长期反馈；

- 干预风险；

- 不可逆后果；

- 临床伦理责任。

因此，医学AI的关键不只是"回答是否合规"，而是：

这个回答背后的生物状态模型是否成立？

如果一个系统根据知识库说"某药物与炎症通路有关"，这只是知识检索。

如果它加一句"请咨询医生，本内容不构成医疗建议"，这是harness engineering。

但如果它进一步问：

这个个体当前炎症模块是否真的异常？

该药物靶点是否落在相关异常模块中？

作用方向是否可能使状态向期望方向移动？

是否存在机制证据链？

若干预后无变化，失败可能发生在哪个环节？

这才开始接近医学世界模型。

安全输出 ≠ 生物推理成立

一个医学AI系统可以非常合规，但生物推理仍然很浅。

一个医学AI系统也可以机制推理很有趣，但如果没有harness engineering，则不适合部署。

这就是为什么二者必须区分，也必须结合。

七、Steerability的五个结构条件

在我的预印本中，我把可驾驭医学世界模型组织为五个约束检查点。它们不是装饰性的概念，而是医学世界模型最低限度需要回答的五类问题。

1. State Representation：状态表征

第一个问题是：

> 这个人现在是什么状态？

在医学中，状态不应该只是疾病名称。疾病标签是表型层描述，不等于世界模型的状态空间。

医学世界模型需要更细的状态表征，例如：分子状态、通路状态、网络状态、免疫状态、代谢状态、器官功能状态、衰老模块状态、个体基线偏移、时间轨迹。

在Capomics / mIC vector的表达中，一个人可以被表示为多个模块内在能力的组合状态，而不是一个单一年龄或单一风险分数。

2. Capability Quantification：能力量化

第二个问题是：

> 这个状态能否被量化？

医学里经常说某人"免疫力差""代谢不好""衰老加速"。但世界模型不能只停留在形容词。

它需要把状态转化为可比较、可追踪、可更新的量化表示。

当然，这些量化不应被过度解释为真实生物本体。它们首先是模型变量，是为了让状态转移推理变得可计算。

> 量化变量不是生物真相本身，而是用于建模、比较和验证的操作性表征。

3. Intervention-Response Semantics：干预响应语义

第三个问题是：

> 一个干预在模型中到底意味着什么？

在普通数据库里，一个干预可能只是一个标签。但在世界模型中，干预不能只是标签。

它必须被翻译成：这个action会作用于哪些模块？以什么方向作用？在什么状态下作用？是否需要剂量、时间、频率和顺序信息？

也就是说，医学world model不能只知道"做了什么"，还要知道"这个动作在生物系统里如何被编码"。

这就是intervention-response semantics。

4. Counterfactual Transition：反事实转移

第四个问题是：

> 如果做A而不是B，会怎样？

医学决策天然是反事实问题。一个简单推荐系统无法真正回答这些问题。一个带harness的LLM也只能更安全地表达不确定性。

真正的医学世界模型必须让这些问题进入可计算结构：

S(t), A → Ŝ(t+Δt | A)

不过需要强调：在当前早期阶段，这里的Ŝ(t+Δt | A)更适合理解为"可检验的转移方向假设"，而不是"已经验证的临床结局预测"。

这是科学严谨性的关键。

5. Quality-Control Feedback：质量控制反馈

第五个问题是：

> 如果没有按预期发生，问题出在哪里？

这是steerability与普通simulation的重要区别。

一个可驾驭医学世界模型应该能把失败拆解为多个可能环节：状态测量错了吗？干预定义错了吗？模块响应没有发生吗？状态没有按预期移动吗？下游表型没有传播吗？时间窗口不对吗？剂量不对吗？个体基线不同吗？

预印本中我把这称为从"what-if simulator"走向"why-not steering system"。

也就是说，医学世界模型不仅要问"如果这样做会怎样"，还要问"为什么没有发生预期结果"。

这一步非常重要。

因为医学AI的价值不只是预测成功，更是理解失败。

八、Harness与Steerability的关系：不是替代，而是分层

我认为未来严肃的医学AI系统，应该至少有四层：

1. Biomedical World Model Layer

负责状态、动作、转移、机制、反馈。

2. Harness Engineering Layer

负责权限、流程、工具、安全边界、输出校验。

3. Clinical Governance Layer

负责临床责任、伦理、监管、适用范围。

4. Human Oversight Layer

负责最终判断、情境解释和实际决策。

其中，steerable world model解决的是"医学推理是否有内部结构？"

Harness engineering解决的是"AI系统是否能被安全使用？"

Clinical governance解决的是"这个系统是否应该在某个真实场景中使用？"

Human oversight解决的是"具体个体情境下，最终应该怎么判断？"

这四层不能混为一谈。

尤其不能用harness engineering来替代医学世界模型。

因为外部护栏可以阻止模型越界，但不能自动赋予模型对生物状态转移的理解能力。

九、SteeraMed应该指向什么？

如果把SteeraMed理解为一个面向可驾驭医学AI的研究、方法或平台入口，那么它不应该只是medical LLM + RAG + safety guardrails。那样的系统当然有用，但更像医学AI应用层。

我认为SteeraMed更应该指向一个更深的问题：

> How can medical AI become steerable rather than merely constrained?

也就是说，SteeraMed不应只关注"如何让医学AI不乱说"，还应关注：

如何定义医学状态？

如何编码医学动作？

如何估计状态转移？

如何比较反事实路径？

如何把失败转化为反馈？

如何让机制链条可审计？

这意味着SteeraMed至少应包含两层架构：

Harness Layer

权限、安全、合规、审计、输出边界。

Steerability Layer

状态表征、动作语义、反事实转移、机制证据链、质量控制反馈。

前者让AI不越界。

后者让医学推理不漂浮。

前者解决的是"AI能不能安全说话？"

后者解决的是"医学状态能不能被结构化驾驭？"

这才是SteeraMed这个方向真正值得提出的原因。

十、一个更谨慎的判断：Steerability不是临床自动化

这里必须特别强调：

steerable biomedical world model不等于临床自动化决策系统。

它不是说"模型可以替医生做决定"。更不是说"模型可以直接给患者推荐治疗"。

更合理的定位是：

模型帮助提出可检验的状态转移假设，

并让每个假设的状态、动作、机制、转移和不确定性都可以被审查。

医学世界模型真正进入临床应用，还需要：前瞻性验证、安全性评估、临床试验、真实世界随访、监管审查、医生监督、明确适用范围、失败责任界定。

因此，在现阶段，steerability更应该被看作一种研究架构和科学推理框架，而不是已经完成的临床产品能力。

这个边界必须说清楚。

十一、从"可约束"到"可驾驭"

"可约束"意味着：

我能阻止模型做不该做的事。

"可驾驭"意味着：

我能理解系统状态，给出方向信号，观察状态转移，并根据反馈修正下一步。

这是两种完全不同的能力。

用马来比喻：

- harness engineering是马具、缰绳、护栏、训练场；

- steerable world model是骑手、马、地形和方向之间形成的动态控制关系。

有马具，不代表知道往哪里走。

有护栏，不代表能穿越复杂地形。

有规则，不代表理解马的状态和地形的变化。

医学也是如此。

有安全guardrails，不代表有医学世界模型。

有RAG，不代表能模拟生物状态转移。

有审计日志，不代表能诊断机制失败。

有agent workflow，不代表拥有counterfactual transition reasoning。

真正的医学世界模型，必须进入生物系统的状态空间。

十二、结论：医学AI的下一步不是更大的黑箱，而是可驾驭的世界模型

医学AI的未来不应该只是：

+ 更多医学文献

+ 更复杂agent workflow

这些当然重要，但还不够。

医学需要的是：

明确的状态表征

+ 明确的动作语义

+ 可检验的状态转移假设

+ 可审计的机制链条

+ 可诊断的反馈闭环

Harness engineering让AI不至于失控。

Steerable world modeling让医学推理可以被引导、被检查、被修正。

前者解决的是"如何管住AI？"

后者解决的是"如何驾驭生物状态变化？"

第一代真正有用的医学世界模型，可能不是那些声称已经能预测一切治疗结果的系统。

相反，它们可能是更谦逊、更可审计、更可证伪的系统：

> 它们不宣称知道未来。

> 它们只是把每一个关于状态、动作、转移、机制和不确定性的假设，都明确到可以被测试。

这才是医学AI从"预测工具"走向"可驾驭系统"的关键一步。

1. Xiong J. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. DOI: 10.20944/preprints202605.0366.v1.

2. SEWO / Steerable Medicine World Model: https://steerable.world

3. SteeraMed: https://steeramed.com

4. SteeraMed: https://steeramed.org

5. DeepoMe / 深度甲基: https://deepome.com

xiongjianghui.com

← 返回博客