博客

驾驭，而非预测：可驾驭医学世界模型

如果一个人站在你面前，一个世界模型也站在你面前，你敢不敢把自己的健康交给它？SEWO（Steerable Medicine World Model）提出：世界模型的终极使命不是成为更精准的预言机器，而是成为一匹识途的马——医生给方向，它自己在不确定地形中走稳。预测是手段，靠谱的状态切换才是目的。

熊江辉 · 2026-05-07

2026年，"世界模型"突然成了AI领域最热的词之一。

从通用人工智能到物理世界模拟，从自动驾驶到机器人，从虚拟细胞到药物发现，越来越多团队开始把自己的下一代模型称为"world model"。在生物医学领域，Bioptimus、Recursion、GenBio AI 等公司也相继发布宏大蓝图：用更大的模型、更丰富的数据、更复杂的表征，去模拟细胞、疾病、药物和人体系统。

我在这个节点提出了一个不太合时宜的问题：

> 如果一个人站在你面前，一个世界模型也站在你面前，你敢不敢把自己的健康交给它？如果不是今天，那还差什么条件？

这个问题不性感。它不涉及参数量、训练语料、GPU集群，也不涉及模型能生成多漂亮的图像或多复杂的分子。

但它直指当前生物医学AI叙事中一个常被忽略的盲区：我们一直在问模型能不能预测，却很少问模型能不能被人驾驭。

一、我们把"预测"当成了目的

当下生物医学AI有一个几乎不言自明的共识：

> 预测得越准，模型就越好。

这个共识太自然了，以至于很少有人去质疑它。图像识别要准，语音识别要准，机器翻译要准。到了生物医学，疾病风险预测当然也要准，药物反应预测当然也要准，生存期预测当然也要准。

但这里有一个隐蔽的偷换。

预测从来都只是手段，不是目的。

天气预报的目的，不是让你欣赏一朵云有多大概率下雨，而是帮助你决定明天要不要带伞、航班要不要延误、农田要不要灌溉。同理，疾病风险预测的目的，也不是给你一个小数点后三位的概率数字，而是帮助医生和个体做出一个更可靠的干预决策。

换句话说，临床决策真正追求的，不是"预测得更漂亮"，而是：

> 能不能把一个生命系统，从当前状态，安全、高效、可解释、可追踪地推向一个更好的状态。

我把这称为靠谱的状态切换。

什么是状态切换？

它不是简单说"三年内心梗风险47%"，而是追问：

- 我现在到底处于什么生物学状态？

- 这个状态离健康态差在哪里？

- 我应该往哪个方向干预？

- 这一步干预下去，哪些模块应该先变化？

- 如果没有变化，是状态识别错了，干预错了，还是响应机制错了？

- 下一轮应该如何修正？

现有的预测范式很难回答这些问题。不是因为它不够准，而是因为在它的框架里，这些问题根本没有被正式提出。

二、骑手与马：世界模型的本质是被人驾驭

来看一个古老的比喻。

一匹马走在山路上。骑手不需要控制马的每一块肌肉，也不需要实时计算每一次落蹄的角度。骑手只需要通过缰绳给出方向信号。马匹则依赖自身的平衡感、感知能力和稳健性，自己调整步伐，自己适应地形，自己避免摔倒。

> 骑手负责方向，马负责稳健。

把这个比喻放到生物医学AI里：

- 骑手是医生或研究者。他们根据临床判断和机制理解，给出分阶段的指向性信号：添加一个治疗假设，修改一个营养条件，删除一个混杂因素，或者改变一个干预路径。

- 马是世界模型。它必须在噪声、缺失数据、分布偏移和个体差异中保持推演的确定性，不崩溃、不乱跑、不把所有责任推给黑箱。

- 缰绳是框架定义的交互接口。人的意图通过它被翻译成模型能解析的输入，模型的反馈通过它被翻译成医生能审视、能质疑、能修正的输出。

这个框架，我们给它起了一个代号：

> SEWO — Steerable Medicine World Model，可驾驭医学世界模型。

它的核心理念可以浓缩成一句话：

> Steering, not predicting.

> 驾驭，而非预测。

这不是说预测不重要。恰恰相反，没有足够的预测能力，模型连基本推演都无法完成。

但预测能力只是马的肌肉。真正决定它能不能被用于医学决策的，是这匹马能不能听懂方向，能不能在不确定地形中走稳，能不能在走偏时让骑手看见偏差发生在哪里。

三、这个哲学来自医学本身

"驾驭"并不是AI领域凭空发明出来的概念。它本来就存在于医学深处。

很多真正有效的医学干预，并不是对身体进行外部强制控制，而是给生物系统一个方向性信号，让系统自身的调节机制重新启动。

天然黄酮类化合物不一定是直接"杀死"癌细胞。它可能是靶向某个蛋白互作网络，扰动某个信号子系统，让细胞自己的调控机制发生改变。药物营养素、运动干预、睡眠重建、代谢调节，也常常遵循类似逻辑：不是代替身体完成修复，而是释放身体自身的修复与重塑能力。

好的医生也是如此。

医生不是把人体当作一台机器逐个零件重装，而是在复杂、不确定、动态变化的生命系统中，判断方向、设置边界、观察反馈、不断修正。

SEWO试图把这种医学智慧带进AI决策：

> 世界模型不应该成为一个高高在上的数字神谕。

> 它应该是一匹识途的马：医生给方向，它自己在不确定地形中走稳。

四、五个结构约束：让"驾驭"成为可能

如果"驾驭"是目标，那世界模型就不能只是一个预测引擎。它必须满足一系列结构性要求。

我从一个基本公设出发：

> 生命不是变量的堆积，而是适应能力的集合体。

一个人的健康状态，不只是某几个指标是否超标，而是多个功能模块还能不能适应压力、修复损伤、维持稳态、完成重塑。基于这个公设，SEWO提出了五个结构约束，构成一个闭环。

CP1：状态表征——mIC向量

首先，模型必须能说清楚：这个人现在处于什么状态。

这不是指某个基因表达量、某个蛋白浓度，或者某个单一年龄数字，而是指各个功能模块还剩多少可调动的内在能力。

在这个框架中，我们用 mIC向量表示模块化内在能力。它试图把生命状态从单点指标，转化为一个多维能力结构。

> 衰老不是一个数字，而是一个向量。

CP2：内在能力量化——Capomics

其次，这种能力必须是可度量的。

不能只说"免疫能力还行""代谢状态不好""炎症有点高"。这些描述有临床直觉，但很难进入一个可推演、可比较、可审计的世界模型。

SEWO需要的是能力维度上的量化表达。例如，在某个适应维度上，系统的能力指数是多少？它距离功能性崩塌还有多远？某个干预是否真正改变了能力结构，而不只是改变了表层指标？

这正是 Capomics 试图承担的角色：把生命系统的功能能力转化为可计算、可比较、可追踪的结构化表征。

CP3：干预—响应语义

第三，模型必须能描述一个干预如何被生物系统"感知"，并产生响应。

同一个干预，在不同起始状态下可能产生完全不同的结果。一个营养素、一个药物、一次运动、一次睡眠修复，对不同的人可能是补偿、刺激、负担，甚至是扰动。

这正是"平均有效"不等于"对这个人有效"的结构性原因。

因此，世界模型不能只把干预看作一个外部输入变量。它必须理解：

- 干预进入了哪个生物通道？

- 它作用在哪个功能模块？

- 当前状态是否具备响应条件？

- 响应是恢复性的、代偿性的，还是失衡性的？

没有干预—响应语义，就没有真正的个体化决策。

CP4：反事实转移

第四，模型必须能回答：

> 如果没有这个干预，会怎样？如果换一个方向，会怎样？

没有反事实，就没有因果。没有因果，就只能停留在相关性外推。

在SEWO中，反事实推理不是简单生成几个可能未来，而是沿着结构化因果支架进行推演：在当前状态下，如果加入某个干预信号，mIC向量如何变化？如果删除某个混杂因素，状态转移路径是否改变？如果把干预顺序调换，最终表型是否不同？

医学决策真正需要的，往往不是一个未来，而是多个可比较的未来。

CP5：质量控制反馈——五门检查

第五，也是最关键的一点：当预期变化没有出现，模型能不能帮助我们诊断失败发生在哪个环节？

是状态测错了？

是干预方案不对？

是响应偏离预期？

是mIC转移方向反了？

还是表型读出滞后或误判？

我们把这个过程称为五门检查：

> 状态 → 干预 → 响应 → ΔmIC → 表型

每一步都应该可以被独立审计、独立质疑、独立证伪。

这也是SEWO与黑箱预测模型最重要的区别之一。黑箱模型出错时，通常只告诉你"预测错了"。SEWO希望进一步追问：到底是哪一个门错了？

五、为什么是五个，而不是四个或六个？

这五个结构约束不是随意枚举。

如果只有四个，系统很容易留下开环。比如有状态表征、有干预语义、有反事实模拟，但没有质量控制反馈，那么一旦预测失败，就无法形成可操作的修正机制。

如果拆成六个、七个、八个，又容易失去功能内聚性，把原本同一层级的问题拆得过碎，最终变成一个复杂但不稳定的流程图。

五个约束刚好构成一个完整闭环：

> 定义状态 → 测量状态 → 设计干预 → 模拟转移 → 检查偏差 → 修正下一轮。

这不是为了追求形式上的整齐，而是为了让世界模型具备医学决策所需要的最小结构完整性。

现在很多生物医学AI，本质上是在用越来越大的锤子砸越来越大的钉子。锤子越来越精良，但很少有人停下来问：

> 我们在砸的到底是不是钉子？

SEWO问的正是这个问题。

六、这条路还很长，但方向是对的

必须诚实地说，SEWO目前仍处于理论建构和早期验证阶段。

mIC向量的计算依赖多个映射链条，每一环都有假设和近似。Capomics指数如何在不同数据类型、不同疾病场景、不同人群中稳定计算，还需要系统验证。因果支架的初始声明如果错了，框架如何自我证伪，也需要更明确的操作化标准。实证研究才刚刚开始。

但这不影响一个基本判断：

> 如果生物医学世界模型的终点是让人敢用、能用、用错了能改，那么"可驾驭性"就不是锦上添花，而是必要条件。

预测是手段。靠谱的状态切换才是目的。

世界模型的终极使命，不是成为一台更精准的预言机器，而是成为一匹识途的马：它自己站得稳、走得远，而医生只需给出正确的方向。

这就是我理解的 Steering, not predicting。

欢迎讨论和批评。预印本阶段的每一个真诚质疑，都是最好的同行评议。

- 📄 论文全文：https://doi.org/10.20944/preprints202605.0366.v1

- 🌐 SEWO项目主页：http://steerable.world

xiongjianghui.com

← 返回博客