博客

驾驭,而非预测:可驾驭医学世界模型

如果一个人站在你面前,一个世界模型也站在你面前,你敢不敢把自己的健康交给它?SEWO(Steerable Medicine World Model)提出:世界模型的终极使命不是成为更精准的预言机器,而是成为一匹识途的马——医生给方向,它自己在不确定地形中走稳。预测是手段,靠谱的状态切换才是目的。

熊江辉 · 2026-05-07
2

2026年,"世界模型"突然成了AI领域最热的词之一。

从通用人工智能到物理世界模拟,从自动驾驶到机器人,从虚拟细胞到药物发现,越来越多团队开始把自己的下一代模型称为"world model"。在生物医学领域,Bioptimus、Recursion、GenBio AI 等公司也相继发布宏大蓝图:用更大的模型、更丰富的数据、更复杂的表征,去模拟细胞、疾病、药物和人体系统。

我在这个节点提出了一个不太合时宜的问题:

> 如果一个人站在你面前,一个世界模型也站在你面前,你敢不敢把自己的健康交给它?如果不是今天,那还差什么条件?

这个问题不性感。它不涉及参数量、训练语料、GPU集群,也不涉及模型能生成多漂亮的图像或多复杂的分子。

但它直指当前生物医学AI叙事中一个常被忽略的盲区:我们一直在问模型能不能预测,却很少问模型能不能被人驾驭。

3

一、我们把"预测"当成了目的

当下生物医学AI有一个几乎不言自明的共识:

> 预测得越准,模型就越好。

这个共识太自然了,以至于很少有人去质疑它。图像识别要准,语音识别要准,机器翻译要准。到了生物医学,疾病风险预测当然也要准,药物反应预测当然也要准,生存期预测当然也要准。

但这里有一个隐蔽的偷换。

预测从来都只是手段,不是目的。

天气预报的目的,不是让你欣赏一朵云有多大概率下雨,而是帮助你决定明天要不要带伞、航班要不要延误、农田要不要灌溉。同理,疾病风险预测的目的,也不是给你一个小数点后三位的概率数字,而是帮助医生和个体做出一个更可靠的干预决策。

换句话说,临床决策真正追求的,不是"预测得更漂亮",而是:

> 能不能把一个生命系统,从当前状态,安全、高效、可解释、可追踪地推向一个更好的状态。

我把这称为靠谱的状态切换。

什么是状态切换?

它不是简单说"三年内心梗风险47%",而是追问:

- 我现在到底处于什么生物学状态?

- 这个状态离健康态差在哪里?

- 我应该往哪个方向干预?

- 这一步干预下去,哪些模块应该先变化?

- 如果没有变化,是状态识别错了,干预错了,还是响应机制错了?

- 下一轮应该如何修正?

现有的预测范式很难回答这些问题。不是因为它不够准,而是因为在它的框架里,这些问题根本没有被正式提出。

4

二、骑手与马:世界模型的本质是被人驾驭

来看一个古老的比喻。

一匹马走在山路上。骑手不需要控制马的每一块肌肉,也不需要实时计算每一次落蹄的角度。骑手只需要通过缰绳给出方向信号。马匹则依赖自身的平衡感、感知能力和稳健性,自己调整步伐,自己适应地形,自己避免摔倒。

> 骑手负责方向,马负责稳健。

把这个比喻放到生物医学AI里:

- 骑手是医生或研究者。 他们根据临床判断和机制理解,给出分阶段的指向性信号:添加一个治疗假设,修改一个营养条件,删除一个混杂因素,或者改变一个干预路径。

- 马是世界模型。 它必须在噪声、缺失数据、分布偏移和个体差异中保持推演的确定性,不崩溃、不乱跑、不把所有责任推给黑箱。

- 缰绳是框架定义的交互接口。 人的意图通过它被翻译成模型能解析的输入,模型的反馈通过它被翻译成医生能审视、能质疑、能修正的输出。

这个框架,我们给它起了一个代号:

> SEWO — Steerable Medicine World Model,可驾驭医学世界模型。

它的核心理念可以浓缩成一句话:

> Steering, not predicting.

> 驾驭,而非预测。

这不是说预测不重要。恰恰相反,没有足够的预测能力,模型连基本推演都无法完成。

但预测能力只是马的肌肉。真正决定它能不能被用于医学决策的,是这匹马能不能听懂方向,能不能在不确定地形中走稳,能不能在走偏时让骑手看见偏差发生在哪里。

5

三、这个哲学来自医学本身

"驾驭"并不是AI领域凭空发明出来的概念。它本来就存在于医学深处。

很多真正有效的医学干预,并不是对身体进行外部强制控制,而是给生物系统一个方向性信号,让系统自身的调节机制重新启动。

天然黄酮类化合物不一定是直接"杀死"癌细胞。它可能是靶向某个蛋白互作网络,扰动某个信号子系统,让细胞自己的调控机制发生改变。药物营养素、运动干预、睡眠重建、代谢调节,也常常遵循类似逻辑:不是代替身体完成修复,而是释放身体自身的修复与重塑能力。

好的医生也是如此。

医生不是把人体当作一台机器逐个零件重装,而是在复杂、不确定、动态变化的生命系统中,判断方向、设置边界、观察反馈、不断修正。

SEWO试图把这种医学智慧带进AI决策:

> 世界模型不应该成为一个高高在上的数字神谕。

> 它应该是一匹识途的马:医生给方向,它自己在不确定地形中走稳。

6

四、五个结构约束:让"驾驭"成为可能

如果"驾驭"是目标,那世界模型就不能只是一个预测引擎。它必须满足一系列结构性要求。

我从一个基本公设出发:

> 生命不是变量的堆积,而是适应能力的集合体。

一个人的健康状态,不只是某几个指标是否超标,而是多个功能模块还能不能适应压力、修复损伤、维持稳态、完成重塑。基于这个公设,SEWO提出了五个结构约束,构成一个闭环。

CP1:状态表征——mIC向量

首先,模型必须能说清楚:这个人现在处于什么状态。

这不是指某个基因表达量、某个蛋白浓度,或者某个单一年龄数字,而是指各个功能模块还剩多少可调动的内在能力。

在这个框架中,我们用 mIC向量 表示模块化内在能力。它试图把生命状态从单点指标,转化为一个多维能力结构。

> 衰老不是一个数字,而是一个向量。

CP2:内在能力量化——Capomics

其次,这种能力必须是可度量的。

不能只说"免疫能力还行""代谢状态不好""炎症有点高"。这些描述有临床直觉,但很难进入一个可推演、可比较、可审计的世界模型。

SEWO需要的是能力维度上的量化表达。例如,在某个适应维度上,系统的能力指数是多少?它距离功能性崩塌还有多远?某个干预是否真正改变了能力结构,而不只是改变了表层指标?

这正是 Capomics 试图承担的角色:把生命系统的功能能力转化为可计算、可比较、可追踪的结构化表征。

CP3:干预—响应语义

第三,模型必须能描述一个干预如何被生物系统"感知",并产生响应。

同一个干预,在不同起始状态下可能产生完全不同的结果。一个营养素、一个药物、一次运动、一次睡眠修复,对不同的人可能是补偿、刺激、负担,甚至是扰动。

这正是"平均有效"不等于"对这个人有效"的结构性原因。

因此,世界模型不能只把干预看作一个外部输入变量。它必须理解:

- 干预进入了哪个生物通道?

- 它作用在哪个功能模块?

- 当前状态是否具备响应条件?

- 响应是恢复性的、代偿性的,还是失衡性的?

没有干预—响应语义,就没有真正的个体化决策。

CP4:反事实转移

第四,模型必须能回答:

> 如果没有这个干预,会怎样?如果换一个方向,会怎样?

没有反事实,就没有因果。没有因果,就只能停留在相关性外推。

在SEWO中,反事实推理不是简单生成几个可能未来,而是沿着结构化因果支架进行推演:在当前状态下,如果加入某个干预信号,mIC向量如何变化?如果删除某个混杂因素,状态转移路径是否改变?如果把干预顺序调换,最终表型是否不同?

医学决策真正需要的,往往不是一个未来,而是多个可比较的未来。

CP5:质量控制反馈——五门检查

第五,也是最关键的一点:当预期变化没有出现,模型能不能帮助我们诊断失败发生在哪个环节?

是状态测错了?

是干预方案不对?

是响应偏离预期?

是mIC转移方向反了?

还是表型读出滞后或误判?

我们把这个过程称为 五门检查:

> 状态 → 干预 → 响应 → ΔmIC → 表型

每一步都应该可以被独立审计、独立质疑、独立证伪。

这也是SEWO与黑箱预测模型最重要的区别之一。黑箱模型出错时,通常只告诉你"预测错了"。SEWO希望进一步追问:到底是哪一个门错了?

7

五、为什么是五个,而不是四个或六个?

这五个结构约束不是随意枚举。

如果只有四个,系统很容易留下开环。比如有状态表征、有干预语义、有反事实模拟,但没有质量控制反馈,那么一旦预测失败,就无法形成可操作的修正机制。

如果拆成六个、七个、八个,又容易失去功能内聚性,把原本同一层级的问题拆得过碎,最终变成一个复杂但不稳定的流程图。

五个约束刚好构成一个完整闭环:

> 定义状态 → 测量状态 → 设计干预 → 模拟转移 → 检查偏差 → 修正下一轮。

这不是为了追求形式上的整齐,而是为了让世界模型具备医学决策所需要的最小结构完整性。

现在很多生物医学AI,本质上是在用越来越大的锤子砸越来越大的钉子。锤子越来越精良,但很少有人停下来问:

> 我们在砸的到底是不是钉子?

SEWO问的正是这个问题。

8

六、这条路还很长,但方向是对的

必须诚实地说,SEWO目前仍处于理论建构和早期验证阶段。

mIC向量的计算依赖多个映射链条,每一环都有假设和近似。Capomics指数如何在不同数据类型、不同疾病场景、不同人群中稳定计算,还需要系统验证。因果支架的初始声明如果错了,框架如何自我证伪,也需要更明确的操作化标准。实证研究才刚刚开始。

但这不影响一个基本判断:

> 如果生物医学世界模型的终点是让人敢用、能用、用错了能改,那么"可驾驭性"就不是锦上添花,而是必要条件。

预测是手段。靠谱的状态切换才是目的。

世界模型的终极使命,不是成为一台更精准的预言机器,而是成为一匹识途的马:它自己站得稳、走得远,而医生只需给出正确的方向。

这就是我理解的 Steering, not predicting。

欢迎讨论和批评。预印本阶段的每一个真诚质疑,都是最好的同行评议。

- 📄 论文全文:https://doi.org/10.20944/preprints202605.0366.v1

- 🌐 SEWO项目主页:http://steerable.world

返回博客