博客

什么是世界模型？为什么它不只是一个预测模型

预测模型回答会怎样，世界模型回答如果这样做会怎样。医学AI不能只会预测，还要学会推演行动后果。世界模型的核心结构是五个要素：State（当前状态）、Action（可选动作）、Transition（状态转移）、Objective（目标方向）、Feedback（反馈校准）。未来医学AI的核心竞争，不只是模型更大、数据更多、预测更准，而是谁能把生命系统表示为可解释、可推演、可反馈、可校准的世界模型。

熊江辉 · 2026-05-10

过去几年，医学AI最常见的叙事是：模型能不能更早发现疾病，能不能更准确预测风险，能不能从影像、基因、体检、可穿戴设备中找出人类不容易看见的信号。

这些当然重要。

但如果医学AI只停留在"预测"层面，它仍然没有真正进入医学决策的核心。

因为医学真正关心的，往往不只是：

> 未来会发生什么？

> 如果我现在采取某个行动，未来会如何改变？

这就是"世界模型"与普通预测模型最根本的区别。

一、预测模型回答"会怎样"，世界模型回答"如果这样做，会怎样"

一个预测模型通常在回答：

- 这个人未来10年心血管风险是多少？

- 这个影像里有没有可疑病灶？

- 这个指标组合是否提示某种疾病风险？

- 这个人是否可能发展为糖尿病、认知下降或代谢综合征？

这些问题的共同点是：模型试图从已有数据中判断未来或当前状态。

它像天气预报。

天气预报告诉你：明天可能下雨。

但天气预报通常不会回答：如果我改变路线、调整出发时间、带伞、开车或坐地铁，最终体验会如何不同。

世界模型关心的，正是后面这个问题。

它不仅要知道"世界现在是什么状态"，还要模拟"如果采取某个动作，世界可能如何变化"。

所以，世界模型不是更大的预测模型，也不是把更多数据喂给AI后得到的更强分类器。

它的核心结构是：

- State：系统现在处于什么状态

- Action：可以采取什么动作

- Transition：动作之后状态可能如何变化

- Objective：希望系统朝什么方向变化

- Feedback：真实反馈如何修正下一步判断

如果只预测未来，那是prediction。

如果能在状态、动作和反馈之间推演变化，才开始接近world model。

二、为什么"世界模型"这个概念在医学里特别重要

医学不是静态识别问题。

医学的核心是行动问题。

医生不是只想知道一个人"有没有风险"，还要判断：

- 要不要干预？

- 用什么方式干预？

- 先干预哪个环节？

- 干预后用什么指标判断是否有效？

- 如果没有达到预期，是机制判断错了，动作强度不够，还是反馈周期太短？

健康管理也不是单点判断问题。

尤其在长寿医学、功能医学、慢病管理、代谢健康、衰老干预这些场景里，人不是在一次检查后就完成决策，而是在长期轨迹中不断变化。

今天的状态，会受到过去睡眠、饮食、运动、压力、药物、补剂、炎症、代谢、遗传背景和环境暴露的共同影响。

一次干预，也很少只有单一结果。它可能改善某个指标，同时影响另一个系统；可能短期有效，长期需要校准；可能对一个人有效，对另一个人无效。

因此，医学AI如果只会说"风险升高"或"风险降低"，是不够的。

它需要进一步回答：

> 在这个个体当前状态下，某个干预动作可能通过什么机制，引起哪些状态变化？这些变化如何被观察、验证和更新？

这就是医学世界模型的入口。

三、用"骑手与马"理解世界模型

我更愿意用一个直观比喻来解释这个问题：生命系统像一匹马。

系统生物学帮助我们理解马的骨骼、肌肉、神经和代谢如何运行。

预测模型告诉我们：这匹马可能往哪里跑，什么时候可能疲劳，什么时候可能偏离方向。

但医学世界模型要进一步模拟：如果骑手拉动缰绳、调整速度、改变路线，马可能如何反应。

这里最关键的是：马不是汽车。

汽车的响应相对机械，而马有自己的状态、节律、疲劳、情绪、适应和反应。人体也一样。生命系统不是完全可控的机器，而是一个会适应、会补偿、会波动、会反馈的复杂系统。

所以，所谓"可驾驭"不是控制生命。

更准确地说，是在尊重生命系统自身规律的前提下，明确方向、选择动作、观察反馈，并在偏离时及时校准。

这也是SteeraMed要解决的核心问题：让医学世界模型不只停留在预测，而是能够围绕状态、动作、证据和反馈，形成可推演、可校准、可复核的框架。

四、世界模型不是为了替医生做决定

这里必须特别强调一个边界。

医学世界模型不是自动开方案的机器，也不是替代医生的系统，更不是承诺可以预测个体疗效或控制人体。

它更合理的定位是：

> 一个用于表示状态、编码动作、推演状态转移、记录证据链、接收反馈并持续校准的辅助决策框架。

换句话说，它不应该直接告诉人"你应该做这个治疗"。

它更应该帮助人看清楚：

- 当前状态是如何被定义的？

- 可选动作是什么？

- 每个动作背后的机制假设是什么？

- 可能观察到哪些变化？

- 哪些证据支持这个推演？

- 哪些反馈可以证明方向对了或错了？

这比单纯给出一个答案更重要。

因为医学决策真正需要的不是一个神秘答案，而是一条可解释、可追踪、可复核的推理路径。

五、为什么这会成为下一代医学AI的关键问题

过去的医学AI很大程度上是在做"看见"：

看见影像中的异常，看见指标之间的关联，看见风险分层，看见人类专家不容易发现的模式。

下一步，医学AI必须进入"推演"：

如果采取某个动作，系统会如何变化？

再下一步，才是"驾驭"：

如何在证据约束和反馈闭环中，让生命系统更有方向地走向健康目标？

这也是从预测医学走向可驾驭医学世界模型的路径：

> 预测模型 → 医学世界模型 → 可驾驭医学世界模型

对于长寿医学来说，这个问题尤其关键。

长寿医学面对的不是一次性疾病诊断，而是长期生命轨迹管理；不是单一药物疗效判断，而是多因素、多周期、多反馈的系统调整；不是"有没有病"的二元问题，而是功能、韧性、风险、衰老速度和内在能力的长期变化。

所以，长寿医学最终需要的，可能不是一个更会聊天的AI，也不是一个更大的风险预测器，而是一种能表示个体状态、模拟干预后果、追踪长期反馈、持续校准策略的医学世界模型。

结语：医学AI不能只会预测，还要学会推演行动后果

如果用一句话总结这篇文章：

> 预测模型回答"未来可能发生什么"；世界模型回答"如果我采取某个行动，未来可能如何改变"。

这一区别看似简单，却决定了医学AI的下一步方向。

医学不是旁观复杂系统，而是在不确定性中采取行动。

而任何行动，都需要状态、动作、机制、证据和反馈。

这就是为什么我认为，未来医学AI的核心竞争，不只是模型更大、数据更多、预测更准，而是谁能把生命系统表示为可解释、可推演、可反馈、可校准的世界模型。

也正是在这个意义上，SteeraMed所代表的可驾驭生物医学世界模型，值得被系统讨论。

1. Ha D, Schmidhuber J. Recurrent World Models Facilitate Policy Evolution. Advances in Neural Information Processing Systems 31. 2018. arXiv:1803.10122.

2. LeCun Y. A Path Towards Autonomous Machine Intelligence. OpenReview, 2022.

3. Yang Y, Wang ZY, Liu Q, et al. Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning. arXiv:2506.02327, 2025.

4. Qazi MA, Nadeem M, Yaqub M. Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning. arXiv:2511.16333, 2025.

5. Katsoulakis E, Wang Q, Wu H, et al. Digital twins for health: a scoping review. npj Digital Medicine. 2024;7:77.

6. Emmert-Streib F, Parkkila S, Laubenbacher R, et al. The role of digital twins in P4 medicine: A paradigm for modern healthcare. npj Digital Medicine. 2025;8:735.

7. Xiong J. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. doi:10.20944/preprints202605.0366.v1.

8. SteeraMed: https://steeramed.com

9. Steerable World Model: https://steerable.world

xiongjianghui.com

← 返回博客