博客

什么是世界模型?为什么它不只是一个预测模型

预测模型回答会怎样,世界模型回答如果这样做会怎样。医学AI不能只会预测,还要学会推演行动后果。世界模型的核心结构是五个要素:State(当前状态)、Action(可选动作)、Transition(状态转移)、Objective(目标方向)、Feedback(反馈校准)。未来医学AI的核心竞争,不只是模型更大、数据更多、预测更准,而是谁能把生命系统表示为可解释、可推演、可反馈、可校准的世界模型。

熊江辉 · 2026-05-10
2

过去几年,医学AI最常见的叙事是:模型能不能更早发现疾病,能不能更准确预测风险,能不能从影像、基因、体检、可穿戴设备中找出人类不容易看见的信号。

这些当然重要。

但如果医学AI只停留在"预测"层面,它仍然没有真正进入医学决策的核心。

因为医学真正关心的,往往不只是:

> 未来会发生什么?

> 如果我现在采取某个行动,未来会如何改变?

这就是"世界模型"与普通预测模型最根本的区别。

3

一、预测模型回答"会怎样",世界模型回答"如果这样做,会怎样"

一个预测模型通常在回答:

- 这个人未来10年心血管风险是多少?

- 这个影像里有没有可疑病灶?

- 这个指标组合是否提示某种疾病风险?

- 这个人是否可能发展为糖尿病、认知下降或代谢综合征?

这些问题的共同点是:模型试图从已有数据中判断未来或当前状态。

它像天气预报。

天气预报告诉你:明天可能下雨。

但天气预报通常不会回答:如果我改变路线、调整出发时间、带伞、开车或坐地铁,最终体验会如何不同。

世界模型关心的,正是后面这个问题。

它不仅要知道"世界现在是什么状态",还要模拟"如果采取某个动作,世界可能如何变化"。

所以,世界模型不是更大的预测模型,也不是把更多数据喂给AI后得到的更强分类器。

它的核心结构是:

- State:系统现在处于什么状态

- Action:可以采取什么动作

- Transition:动作之后状态可能如何变化

- Objective:希望系统朝什么方向变化

- Feedback:真实反馈如何修正下一步判断

如果只预测未来,那是prediction。

如果能在状态、动作和反馈之间推演变化,才开始接近world model。

4

二、为什么"世界模型"这个概念在医学里特别重要

医学不是静态识别问题。

医学的核心是行动问题。

医生不是只想知道一个人"有没有风险",还要判断:

- 要不要干预?

- 用什么方式干预?

- 先干预哪个环节?

- 干预后用什么指标判断是否有效?

- 如果没有达到预期,是机制判断错了,动作强度不够,还是反馈周期太短?

健康管理也不是单点判断问题。

尤其在长寿医学、功能医学、慢病管理、代谢健康、衰老干预这些场景里,人不是在一次检查后就完成决策,而是在长期轨迹中不断变化。

今天的状态,会受到过去睡眠、饮食、运动、压力、药物、补剂、炎症、代谢、遗传背景和环境暴露的共同影响。

一次干预,也很少只有单一结果。它可能改善某个指标,同时影响另一个系统;可能短期有效,长期需要校准;可能对一个人有效,对另一个人无效。

因此,医学AI如果只会说"风险升高"或"风险降低",是不够的。

它需要进一步回答:

> 在这个个体当前状态下,某个干预动作可能通过什么机制,引起哪些状态变化?这些变化如何被观察、验证和更新?

这就是医学世界模型的入口。

5

三、用"骑手与马"理解世界模型

我更愿意用一个直观比喻来解释这个问题:生命系统像一匹马。

系统生物学帮助我们理解马的骨骼、肌肉、神经和代谢如何运行。

预测模型告诉我们:这匹马可能往哪里跑,什么时候可能疲劳,什么时候可能偏离方向。

但医学世界模型要进一步模拟:如果骑手拉动缰绳、调整速度、改变路线,马可能如何反应。

这里最关键的是:马不是汽车。

汽车的响应相对机械,而马有自己的状态、节律、疲劳、情绪、适应和反应。人体也一样。生命系统不是完全可控的机器,而是一个会适应、会补偿、会波动、会反馈的复杂系统。

所以,所谓"可驾驭"不是控制生命。

更准确地说,是在尊重生命系统自身规律的前提下,明确方向、选择动作、观察反馈,并在偏离时及时校准。

这也是SteeraMed要解决的核心问题:让医学世界模型不只停留在预测,而是能够围绕状态、动作、证据和反馈,形成可推演、可校准、可复核的框架。

6

四、世界模型不是为了替医生做决定

这里必须特别强调一个边界。

医学世界模型不是自动开方案的机器,也不是替代医生的系统,更不是承诺可以预测个体疗效或控制人体。

它更合理的定位是:

> 一个用于表示状态、编码动作、推演状态转移、记录证据链、接收反馈并持续校准的辅助决策框架。

换句话说,它不应该直接告诉人"你应该做这个治疗"。

它更应该帮助人看清楚:

- 当前状态是如何被定义的?

- 可选动作是什么?

- 每个动作背后的机制假设是什么?

- 可能观察到哪些变化?

- 哪些证据支持这个推演?

- 哪些反馈可以证明方向对了或错了?

这比单纯给出一个答案更重要。

因为医学决策真正需要的不是一个神秘答案,而是一条可解释、可追踪、可复核的推理路径。

7

五、为什么这会成为下一代医学AI的关键问题

过去的医学AI很大程度上是在做"看见":

看见影像中的异常,看见指标之间的关联,看见风险分层,看见人类专家不容易发现的模式。

下一步,医学AI必须进入"推演":

如果采取某个动作,系统会如何变化?

再下一步,才是"驾驭":

如何在证据约束和反馈闭环中,让生命系统更有方向地走向健康目标?

这也是从预测医学走向可驾驭医学世界模型的路径:

> 预测模型 → 医学世界模型 → 可驾驭医学世界模型

对于长寿医学来说,这个问题尤其关键。

长寿医学面对的不是一次性疾病诊断,而是长期生命轨迹管理;不是单一药物疗效判断,而是多因素、多周期、多反馈的系统调整;不是"有没有病"的二元问题,而是功能、韧性、风险、衰老速度和内在能力的长期变化。

所以,长寿医学最终需要的,可能不是一个更会聊天的AI,也不是一个更大的风险预测器,而是一种能表示个体状态、模拟干预后果、追踪长期反馈、持续校准策略的医学世界模型。

8

结语:医学AI不能只会预测,还要学会推演行动后果

如果用一句话总结这篇文章:

> 预测模型回答"未来可能发生什么";世界模型回答"如果我采取某个行动,未来可能如何改变"。

这一区别看似简单,却决定了医学AI的下一步方向。

医学不是旁观复杂系统,而是在不确定性中采取行动。

而任何行动,都需要状态、动作、机制、证据和反馈。

这就是为什么我认为,未来医学AI的核心竞争,不只是模型更大、数据更多、预测更准,而是谁能把生命系统表示为可解释、可推演、可反馈、可校准的世界模型。

也正是在这个意义上,SteeraMed所代表的可驾驭生物医学世界模型,值得被系统讨论。

1. Ha D, Schmidhuber J. Recurrent World Models Facilitate Policy Evolution. Advances in Neural Information Processing Systems 31. 2018. arXiv:1803.10122.

2. LeCun Y. A Path Towards Autonomous Machine Intelligence. OpenReview, 2022.

3. Yang Y, Wang ZY, Liu Q, et al. Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning. arXiv:2506.02327, 2025.

4. Qazi MA, Nadeem M, Yaqub M. Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning. arXiv:2511.16333, 2025.

5. Katsoulakis E, Wang Q, Wu H, et al. Digital twins for health: a scoping review. npj Digital Medicine. 2024;7:77.

6. Emmert-Streib F, Parkkila S, Laubenbacher R, et al. The role of digital twins in P4 medicine: A paradigm for modern healthcare. npj Digital Medicine. 2025;8:735.

7. Xiong J. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. doi:10.20944/preprints202605.0366.v1.

8. SteeraMed: https://steeramed.com

9. Steerable World Model: https://steerable.world

返回博客