博客

从医疗AI到AI制药，再到医学世界模型：下一代生物医药AI平台的形成

过去十年，人工智能进入医学，经历了一个清晰的迁移路径：医疗AI解决看懂医学的问题，AI制药解决发现干预工具的问题，医学世界模型解决验证干预后果的问题。前两者主要改变效率，后者才可能改变医学范式。医疗AI是过去式，AI制药是现在时，医学世界模型才是未来。

熊江辉 · 2026-05-10

过去十年，人工智能进入医学，经历了一个清晰的迁移路径。

第一阶段是医疗AI。它的代表是读片、病历结构化、风险预测、医学问答、分诊和临床文书。它解决的核心问题是：如何更快、更稳定地看懂已经发生的医学事实。

第二阶段是AI制药。它的代表是靶点发现、分子生成、蛋白结构预测、药物筛选、毒性预测和临床前优化。它解决的核心问题是：如何更快找到可能有效的干预工具。

但医学真正的终极问题，还不止于"看懂疾病"，也不止于"找到候选药物"。医学最难的问题是：

> 一个干预进入真实人体之后，能否安全、可解释、可验证地改变疾病或健康轨迹？

这正是医学世界模型可能成为未来方向的原因。它不是普通预测模型的加大版，也不是会写医学文本的聊天机器人，而是一种新的医学计算方式：把人体看作一个不断变化的系统，把药物、营养、运动、手术和行为改变都看作干预，把随访数据看作反馈，并在安全边界内推演不同选择可能带来的后果。

美国药监局2026年围绕个体化疗法提出的"可信机制框架"，也从监管科学层面提出了类似问题：当传统大规模临床试验难以开展时，医学如何围绕致病机制、治疗靶点、自然病程、指标变化和临床结局建立一条可信证据链？这并不意味着降低证据标准，也不是绕过临床验证，而是提示我们：未来医学越来越需要一种能够连接机制、数据、干预和验证的新基础设施。

本文的核心观点是：

> 医疗AI解决"看懂医学"的问题，AI制药解决"发现工具"的问题，医学世界模型解决"验证干预后果"的问题。前两者主要改变效率，后者才可能改变医学范式。

但必须强调：医学世界模型仍处于早期阶段。它的输出只能被视为可检验假设、研究辅助或决策支持，不能被当作临床事实、疗效证明或监管认可。

一、为什么说医疗AI是"过去式"？

这里的"过去式"，不是说医疗AI失去价值，而是说它已经完成了从新概念到基础设施的第一轮迁移。

过去十多年，医疗AI最成熟的应用大多集中在识别、提取和辅助流程上：

- 识别影像中的异常；

- 从病历中提取结构化信息；

- 预测某类患者未来发生并发症的风险；

- 辅助医生完成文书；

- 做医学搜索、问答、分诊和质控。

这些能力很重要，也会持续创造价值。但从投资叙事看，它们越来越像医疗系统中的"工具层"和"效率层"。

它们解决的是：

> 医学数据里已经发生了什么？

换句话说，第一代医疗AI主要训练机器成为更快、更便宜、更稳定的医学识别系统。它可以帮助医生看得更快、写得更快、查得更快、分得更准。

但它还没有真正进入医学最深的核心问题。

医学真正困难的地方，往往不是识别已经发生了什么，而是判断干预之后会发生什么。

一个患者未来是否会恶化，是预测问题；但如果换一种药、提前干预、调整剂量、改变生活方式，身体轨迹会不会不同，就是干预问题。前者可以依靠历史相似性做出估计，后者却必须同时面对疾病机制、人体状态、治疗动作、时间变化和真实反馈。

这就是医疗AI的边界：它让人工智能成为医学的眼睛和助手，但还没有让人工智能成为验证干预后果的系统。

二、为什么说AI制药是"现在时"？

如果说医疗AI的第一阶段是"看懂医学"，那么AI制药的第二阶段就是"发现干预工具"。

这也是当下资本、药企和人工智能公司最集中的方向之一。原因并不难理解：新药研发周期长、成本高、失败率高，而人工智能看起来能够直接切入研发链条中最昂贵、最不确定的环节。

AI制药正在尝试解决的问题包括：

- 找到新的疾病靶点；

- 生成新的候选分子；

- 预测分子与蛋白或通路的相互作用；

- 优化成药性；

- 预测毒性和副作用；

- 提高临床前筛选效率；

- 帮助设计更合理的实验路线。

这些任务都极其重要，也并不简单。它们可能显著改变药物研发的成本结构和速度。

但从医学世界模型的视角看，AI制药仍然主要解决一个上游问题：

> 能不能更快找到一把可能有用的"钥匙"？

问题在于，医学真正关心的并不是钥匙本身，而是：

> 这把钥匙插进真实生命系统之后，门会不会打开？打开哪一扇门？会不会牵动别的门？长期结果是否真的对患者有益？

这正是药物研发失败率长期居高不下的根本原因之一：一个靶点看起来合理，并不代表真实患者一定获益；一个指标变好，也不代表长期结局一定改善；一个分子在模型中有效，也不代表进入人体后仍然有效。

所以，AI制药是现在时，因为它正在重塑药物发现和临床前研发。但它还不是终局，因为它更多回答"如何找到干预工具"，而不是完整回答"干预工具如何改变人体轨迹"。

三、为什么世界模型才是未来？

医学世界模型要进入的，正是医疗AI和AI制药共同留下的空白地带。

它要回答的不是单一问题，而是一组更接近医学本质的问题：

- 如果现在用这种药，患者三个月后会怎样？

- 如果不治疗，疾病自然会怎样发展？

- 如果剂量减半，疗效和风险会如何变化？

- 如果同时改变药物、饮食、运动和睡眠，结果会更好、更差，还是无法判断？

- 如果某个指标变好了，是否真的意味着患者获益？

- 如果模型判断错了，错误来自机制假设、状态测量、剂量选择、患者分型，还是人体系统反馈？

这些问题不是简单的"预测未来"。它们涉及一个更深的判断：

> 干预是否真的改变了身体运行的轨迹。

普通预测模型可以告诉我们"相似的人过去通常怎样"，但很难可靠回答"如果对这个人采取另一种做法，会不会改变结局"。

医学世界模型的目标，正是把状态、干预、时间、机制、反事实和反馈放进同一个闭环中。这里涉及的不只是预测能力，也涉及因果推断和反事实比较，因此不能仅靠相关性模型来完成。

它不是为了再做一个更大的风险评分，也不是为了生成一段看似合理的病历文本，而是为了在医学机制约束下，对干预后的身体变化进行可验证推演。

四、三代生物医药AI：从效率工具到医学操作系统

从投资叙事看，生物医药人工智能可以被理解为三代机会。

|------|---------|---------|---------|

如果用一句话概括：

> 医疗AI是效率工具，AI制药是研发引擎，医学世界模型才可能成为下一代生物医药AI的操作系统。

这里的"操作系统"不是营销比喻，而是指它可能连接多个原本割裂的环节：检测数据、患者状态、干预方案、随访反馈、机制证据、真实世界数据和监管审计。

医疗AI更多像感知层。AI制药更多像工具生产层。医学世界模型则试图成为干预决策和证据生成的中间层。

这就是为什么它可能具有平台属性。

五、什么是医学世界模型？

可以用一个简单比喻理解。

普通医学模型像一张风险地图。它告诉你：某个地方可能更危险，某个人可能风险更高。

医学世界模型更像一个医学模拟器。它不仅看地图，还试图理解：如果我们改变路线、速度、天气条件和车辆状态，接下来可能发生什么。

放到医学中，医学世界模型就是一种试图模拟人体状态变化的计算系统。它关心五件事：

1. 这个人现在处在什么状态 — 不是只有一个诊断名称，而是包括基因、分子、免疫、代谢、器官功能、生活方式、症状和检查结果在内的整体状态。

2. 准备施加什么干预 — 干预可以是药物、剂量、手术、营养、运动、睡眠、行为改变，也可以是多种措施的组合。

3. 干预后身体可能如何变化 — 哪些指标会先变，哪些功能会后变，哪些变化只是短期波动，哪些可能代表真实获益。

4. 如果不这样做，另一条路径会怎样 — 例如不治疗、晚治疗、换一种方案，结果是否可能不同。

5. 真实随访能否验证模型判断 — 模型说会改善，后续指标和症状是否真的改善？如果没有改善，原因是什么？

所以，医学世界模型不是"更大的聊天机器人"，也不是"更复杂的风险评分"。它的核心是：

> 在医学机制约束下，对干预后的身体变化进行可验证推演。

六、为什么美国药监局的个体化疗法框架很重要？

美国药监局提出的可信机制框架，原本面向的是极罕见遗传病和高度个体化疗法。

这类治疗有一个现实困难：患者太少，往往无法像常规药物那样开展大规模随机对照试验。但这并不意味着可以只靠"理论上合理"就判断治疗有效。监管仍然需要一条可信证据链。

这条证据链大致包括：

- 疾病是否有明确原因？

- 治疗是否针对这个原因或相近机制？

- 如果不治疗，疾病通常会怎样发展？

- 治疗是否真的改变了预期机制？

- 指标或症状变化是否与机制一致？

- 这种变化是否足够可信，是否值得继续观察或评估？

这对医学世界模型有重要启发。

因为医学世界模型要做的，也不是凭空生成一个未来，而是把问题组织成一条证据链：

> 为什么这样干预？预计改变什么？拿什么验证？失败后如何修正？

这也是它与普通生成模型的本质区别。

换句话说，监管科学正在提醒我们：未来医学不能只依赖"机制上听起来合理"，也不能只依赖"模型上看起来有效"。真正重要的是，把机制、自然病程、干预响应、随访指标和临床结局连接成可审计的证据链。

七、为什么这对长寿医学尤其重要？

慢病和衰老都不是一天发生的。血糖、炎症、代谢、肌肉、睡眠、认知、免疫功能，往往是在多年中逐渐偏离。

因此，慢病管理和长寿医学最需要的不是一次性判断，而是长期轨迹管理。

例如，一个生物年龄指标下降，听起来很好，但它并不自动等于身体功能改善，更不等于寿命延长。真正重要的是：

- 多个层面的指标是否朝同一方向变化？

- 功能是否改善？

- 风险是否降低？

- 这种变化能否持续？

- 是否存在过度干预？

医学世界模型的价值，是把这些分散指标放进同一条时间轨迹中理解。

这也是长寿医学区别于普通健康管理的地方。它不能只追逐单个指标的好看变化，而必须回答：一个干预是否真的让人的健康轨迹变得更稳、更强、更可持续。

所以，长寿医学可能是医学世界模型最早出现"弱世界模型"的场景之一。它不需要一开始就模拟整个人体，而可以先在明确边界内，把甲基化、蛋白、代谢、功能表现、生活方式和随访反馈放到同一条轨迹中观察。

八、几个近期代表性进展：医学世界模型正在成形

如果说几年前"医学世界模型"还主要是一个理论想象，那么最近一批研究和框架的出现，说明这个方向已经开始从概念走向早期原型。

但必须先说清楚：这些系统大多仍处在研究、预印本、会议论文或概念框架阶段。它们不能被理解为已经成熟的临床产品，更不能被理解为可以直接替代医生。更准确地说，它们共同指向了一个趋势：医学人工智能正在从"识别和预测"，走向"模拟和验证干预"。

8.1 肿瘤治疗模拟模型

一个代表性例子，是2025年发布的肿瘤治疗模拟类医学世界模型。它以肝癌介入治疗为场景，尝试根据治疗前影像和治疗方案，模拟治疗后的肿瘤状态，并结合生存风险评估来辅助比较不同方案。

这个方向的重要性在于：它不只是判断"现在的肿瘤是什么样"，而是尝试回答"如果采取某种治疗，肿瘤接下来可能如何变化"。

这类模型仍然需要更大规模、多中心、前瞻性验证，但它已经展示出医学世界模型的一个典型形态：把影像、治疗动作、疾病变化和结局评估连接起来。

8.2 病历轨迹世界模型

另一个新方向，是基于电子病历的患者轨迹模型。2026年发布的相关研究尝试从大量纵向病历中学习患者在住院过程中的状态变化，并模拟较长程临床轨迹。

这类模型的价值，不在于生成一段看似真实的病历，而在于学习疾病、检查、用药、治疗和结局之间的时间关系。它试图回答的问题是：患者状态会怎样一步步变化？哪些事件可能预示风险上升？干预之后轨迹是否可能改变？

这种模型离真正的临床干预规划还有距离，因为病历数据本身存在记录偏差、治疗选择偏差和缺失问题。但它说明，医学世界模型不只存在于影像领域，也正在进入真实医疗流程数据。

8.3 长期风险基础模型

还有一类相邻工作，是面向多种长期慢病的时间风险模型。它们从大规模基层医疗记录中学习多病共存人群的长期风险变化，用于理解不同疾病事件之间的时间关系。

严格来说，这类模型还不是完整意义上的医学世界模型，因为它们主要是在预测风险，而不是直接模拟干预后果。但它们提供了重要基础：如果没有长期疾病轨迹建模，就很难进一步发展出真正能够比较干预路径的医学世界模型。

8.4 Steerable Medical World Model（SteeroMed）

我们提出的Steerable Medical World Model（SteeroMed，可驾驭医学世界模型），则更强调另一个问题：世界模型的目标不应只是预测，而应是可驾驭。其背后的SEWO框架强调，医学世界模型必须被医生设定方向、被机制约束、被随访校准，并能够接受审计和纠偏。需要说明的是，SteeroMed在这里是作为框架性方向和研究主张来介绍，并不代表已经完成临床验证或获得监管认可。

换句话说，医学世界模型不能只是给出一个未来结果，还要能回答：

- 当前状态是如何表征的？

- 干预方向是否清楚？

- 预期变化是否符合机制？

- 如果没有达到预期，问题出在状态测量、机制假设、干预执行，还是模型外推？

- 整个推演过程能否被医生、研究者和监管者审计？

SteeroMed的核心主张是：医学世界模型必须具备方向输入、过程约束、反事实推演、质量控制和失败诊断能力。它不是宣称已经完成了一个临床决策机器，而是提出一个评价和构建可信医学世界模型的框架。

这也解释了为什么"可驾驭性"比单纯"预测准确"更重要。医学不是只关心未来会怎样，医学更关心：

> 我们能否在安全边界内改变未来，并证明这种改变是可信的。

九、投资视角下，为什么这可能是下一代平台？

判断一个方向是否可能成为平台，关键不只是看它能不能完成单点任务，而是看它能不能连接多个价值环节，并在数据、工作流、验证体系和监管信任之间形成正循环。

医疗AI连接的是医生和数据。AI制药连接的是研发团队和候选分子。医学世界模型如果成立，连接的将是更长的链条：

- 检测和多组学数据；

- 患者状态表征；

- 药物、营养、运动、睡眠、手术等干预；

- 随访指标和真实世界反馈；

- 机制假设和反事实推演；

- 临床验证和监管审计；

- 药物研发和个体化健康管理。

这意味着，医学世界模型的机会不一定表现为一个单点产品，而可能表现为一种新型基础设施。

它可能对应几个关键词：

- 工作流入口：它不只是给出答案，而是嵌入检测、干预、随访、复盘和再决策的连续流程；

- 数据飞轮：每一次真实随访和干预反馈，都可能反过来改进患者状态表征、机制假设和模型校准；

- 模型能力栈：它需要同时具备表征、预测、反事实推演、规划、校准、不确定性表达和失败诊断能力；

- 多模态基础设施：它要连接影像、病历、多组学、可穿戴设备、实验数据和真实世界数据，而不是只依赖单一数据源；

- 验证闭环：它的价值不在于生成更多结论，而在于把结论变成可追踪、可证伪、可复盘的证据链；

- 监管可信度：在医学场景中，护城河不只来自算法性能，也来自临床验证、合规体系、审计能力和安全边界；

- 平台可扩展性：一旦底层状态表征和干预验证框架成立，它可以扩展到药物研发、慢病管理、长寿医学、罕见病和个体化治疗。

当然，这种平台属性仍然是一个早期判断。它是否成立，取决于几个关键问题：

- 能否获得足够高质量、纵向、多层次的人体数据；

- 能否处理真实医疗数据中的偏差、缺失和混杂；

- 能否把机制知识、因果推断和统计学习结合起来；

- 能否清楚表达不确定性，而不是制造虚假的确定性；

- 能否接受临床、伦理和监管审计；

- 能否在真实世界反馈中持续修正。

如果这些问题逐步被解决，医学世界模型就可能从研究概念，变成下一代生物医药人工智能平台。但如果缺乏高质量数据、真实验证和监管可信度，它也可能停留在漂亮叙事，而不能成为可持续的产业机会。

十、它和系统生物学、虚拟细胞、分子模型有什么不同？

"世界模型"听起来像一个新词，但它并不是凭空出现的。它与过去几十年的系统生物学、生物建模、数字孪生、虚拟细胞，以及DeepMind代表的结构生物学人工智能，都在同一条科学脉络上：用计算方式理解生命系统。

但它们关注的层级和最终任务并不一样。

系统生物学和传统生物建模，更多是在回答：生命系统内部有哪些网络？基因、蛋白、代谢、信号通路之间如何相互作用？它们的优势是机制清晰、可解释性强，但通常依赖大量人工设定的方程、参数和先验结构，模型边界也往往局限在某个通路、细胞过程或疾病机制上。

虚拟细胞和全细胞模型，则把目标推进了一步：它们希望在细胞层面建立可运行的计算模拟，把基因表达、代谢、信号传导、细胞生长等过程整合起来。近年的人工智能虚拟细胞方向，也在试图用大规模数据和模型来模拟细胞状态变化。

DeepMind和Isomorphic Labs等团队推动的AlphaFold系列和后续分子模型，则解决了另一个关键瓶颈：它们让科学界以前所未有的速度预测蛋白结构和分子相互作用。AlphaFold 2在蛋白结构预测上取得突破，AlphaFold 3进一步扩展到蛋白、核酸、小分子等生命分子的结构和相互作用预测。它们对基础生物学和药物研发意义重大，但核心仍然偏向分子结构和分子相互作用层面，而不是患者层面的长期干预轨迹模拟。

医学世界模型与这些方向的关系，可以这样理解：

- 系统生物学更像是在画生命系统的机制网络；

- 传统生物建模更像是在某个局部机制上建立可计算方程；

- 虚拟细胞更像是在细胞层面构建一个可运行的模拟器；

- AlphaFold这类分子模型更像是在分子结构和相互作用层面提供高精度地图；

- 医学世界模型则更关心患者层面的状态、干预、时间轨迹和可验证后果。

因此，医学世界模型不是要替代系统生物学、虚拟细胞或分子人工智能，而是要把它们产生的机制知识、分子结构、细胞响应和临床数据，进一步接到一个更接近医学决策的问题上：

> 如果对这个人采取某种干预，身体轨迹会不会改变？这种改变是否符合机制？能否被随访验证？如果失败，原因在哪里？

当然，这也意味着它的要求更高。模型推演不等于事实，机制合理不等于治疗有效，指标改善不等于健康改善。医学世界模型只有在真实随访、实验验证、临床审查和监管框架中不断被校准，才可能从研究概念走向可信工具。

十一、结语：AI制药找到钥匙，世界模型验证钥匙能否打开生命系统

如果用一句话概括这篇文章的判断：

> 医疗AI是过去式，AI制药是现在时，医学世界模型才是未来。

但这句话不能被误解为否定前两者。

医疗AI让医学系统更高效。AI制药让药物发现更快。它们都重要，也都会继续发展。

真正的问题是：医学人工智能的下一次跃迁，是否会从"识别医学事实"和"发现干预工具"，走向"推演和验证干预后果"。

这正是医学世界模型的核心价值。

它让人工智能不再只是"看见疾病"，也不只是"发现药物"，而是开始帮助医学理解和检验：

> 如何安全、可解释、可验证地改变疾病和健康轨迹。

因此，AI制药更像是在寻找钥匙；医学世界模型要回答的是，这把钥匙插进真实生命系统之后，门会不会打开，打开哪一扇门，会不会牵动别的门，长期结果是否真的对患者有益。

当医学从"预测谁会生病"走向"验证如何安全地改变健康轨迹"，世界模型就不只是一个技术概念，而可能成为下一代医学的重要底层方法之一。

1. U.S. Food and Drug Administration. Considerations for the Use of the Plausible Mechanism Framework to Develop Individualized Therapies that Target Specific Genetic Conditions with Known Biological Cause. Draft Guidance, February 2026.

2. U.S. Food and Drug Administration. FDA Launches Framework for Accelerating Development of Individualized Therapies for Ultra-Rare Diseases. FDA News Release, February 23, 2026.

3. Prasad V, Makary MA. FDA's New Plausible Mechanism Pathway. New England Journal of Medicine. 2025;393(23):2365–2367. doi:10.1056/NEJMsb2512695.

4. Qazi MA, Nadeem M, Yaqub M. Beyond Generative AI: World Models for Clinical Prediction, Counterfactuals, and Planning. arXiv:2511.16333, 2025.

5. Yang Y, Wang ZY, Liu Q, et al. Medical World Model: Generative Simulation of Tumor Evolution for Treatment Planning. arXiv:2506.02327, 2025.

6. Mu L, Huang X, et al. EHRWorld: A Patient-Centric Medical World Model for Long-Horizon Clinical Trajectories. arXiv:2602.03569, 2026.

7. Gallier S, Azcoaga-Lorenzo A, McCowan C, et al. SurvivEHR: a competing risks, time-to-event foundation model for multiple long-term conditions from primary care electronic health records. npj Digital Medicine. 2026.

8. Augustine EF, Yu TW, Finkel RS. N-of-1 Studies in an Era of Precision Medicine. JAMA. 2024;332(16):1386–1387. doi:10.1001/jama.2024.14637.

9. National Academy of Medicine. Expanding the Role of N-of-1 Trials in the Precision Medicine Era: Action Priorities and Practical Considerations. NAM Perspectives, 2024.

10. Schölkopf B, Locatello F, Bauer S, et al. Toward Causal Representation Learning. Proceedings of the IEEE. 2021;109(5):612–634.

11. Pearl J. Causality: Models, Reasoning, and Inference. Cambridge University Press.

12. Hernán MA, Robins JM. Causal Inference: What If. Chapman & Hall/CRC.

13. LeCun Y. A Path Towards Autonomous Machine Intelligence. OpenReview, 2022.

14. U.S. Food and Drug Administration. Artificial Intelligence and Machine Learning in Software as a Medical Device and related regulatory science resources.

15. SteeraMed: A Steerable Biomedical World Model. https://steerable.world

16. Xiong J, et al. World Models for Biomedicine: A Steerability Framework. Preprints.org, 2026. doi:10.20944/preprints202605.0366.v1.

17. Stanford University School of Engineering. "Virtual cell" would bring benefits of computer simulation to biology. 2010.

18. Tang L. The virtual cell. Nature Methods. 2025. doi:10.1038/s41592-025-02951-5.

19. Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold. Nature. 2021;596:583–589. doi:10.1038/s41586-021-03819-2.

20. Abramson J, Adler J, Dunger J, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature. 2024;630:493–500. doi:10.1038/s41586-024-07487-w.

21. Google DeepMind. AlphaFold: Five years of impact. 2025.

xiongjianghui.com

← 返回博客