博客

从平均值到网络落差:SEMO专利背后的方法论转向

2026年5月8日,国家知识产权局授权公告了发明专利《基于预训练模型生成化合物干预方案的方法、系统及其应用》,授权公告号CN117766054B。这项专利对应的是我们围绕SEMO所做的一套技术探索:如何把化合物、蛋白质互作网络、个体组学数据和干预方案生成,放进一个可计算的框架里。我更愿意把它理解为一次方法论上的转向——从看某个指标是否低于平均值,走向看个体网络内部是否存在可被干预解释的落差。

熊江辉 · 2026-05-10
2

2026年5月8日,国家知识产权局授权公告了发明专利《基于预训练模型生成化合物干预方案的方法、系统及其应用》,授权公告号 CN117766054B。这项专利对应的是我们围绕SEMO所做的一套技术探索:如何把化合物、蛋白质互作网络、个体组学数据和干预方案生成,放进一个可计算的框架里。

我更愿意把它理解为一次方法论上的转向:

> 从"看某个指标是否低于平均值",走向"看个体网络内部是否存在可被干预解释的落差"。

3

一、为什么"平均值"不够

现代健康管理很大程度上建立在人群正常值之上。

血钙、维生素D、铁蛋白、血糖、血脂、尿酸、激素水平……大多数指标都有一个参考范围。落在范围里,就被认为"正常";落在范围外,就被认为"异常"。

这套方法很重要。它让医学判断可以标准化,也让临床工作可以规模化。

但它有一个隐藏前提:

> 它把人看成了一个相对于人群分布的位置。

也就是说,它回答的是:

你和大多数人相比,是否偏高或偏低?

但真正的个体化健康问题往往不是这个。

更关键的问题是:

- 在这个人的身体网络里,哪些模块正在承受压力?

- 哪些模块仍有储备?

- 哪些方向的干预,可能真正对应这个人当前的网络状态?

这就是我们做SEMO时最初想解决的问题。

我们并不是要否定人群正常值,而是希望在它之外,再增加一个内部参照:

> 让一个人的生物网络自己和自己比较。

4

二、身体不是指标表,而是网络

一个化合物进入身体之后,并不是只改变一个孤立指标。

它可能影响某些蛋白,牵动一组相互作用的基因网络,进一步影响代谢、免疫、炎症、线粒体功能、神经递质、DNA修复或细胞应激反应。

所以,真正的问题不是"这个成分理论上好不好",也不是"这个指标在不在正常范围",而是:

> 这个化合物所关联的靶点,在这个人的蛋白质互作网络中,是否对应一个真实的局部状态差异?

SEMO的核心考虑,就是把这种差异计算出来。

我们把化合物的已知靶点映射到PPI网络中,再把这些靶点与同一局部网络中的非靶背景进行比较。这里使用的个体数据,可以是DNA甲基化,也可以进一步扩展到其他组学层面。

如果靶点区域和背景区域之间出现了稳定的信号差异,我们就可以把它理解为一种"网络落差"。

这个词很形象。

在一张水利地图上,水位差代表势能,也代表流动的方向。在生命网络中,靶点区域与背景区域之间的信号落差,也可能代表一种值得关注的状态偏移。

!基因网络落差景观图

它不是单点指标,也不是人群平均值,而是个体内部网络的相对关系。

5

三、SEMO背后的隐含假设

SEMO背后有一个很朴素的假设:

> 一个干预方向是否值得关注,不只取决于这个成分本身有多热门,而取决于它所作用的网络区域,在这个个体身上是否真的呈现出可计算的差异。

这和传统补充剂逻辑不太一样。

传统逻辑常常是:

- 这个年龄段普遍缺什么;

- 某个成分在研究中显示有效;

- 某类人群平均受益;

- 某个指标低了,所以补某个东西。

SEMO想做的是另一件事:

> 把"这个东西好不好"转化为"这个东西对应的网络模块,在这个人身上有没有可观察的落差"。

这也是为什么我们强调PPI网络。

疾病不是单个基因的问题,衰老也不是单个指标的问题。生命系统更像一个高维网络:不同节点之间互相牵连,不同模块之间互相补偿。一个地方看似正常,另一个地方可能已经出现代偿;一个指标看似不低,相关网络却可能已经有压力。

因此,SEMO并不是简单地做"成分推荐"。

它更像是在做一件底层的事情:

> 把化合物作用和个体网络状态之间的关系,变成可计算、可排序、可进一步验证的结构。

6

四、为什么这件事重要

精准健康和个体化医学长期面临一个难题:我们都知道个体差异重要,但很难把个体差异真正转化为计算结构。

多数时候,所谓"个性化"仍然停留在标签层面:年龄、性别、生活方式、症状、问卷、少数几个检测指标。

这些信息有用,但还不够。

真正的个体化,应该深入到网络层面:

- 这个人的免疫网络处于什么状态?

- 代谢网络是否存在局部压力?

- 线粒体相关模块是否出现信号偏移?

- 某个天然产物或药物再利用候选物,对应的靶点区域是否刚好处在这个人的网络落差中?

如果这些问题不能计算,个体化就只能停留在经验判断。

SEMO的意义,就在于把这些问题往前推了一步。

它不是直接给出终极答案,而是先把问题变成可计算形式:

> 对每一个人,建立"化合物 × PPI局部网络 × 个体组学状态"的映射。

一旦这个映射建立起来,后面才有可能做排序、追踪、复测、验证和迭代。

7

五、从"缺什么"到"哪里有落差"

我一直觉得,"缺什么"这个问题在健康产业里被问得太简单了。

很多时候,人们问"我缺什么",其实是在问:

我应该吃什么?

但身体未必是这样回答问题的。

身体真正呈现给我们的,可能不是一个简单的缺乏清单,而是一张复杂的网络状态图。

- 有些地方看似指标正常,但网络已经出现压力;

- 有些地方指标略低,但系统仍能维持稳定;

- 有些成分理论上很好,但并不对应当前这个人的主要网络落差;

- 有些不那么热门的成分,反而可能击中一个被忽略的局部模块。

因此,我们想把问题改写成:

> 不是"我缺什么",而是"我的网络哪里出现了落差"。

> 不是"什么成分最好",而是"什么成分对应的网络区域,最值得在我身上验证"。

这才是SEMO背后的真正考虑。

它不是为了制造更多补充需求,而是为了减少盲目尝试。

8

六、为什么需要预训练模型

如果只看一个化合物、一个网络、一个样本,问题还不算复杂。

但真实世界里,化合物有很多,PPI子网络有很多,个体样本也有很多。每一个化合物都可能对应多个靶点,每一个靶点又处在不同的网络背景中。

这就形成了一个巨大的计算空间。

在我们的bioRxiv预印本中,我们提出了利用预训练网络医学模型来生成生物标志物、靶点、药物再利用线索和个体化方案的思路。核心做法就是把人类PPI网络拆分为大量子网络,再结合大量化合物靶点,形成可复用的SEMO特征池。

这一步很关键。

因为个体化医学如果每次都从零开始计算,就很难规模化。预训练模型的意义在于:

> 先把"化合物—网络"的可能关系结构化,再在具体个体数据上进行映射。

也就是说,SEMO不是单次分析,而是一套底层表征系统。

它先建立一个大规模的网络医学特征空间,然后让每一个个体的组学数据进入这个空间,找到属于这个人的网络落差图谱。

9

七、与FDA机制证据趋势的关系

近年来,FDA关于Plausible Mechanism的讨论说明了一个重要趋势:在高度个体化、传统大规模临床试验难以充分展开的场景中,监管科学正在更重视机制证据、自然病史和有限临床数据之间的组合。

这对整个精准医学领域都是一个信号。

未来的医学证据,不会只剩下群体平均效应一种语言。我们还需要另一种语言:

- 这个干预为什么对这个人有意义?

- 它作用于哪个分子异常、哪个网络模块、哪个机制链条?

- 这个机制变化是否可以被观测和追踪?

SEMO所做的事情,正好和这个趋势有内在呼应。

它试图把化合物作用放到个体网络中解释,把干预方向从经验判断变成机制假设,把个体化方案从"推荐清单"推进到"网络证据结构"。

这也是我认为SEMO未来真正重要的地方。

它不是一个孤立算法,而是个体化机制证据基础设施的一部分。

10

八、专利授权的意义

这次授权的发明专利,题目是《基于预训练模型生成化合物干预方案的方法、系统及其应用》。

它所覆盖的,不只是一个单点计算公式,而是一整套技术链条:

- 化合物靶点信息的组织;

- PPI网络和子网络的构建;

- 个体组学特征的提取;

- 化合物相关网络特征的生成;

- 基于预训练模型的干预方案排序与输出。

从工程角度看,这意味着SEMO不再只是一个研究想法,而是可以进入系统实现、产品转化和持续迭代的技术框架。

从科学角度看,它也提出了一个新的问题:

> 我们能否用网络落差,而不是单点指标,来重新组织个体化干预的证据?

这可能才是这项专利背后更深的意义。

11

九、我希望SEMO最终成为一种什么工具

我并不希望SEMO只是一个"推荐补剂"的工具。

如果它只是告诉用户该吃什么,那就太浅了。

我希望它最终成为一种生命网络的解释工具:

- 帮助我们理解一个人的系统状态;

- 帮助我们发现传统指标看不到的局部网络压力;

- 帮助我们把化合物作用和个体差异连接起来;

- 帮助我们设计更好的N-of-1验证;

- 帮助我们把健康干预从经验消费推进到机制科学。

SEMO真正想回答的问题不是"哪种成分最火",而是:

> 在这个人的生命网络中,哪里存在可以被理解、被追踪、被验证的落差?

这件事如果做成,精准健康就不再只是一个营销词。

它会变成一套可以反复计算、复测和迭代的个人科学。

12

十、结语:让身体网络自己说话

过去,我们太习惯用外部标准解释身体。

人群平均值、正常范围、流行病学结论、专家经验、产品推荐……这些都重要,但它们都不是这个人自己的网络。

SEMO想做的是另一件事:

> 让个体的分子网络成为判断干预方向的起点。

从平均值到网络落差,并不是抛弃传统医学,而是在传统指标之外增加一个更接近系统本身的视角。

当我们能够看到一个人身体内部的网络落差,就有机会把健康管理从"猜测我该补什么",推进到"验证我的网络哪里需要被重塑"。

这就是SEMO背后的隐含考虑。

也是这项专利真正想打开的方向。

1. 熊江辉。《基于预训练模型生成化合物干预方案的方法、系统及其应用》。发明专利,授权公告号:CN117766054B,授权公告日:2026-05-08。申请人:北京深度甲基健康技术有限公司。

2. Xiong J. Utilizing Pre-trained Network Medicine Models for Generating Biomarkers, Targets, Re-purposing Drugs, and Personalized Therapeutic Regimes: COVID-19 Applications. bioRxiv. 2023. doi: 10.1101/2023.02.21.527754.

3. U.S. Food and Drug Administration. Considerations for the Use of the Plausible Mechanism Framework to Develop Individualized Therapies that Target Specific Genetic Conditions with Known Biological Cause. Draft Guidance for Industry. February 2026.

4. Barabási AL, Gulbahce N, Loscalzo J. Network medicine: a network-based approach to human disease. Nature Reviews Genetics. 2011;12:56–68.

返回博客