热搜词:

中医的千年传承:网络科学描绘其演化之路|PNAS速递

原创 集智编辑部 集智俱乐部

摘要

现代技术系统的演化常常源于新旧技术的重组。尽管传统中药(TCM)已被使用了数千年,作为以实践经验为基础发展的技术,其演化特征是否与现代技术系统一致呢?最新发表在PNAS的一项研究,通过量化分析两千多年来59063种记录在案的中药方剂,尝试用网络科学的方法回答这一问题。研究表明,中药成分网络在演化过程中保持了核心-边缘结构,这与现代技术系统的演化特征一致。但是,与现代技术系统中的核心成分频繁更替不同,中药方剂的核心成分在数千年间相当稳定。这一发现为中药的未来发展提供了宝贵的见解。

关键词:传统中医(Traditional Chinese Medicine, TCM)、方剂(Formulas)、网络科学(Network Science)、重组发明(Recombinant Invention)、核心-边缘结构(Core–periphery Structures)、演化

论文题目:The evolution of Traditional Chinese Medicine as recombinant inventions

论文链接:https://www.pnas.org/doi/10.1073/pnas.2400812121

发表时间:2024年11月7日

论文来源:PNAS

从“经验”到“建模”:中医药研究的新路径

中医药的历史跨越两千多年,其知识系统主要依赖文献积累和师承经验。然而,这一古老系统究竟是如何随着时代演进的?为何有些药方流传千年而不衰,而有些则沉寂失传?在2024年发表于PNAS的一项研究中,研究团队利用59,063张中药方剂构建成分共现网络,首次系统揭示了中医药如何通过“重组式创新”实现自身演化。这项研究不仅开创性地将网络科学方法引入传统知识体系分析,也为我们理解中医药未来的发展路径提供了量化的视角。

随后,2025年发表于同一刊物的评论文章对该研究进行了深入评析。评论肯定了网络建模方法的创新意义,但也提醒学界关注“演化”概念的多重维度与方法论透明性。这一系列工作表明,中医药的现代研究正逐步从“文本解读”走向“数据驱动”,从“经验论述”迈向“结构建模”。

中药成分加权网络构建

在中药的演化过程中,数以千计的方剂被开发出来。每种方剂都由多个成分组合而成,主要是各种草药。研究团队利用网络科学,构建了从公元1年至2016年59063种记录在案的中药方剂的成分网络。其中成分作为节点,成分在同一方剂中的共现关系作为连边,并以成分的共现频率作为边的权重,从而构建出不同历史时期的中药成分加权网络。研究表明,中药成分网络在演化过程中保持了核心-边缘结构,这与现代技术系统的演化特征一致。但是,与现代技术系统中的核心成分频繁更替不同,中药方剂的核心成分在数千年间相当稳定。

中药成分与方剂数量的变化趋势

研究首先统计了公元1年到2016年间,每100年内中药方剂与成分的数量变迁。结果发现,尽管累计的中药成分和方剂数量总体持续上升,但“活跃成分”(即在当期仍被使用的成分)数量在1200年前后达到高峰后趋于稳定,1800年以后出现明显下降。同时,研究还发现,许多早期常用成分在后期被淘汰,这种“成分消失”现象表明中医药系统具有持续自我调整的机制。此外,成分的“度”(参与方剂数量)越低,其被淘汰的概率越高,呈现出典型的“适者生存”网络演化特征。

图1. 中药成分与方剂数量的动态变化。观察期始于公元1年,每个时间区间为100年(唯一例外是最后一个时间段为1901至2016年,共116年)。图中用虚线竖线标示了中国各个朝代的分界。红色虚线配圆点表示截至每个时间段末累计记载的中药成分总数;红色虚线配星号表示每个时间段内被记载的活跃中药成分数量;红色虚线配叉号表示每个时间段中新出现的中药成分数量;红色点虚线配三角符号表示在每个时间段内消失的中药成分数量,即之后未再被记载的成分。蓝色虚线配三角符号表示截至每个时间段末累计记载的中药方剂总数;蓝色点虚线配圆点表示每个时间段中新记载的中药方剂数量。

中药成分的网络共现特征

在构建了中药成分加权网络后,研究进一步分析了边的增长类型及其对网络扩张的贡献。实验识别出六类新边类型,其中对原有边的强化(即成分组合被重复使用)是网络扩张的主要驱动因素;其次是三元闭包(triadic closure),即通过一个新方剂将两个原有成分与一个共同邻居连接形成新组合。此外,还有新成分与旧成分的组合,以及完全新成分之间的连接。通过回归分析,作者确认中药成分网络的演化符合“优先连接”机制(preferential attachment),即频繁出现的成分更容易参与新的组合,从而增强其在网络中的中心性。

图2. 中药成分加权网络扩展过程中的边的动态变化。图A展示了不同类型的新边在中药成分网络扩展中的作用。左侧部分为时间段 t 与 t+1 的“方剂–成分”二分网络(其中 F1 至 F9 表示方剂,a 至 g 表示中药成分),这是构建右侧成分网络的基础。在 t+1 时期的成分网络中:类型1(Type 1):如成分 a 和 b 之间的边,表示已有边的再次加强;类型2(Type 2):新方剂 F5 含有三个成分(a、b 和 c),通过一个共同邻居(b)引入了一条新边 a–c,形成三元闭包;类型3(Type 3):新方剂 F6 引入新边 a–d,同样连接了两个原有成分并通过共同邻居 b 形成三元闭包,但这三个成分并未出现在同一个方剂中;类型4(Type 4):新方剂 F7 引入边 d–e,连接两个没有共同邻居的原有成分;类型5(Type 5):新方剂 F8 连接了一个已有成分 e 和一个新出现的成分 f;类型6(Type 6):新方剂 F9 连接两个新出现的成分 e 与 f。图B展示了中药成分网络扩展过程中上述不同类型新边的比例(左轴),以及各时间段中网络中边的总数(右轴)。由于公元201年之前仅存在两条边,图B的数据从公元301–400年开始统计。

网络的核心–边缘结构与嵌套性分析

通过计算不同历史时期网络的加权嵌套度指标(weighted NODF),研究发现中药成分网络始终保持着明显的“核心–边缘结构”(Core–periphery Structures):少数核心成分之间连接紧密,处于网络中心,其他成分则与核心建立较弱联系,分布在网络外围。这一结构通过与两个空模型的对比得以验证。空模型1保留节点度分布,空模型2只保留节点与边数量;中药网络的嵌套度显著高于空模型2,说明其结构非随机,体现出历史选择与经验积累的系统性特征。

图3. 中药成分加权网络的结构分析。图A展示了中药成分加权网络的最大生成树(Maximum Spanning Tree)结构,其中每个节点代表一种中药成分,边表示它们在全部59,063张中药方剂中共同出现的频次。图中用绿色圆点标出了“核心成分”(core components),右侧的图片展示了排名前九的核心成分。图B则展示了不同时期中药成分网络的加权嵌套度指标(weighted-NODFs),并与两种对应的空模型(null models)进行了对比。其中,空模型1通过重新洗牌边权与连接关系,但保留网络中的度序列;空模型2则仅保留节点数和边数,不保留具体连接方式。图C为1901年至2016年期间中药成分网络的对数加权邻接矩阵(logarithmic weighted adjacency matrix),可直观反映成分之间共同出现的强度。图D与图E分别展示了空模型1与空模型2在相同期段下的对数加权邻接矩阵,用于与真实网络进行结构性比较。其中,图C与图D中的红线表示“完美嵌套结构”(perfected nestedness)的边界,用于辅助评估中药成分系统的嵌套性特征

核心中药成分的稳定性与组合演化

研究还通过连续核心识别模型,提取了每一时期的“核心成分集合”(PCCS)与全时期的最终核心集合(FCCS),并以回溯比例衡量其稳定性。实验发现,中药的核心成分自公元400年起即表现出较高稳定性,至公元900年稳定性提升至88%,与现代技术系统中核心频繁更替形成鲜明对比。这说明,中医药依赖“经典核心”,强调知识传承与经验积淀。此外,研究还系统分析了“成分组对”(tuple)的构建路径,发现大部分大型成分组合都可以追溯到更小的常见组合,表现出复杂结构由简单组合逐步“生长”的特征。

图4. 中药核心成分的动态变化。图A展示了各个历史时期中药核心成分的数量变化(左侧纵轴)以及核心成分的稳定性(右侧纵轴)。其中,FCCS 表示从全部59,063个中药方剂中识别出的最终“核心成分集合”;PCCS 表示在每一历史时期截止时点所累积的方剂中识别出的“阶段性核心成分集合”。图B展示了核心成分的动态演化过程。图中白色表示该成分在该时期尚未出现于任何方剂中;黑色表示该成分在该时期被识别为核心成分(属于PCCS);灰色则表示成分虽已被使用,但不属于核心集合。红线以上的成分同时出现在FCCS中,红线以下的成分仅出现在PCCS中。图C展示了在三个不同时期中核心成分之间的共同出现关系(即在同一方剂中被同时使用的情况)。图中左上角被红色横纵线划分出的区域,表示所有FCCS核心成分之间的配伍情况,能够反映它们之间的紧密程度。

对现代的启示

与现代技术系统的核心成分经常发生替换不同,中药的核心成分在数千年的演化中保持了相对的稳定性。这种稳定性不仅源于这些成分能够应对基本或广泛的症状,还因为经典的成分组合已被广泛接受并作为新方剂发明的基础。这一发现为未来中医药的发展提供了重要启示:在新方剂的开发中,可重点考虑这些经过时间验证的核心成分。

另一方面,中医药技术的演化通常基于经验积累,可能面临较少的新技术轨迹。因此,引入现代科学探索和工程技术对于保持其活力尤为重要。通过这种方式,中医药不仅能够继承古代智慧,还能在现代科学的帮助下焕发新的生命力。

批判与建议

近日,一篇评论文章指出该研究的不足之处[1]:

(1)传统中医与现代技术的对比过于简单

中医药深深植根于文化、哲学和历史传统,与现代技术和科学基础有显著不同。尽管研究以网络科学为工具对中医药进行量化分析,但未能充分讨论这些传统差异如何影响中医药的演变。这种比较缺乏对中医药演变的深入理解,特别是在理论基础、诊断方法和治疗原则的重大改变方面。

(2)数据集的选择与可信度

研究从899本经典书籍中收集方剂,但未详细说明文本和方剂的选择标准,如历史意义、地区使用或临床效果等,可能导致数据集的偏倚。透明的框架对于提高数据集的可信度至关重要。同时,无法获得研究的原始数据也限制了对其结论的严格评估。

(3)中药名称的标准化问题

中药有着悠久的术语演变历史,同一种药材在不同时期可能有不同的名称,文章未能清楚说明如何解决这些差异以及使用何种方法标准化药材名称。这一点对于整合不同时期的历史数据尤为重要。

因此,尽管该研究在使用网络科学分析中医药演变上具有创新性,但若能更全面地探讨文化、历史和背景因素,将大大增强其研究的可信度。通过提高方法学透明度、重新定义“中医药演变”的内涵、解决药材名称的标准化问题以及提供原始数据的访问,将使得这一研究更具整体性和洞察力,为中医药历史发展的理解提供更丰富的视角。

参考

[1] https://www.pnas.org/doi/abs/10.1073/pnas.2503785122

集智俱乐部生命复杂性读书会中,香港浸会大学教授田亮老师分享了“生命复杂系统的构成原理与 AI for TCM”。感兴趣的可以扫码查看视频回放��

彭晨 | 编译

生命复杂性读书会:

生命复杂系统的构成原理

在生物学中心法则的起点,基因作为生命复杂系统的遗传信息载体,在生命周期内稳定存在;而位于中心法则末端的蛋白质,其组织构成和时空变化的复杂性呈指数式增长。随着分子生物学数十年来的突飞猛进,尤其是生命组学(基因组学、转录组学、蛋白质组学和代谢组学等的集合)等领域的日新月异,当代生命科学临近爆发的边缘。如此海量的数据如何帮助我们揭示宇宙中最复杂的物质系统——“人体”的构成原理和设计原理?阐释人类发育、衰老和重大疾病的发生机制?

集智俱乐部联合西湖大学理学院及交叉科学中心讲席教授汤雷翰,国家蛋白质科学中心(北京)副研究员常乘、李杨,香港浸会大学助理教授唐乾元,北京大学前沿交叉学科研究院研究员林一瀚,中国科学院分子细胞科学卓越创新中心博士后唐诗婕,共同发起,从微观细胞尺度、介观组织器官尺度到宏观人体尺度,梳理生命科学领域中的重要问题及重要数据,由生物学家提问,希望促进统计物理、机器学习方法研究者和生命科学研究者之间的深度交流,建立跨学科合作关系,激发新的研究思路和合作项目。读书会目前共进行10期,现在报名参与读书会可以加入读书会社群,观看视频回放,解锁完整读书会权限。

详情请见:

原标题:《中医的千年传承:网络科学描绘其演化之路|PNAS速递》

阅读原文