体细胞干细胞作为组织维持和修复的核心载体,其在人体发育和成年过程中不断积累DNA变异。一部分变异可能通过遗传漂变随机分布,而另一部分则可能因给予生存或增殖优势而被选择,最终形成克隆扩增。这种克隆选择不仅影响组织稳态,还可能为疾病,尤其是癌症的发生奠定基础。然而,如何准确检测和量化非肿瘤组织中克隆选择历程,一直是干细胞研究的重要挑战。近期,以Verena Körber等人为代表的科学家们提出了一种名为SCIFER的数学模型与统计框架,旨在利用普通组织的全基因组测序数据,识别克隆选择并评估克隆的生长动力学,极大地推动了该领域的研究进展。SCIFER模型基于种群遗传学理论,将发育扩展和成年稳态两个阶段的干细胞动态整合建模。
发育阶段干细胞数量处于扩张状态,驱动了携带早期突变的克隆形成,导致部分变异呈现较高的变异等位基因频率(VAF)。成年阶段,干细胞数量趋于稳定,仍不断获得突变,但多数处于低VAF状态。SCIFER独特之处在于通过分析VAF的累积分布,分辨中性的遗传漂变和正向选择所导致的克隆扩张形态特征。具体而言,正向选择驱动下的克隆会产生VAF分布中的“肩部”特征,这一信号能够被模型敏锐捕捉。该模型不仅识别克隆是否处于选择状态,还能推算克隆起始时间、选择优势大小及干细胞的自我更新速率等关键参数。为了验证SCIFER的有效性,研究人员首先利用模拟数据系统地评估了其灵敏度和特异度。
结果表明,在90倍测序深度条件下,模型对5%及以上VAF的选中克隆有高准确度的检测能力。更高深度测序(如270倍)则使得模型能捕获更小规模的克隆扩张,灵敏度显著提高。此外,通过对单个血液干细胞的单细胞测序数据进行伪合成并应用SCIFER,结果证明模型在实际数据中也能重建准确的干细胞数量、自我更新速率以及突变积累速率,且与先前独立研究数据具有高度一致性。值得注意的是,SCIFER无需先验驱动基因信息即可鉴别出克隆选择事件,极大降低了成本与技术门槛。将该方法应用于真实的人类骨髓样本后,SCIFER在携带已知驾驶基因突变(如DNMT3A、TET2和ASXL1等常见克隆性血液病驱动基因)的样本中均成功检测到对应的选中克隆。此外,模型还能识别出多个并存的克隆,揭示了血液系统内复杂的多克隆竞争。
在部分无已知驱动基因突变的个体中,SCIFER仍发现了多例具有显著选择优势的克隆,暗示未知驱动因素的普遍存在及其对血液干细胞动态的重要作用。通过对各个克隆起源年龄的推断,研究显示具有已知与未知驱动基因的克隆均可在多个人生阶段出现,且克隆扩张存在较大个体间差异,这为理解克隆性血液病的发病机制以及临床干预提供了新的视角。除了血液组织,SCIFER方法还被成功应用于人类脑组织的全基因组数据分析。结果表明,约四分之一的脑样本存在克隆选择现象,罕见驱动基因克隆尤为常见,并且典型的克隆起始时间主要集中在儿童期至青年早期。更引人注意的是,SCIFER还能检测到带有脑肿瘤相关驱动突变的潜在早期克隆,尽管这些脑组织在病理上无明显恶性表现。该发现提示肿瘤前驱克隆在脑组织中的隐匿演化与其潜在发病风险息息相关,为神经退行性疾病及脑肿瘤的早期诊断与预防提供了重要线索。
SCIFER的优势在于其通用性和可扩展性,适用于各类再生性体组织的克隆动态分析,并且因其只需单个时点的普通组织样本,极大简化了实验设计。通过结合贝叶斯推断与人口遗传学建模,SCIFER不仅实现了对克隆选择的定性检测,还提供了克隆起始时间、选择优势和干细胞分裂率等多维度定量估计,有助于全面描绘体细胞进化过程。此外,模型对测序噪声和数据深度的鲁棒设计,使其在实际应用中表现优异,为未来大型组织样本的横断面研究奠定基础。尽管成果令人振奋,但SCIFER也存在一定局限性,例如对非常早期起源的克隆识别灵敏度有限,以及对复杂多克隆结构的解析能力依赖数据深度和变异丰富度。未来结合单细胞技术、多时点采样以及更丰富的组学数据,SCIFER有望进一步提升解析能力,推动体细胞演化与疾病发病机制研究更上一层楼。总的来说,SCIFER作为检测与量化体细胞干细胞克隆选择的创新工具,为理解健康组织内的体细胞变异命运提供了强大支持。
其在血液系统与脑组织中的成功应用,揭示了克隆选择贯穿生命不同阶段,且与多种疾病相关。随着该方法的推广和改进,预期将在精准医学、癌症预警及组织修复等领域发挥重要作用,助力人类更深刻理解健康与疾病的本质联系。