体细胞镶嵌现象是指人体内不同细胞群体携带不同的基因组变异,这些变异不是遗传自父母,而是在个体生命早期或发育过程中后天形成的。尽管体细胞突变广泛存在于人体的各类组织中,其频率、类型和功能影响却在不同组织及不同个体间呈现显著差异。近年来,由美国国立卫生研究院(NIH)主导成立的“人体组织间体细胞镶嵌网络”(Somatic Mosaicism across Human Tissues Network,简称SMaHT)致力于构建跨越多组织、从大量无病捐赠者中采集样本而成的体细胞突变综合图谱,推动了全新领域的基因组学研究发展。 从受精卵开始,人体细胞便不断地经历基因组损伤,既有由内源性代谢过程引起的DNA复制错误,也有外界环境因子如紫外线、烟草、化学物质等带来的突变损伤。虽然细胞不断修复大多数损伤,但仍不可避免地积累体细胞突变。不同组织的细胞经历不同的分裂频率和环境暴露,因此体细胞突变的累积和谱系复杂多样。
例如,大脑中的神经元多为后分裂细胞,体细胞突变积累缓慢;而肠道上皮细胞因高更新率,体细胞突变积累速度相对较快。 检测体细胞突变具有技术上的巨大挑战,因其突变细胞占比通常极低。传统基因组测序技术难以检测频率低于1%的突变,特别是在复杂基因组区域如重复序列和结构变异(SV)方面检测更为困难。SMaHT网络采用了多样化的技术组合,包括高深度短读长全基因组测序、长读长测序,以及先进的双链测序(duplex sequencing)、单细胞全基因组测序和RNA测序技术,从不同层面改进对体细胞变异的识别和定量能力。尤其是长读长测序技术促进了对大型结构变异和重复区域突变的识别,极大拓宽了研究视野。 SMaHT网络的研究样本涵盖19种不同组织,覆盖胚胎发育中三大胚层来源及生殖细胞,涉及诸如结肠、肺、肝脏、血液、心脏、皮肤和大脑等,样本来自150名无疾病病史的捐赠者,年龄均匀分布在18至85岁以上。
每个捐赠者多组织的联合分析使得研究人员能够追踪早期发育阶段形成的嵌合突变,同时揭示特定组织特异性后期累积的突变特征。此外,丰富的捐赠者元数据,如人口学、医疗历史及死亡原因等,有助于分析遗传背景与环境因素对体细胞突变谱的影响。 体细胞突变虽然大多为功能中性,然而部分可能导致细胞表型变化,甚至介导疾病的发生。例如,癌症即是体细胞突变驱动的典型病理状态。近年来的研究显示,其他疾病如神经发育障碍、心血管疾病、炎症性疾病等亦与体细胞突变密切相关。体细胞选异突变可使细胞获得增殖优势,形成克隆扩张,部分突变位点与已知肿瘤驱动基因重叠。
奇特的是,相同的驱动基因突变在性状和恶性转化风险上,可能因组织环境和选择压力而表现不同。例如,正常食管上皮中NOTCH1基因突变克隆异常丰富,甚至超过该基因突变频率较高的食管癌。 SMaHT网络不仅关注突变检测技术,也积极开发包括算法、数据库和综合分析工具的创新平台。使用个体专属的染色体相位参考基因组提升突变发现准确率,结合机器学习优化低频突变的鉴别,构建多层次的组学数据分析流程。网络成果将通过开放门户向科研和临床社区提供,支持用户实现体细胞突变的检索、注释及功能关联分析,极大促进该领域的研究合作和数据共享。 技术层面,单细胞测序推动了对细胞异质性及谱系关系的深刻理解,体细胞突变充当“内源性条形码”帮助重建个体生命发展历程。
基于细胞内突变等位基因频率可以定量评估胚胎发育早期细胞分支贡献的不均衡,揭示发育过程中的细胞命运分配及选择机制。此外,单细胞RNA测序结合基因突变信息揭示了突变对细胞功能和转录态的影响,推动功能基因组学和临床转化应用。 体细胞结构变异及插入型转座元件的检测也受到网络高度重视。由于此类变异覆盖基因组大片段,往往对细胞功能及疾病风险影响深远,但传统短读长测序技术难以精确捕获。引入目标富集、Cas9指导的靶向长读长测序,以及基于转座元件家族特异性的特异检测方法,实现了对此类变异的敏感检测,进一步丰富了体细胞遗传变异的全景图。 未来,SMaHT网络计划集成空间组学、蛋白质组学等多模态数据,探索不同组织环境下体细胞突变引发的表型变化,明确突变功能。
同时,通过与其他大型基因组学合作组织如人类泛基因组参考联盟、肿瘤分析网络等的合作,加强对体细胞变异在正常与疾病状态中差异的解析,推进精准医学、疾病预防和治疗策略的创新。 总体来看,人体组织内广泛存在的体细胞镶嵌现象远超以往认识。体细胞突变的累积、选择及功能影响是理解人体生物学变化、衰老机制和疾病发生的关键。SMaHT网络项目汇集多项尖端技术和多学科合作,致力于打造详尽、跨组织的体细胞突变参考图谱。该资源的建立为科学界探索人体基因组的动态变化提供了强大工具,也为临床诊断与治疗模式带来深远影响。未来,随着技术发展和数据积累,体细胞镶嵌领域有望揭示更多生命奥秘,推动健康与疾病管理的转型升级。
。