氨基酸是构建生命蛋白质的基本单位,遗传密码的起源及其演化顺序一直是分子进化和生命起源领域的重大未解之谜。研究生命的最古老共同祖先LUCA(Last Universal Common Ancestor)蛋白质结构,提供了全新且直接的视角,从而推测氨基酸被整合进遗传编码的时间顺序。这种方法摆脱了传统仅依赖古代地球无机环境与实验模拟的间接推断,转而利用生物自身的遗传信息,重新定义生物早期化学环境与进化逻辑。遗传密码如何一步步成型,以及哪些氨基酸首先被生命编码,是揭示生命复杂性升华的钥匙。通过考察LUCA蛋白质域的氨基酸成分,科学家发现,氨基酸的“大小”是其被编码顺序的最关键预测因素,小型氨基酸更早被招募入遗传密码。传统共识中许多依据宇宙或原始地球环境中氨基酸丰度的排名,在这一分析中显示出偏差,尤其是对于含硫和金属结合氨基酸的定位发生了显著修正。
含硫氨基酸如半胱氨酸和蛋氨酸,以及金属结合氨基酸如组氨酸,其进入遗传密码的时间应当远早于之前设想,这突显了金属催化和硫代谢在原始生命中的关键角色。众所周知,组氨酸在现代酶的活性部位中最为常见,这一特征可能溯源至生命起始阶段其在蛋白质中的早期角色。研究还提出,蛋氨酸早期进入遗传密码机制,与其在S-腺苷甲硫氨酸(SAM)生物合成和利用中的地位高度一致。作为SAM代谢的中枢,蛋氨酸的早期充足性为生命早期的甲基化反应和代谢网络奠定了基础。值得注意的是,早期蛋白质序列中芳香族氨基酸(如色氨酸、酪氨酸和苯丙氨酸)的频率显著高于稍后的序列,暗示在遗传密码最终形成前,生命可能使用过其他替代或更古老的氨基酸组合及编码方式。这也反映出遺传密码演化过程中的多元竞争和代码融合现象。
研究人员运用了基因树与物种树的结合比对技术,识别来自不同细菌和古菌超群中的蛋白质结构单元,精确判断其起源年代,排除水平基因转移的干扰,确保推断的可靠性。相比于分析整个基因,这种聚焦于蛋白质结构域的分析方法更为细致,因为多数蛋白质含有多个结构域,它们的演化时间点可能相差甚远。LUCA蛋白中氨基酸的丰度被重建,反映了它们在生命最初阶段的利用状态。与传统基于化学实验(如乌雷-米勒实验)所得出的氨基酸顺序相比,直接从LUCA蛋白质结构中推断的顺序更符合生物学实情。例如,乌雷-米勒实验因未包含硫元素而误判含硫氨基酸为晚期合成物,而新研究表明含硫氨基酸在古代生命中早已广泛存在。氨基酸的早期招募显然受到其生物利用度、生化功能以及环境化学条件的共同影响。
对LUCA的分析也揭示了蛋白质折叠机制的进化,发现早期蛋白中疏水氨基酸在序列上的分布更为均匀,有助于防止蛋白质错误折叠,提高功能稳定性。这种现象可能反映出原始生命体在折叠与功能上所面临的多重选择压力。含硫氨基酸和金属结合氨基酸在古代蛋白中的早期使用,也暗示生命起源环境中丰富的硫和金属元素,对于催化和代谢功能的支持作用至关重要。特别是在富含硫化氢的环境,如早期的地热喷口或海底热泉,含硫氨基酸可能承担保护与催化双重角色。这样的生态化学设定不仅塑造了氨基酸的招募顺序,也对后续生物化学反应和复杂代谢网络的形成产生了深远影响。反观高等生物中氨基酸的使用策略,即便经过数十亿年演化,其根基仍深植于这初期的氨基酸招募模式之中。
对LUCA蛋白域的系统研究不仅为生命早期化学环境描绘了更准确的风貌,也为外星生命探索提供了理论指导。假设生命起源于多样且动态的环境中,潜在的生命代码也可能呈现多样性,理解这些遗传密码适应与更替的机制,将提升我们识别外星生命的能力。此外,本研究建议预先存在不同遗传密码的生命形态在历史上共存,经过互相竞争和基因水平转移,最终促成编码标准化。这一观点对遗传密码的单一定型过程提供了支持,揭示了现代遗传信息体系背后的复杂历史。通过对远古蛋白的深度挖掘,科学家们正逐步揭开地球生命最古老层面的秘密,带来的不仅是对生命本源的崭新理解,也对分子进化、生物合成以及生物信息学等多个领域产生深远影响。展望未来,随着天体采样任务的推进、实验模拟环境的改进和计算进化技术的提升,对于氨基酸遗传编码顺序的研究将更加精细,并可能拓展至非标准氨基酸和古代生物多样性的探索,为解锁生命宇宙意义铺设坚实基础。
。