“暗蛋白质组”调查揭示数千种新的人类基因
20多年前,人类基因组首次完成测序时,科学家们发现其中基因数量远少于预期,仅为某些预测值的三分之一。不足3万个基因及其编码的蛋白质似乎就能支持人体的构建和运作。而最近的统计数据进一步将这一数字缩小至约2万个。然而,美国密歇根大学医学院的研究团队通过一项名为“暗蛋白质组(dark proteome)”的新系统分析发现,基因组中被忽视的片段实际上包含数千个非传统基因,这些基因所编码的蛋白质比常规蛋白质更短。基因的传统定义通常包括一个称为开放阅读框(ORF)的长DNA序列。ORF提供起始和终止的信号,指导细胞转录并生成信使RNA,信使RNA再被传递至细胞中的“工厂”核糖体,后者根据RNA信息将氨基酸组装成蛋白质。典型的ORF往往被一个吸引转录蛋白的DNA片段所前导。对于大多数研究人员而言,只有编码至少100个氨基酸的ORF才能被视为基因。然而,研究酵母、蛇以及人类等不同物种的生物学家发现了大量非规范ORF。这些ORF往往缺少传统的起始片段,也比标准ORF短得多,但它们依然能够被转录成RNA。一种称为核糖体分析或核糖序列分析的新方法表明,许多转录的RNA能够附着在核糖体上,并可能被翻译成短链氨基酸,甚至生成少于12个氨基酸的微型蛋白质。到2022年,研究人员在人类基因组中已发现了7264个非规范ORF。借助人类蛋白质组组织(Human Proteome Organization)和质谱蛋白质组学数据库PeptideAtlas,他们证明了这些ORF确实能够制造蛋白质。在统计的7264个非规范ORF中,有四分之一被确认能够生成蛋白质,总数约为3000个。此外,由于一个ORF可以通过多种方式解读,它还可能编码多种蛋白质。这些新发现的基因及其蛋白质产物可能对人类生物学的各个领域带来颠覆性影响,并加速医学研究的进展。例如,研究发现的一个新基因能够生成一种微型蛋白质,而这种蛋白质似乎在儿童癌症的发病中起到关键作用。看成是暗物质蛋白了{:1_12:}
頁:
[1]