人类基因组中有超过90%的基因为“非编码基因”,以前科学家把它们成为“垃圾基因”,现在则称它们为“基因组中的暗物质”。图为DNA示意图。(Shutterstock)
新研究发现“垃圾基因”的变异也与癌症相关,并第一次揭示了这其中的基本机制。
科学家把基因分成两大类,一类称为编码基因,即具有蛋白质编码功能的基因,这类基因在基因组中所占的比例还不到10%;超过90%的基因为“非编码基因”,科学家不明确它们的作用,甚至给它们起名为“垃圾基因”,意思再明显不过了,认为它们是无用的。
近年来的研究不断在揭示这些“垃圾基因”的各项功能,比如,它们对其它基因的活跃度起到重要的调控作用,也就是可以根据需要增加或减小某些基因的活跃程度。随着科学家对这部分基因敬畏度的增加,一些研究人员把这部基因改称为“基因组中的暗物质”,意即它们很神秘,而且作用很大。
这给研究癌症的科学家抛出了新的问题:编码基因的变异会导致细胞产生错误的蛋白,那非编码基因变异的后果是什么?这部分基因的变异与癌症相关吗?
由于前面提到的非编码基因对基因活跃度的调控作用,科学家以前的研究一直在考察特定非编码基因的变异如何影响基因活跃度,继而导致癌症。但是大量的研究都看不到任何相关性。
非编码基因会影响表达吗?
为了查明非编码基因的变异与癌症的关系,研究人员先进行了多项全基因组关联研究(genome-wide association studies,简写为GWASs),比如扫描研究对象血液细胞内整套的基因组,把癌症患者和健康人的基因组进行对比,找到癌症患者基因组内常见的所有基因变异或变版的集合。
主要研究者之一美国丹娜-法伯癌症研究所(Dana-Farber Cancer Institute)的博士研究员亚历山大·古谢夫(Alexander Gusev)介绍说,这些基因中只有很少的比例是编码基因。以乳腺癌的基因关联研究来说,“一共找到了三百多个与这种癌症相关的变版基因,只有不到10%是编码基因,其余都在‘垃圾’段内,我们不明确它们对癌症的风险有着怎样的影响。”
为了进一步了解其中的联系,研究人员收集了两套数据:一套是变异基因与特定癌症类型之间的相关性;另一套是特定癌症与特定基因活跃度之间的相关性。通过对比两套数据,采用一种名为共定位(colocalization)的分析,即找到两套数据重合的部分,就能看出非编码基因与癌症之间的相关性。
可是,尽管研究人员在这方面投入了大量的研究,几乎看不到非编码基因与癌症之间的对应关系。
柳暗花明
这份研究想到了新的思路,研究人员想到考察非编码基因变异怎样影响它们附近基因的物理环境。古谢夫说:“我们想到,如果查看这些变异对本地环境的影响——它们是否导致附近的DNA分子链盘得更紧或更松,我们也许能看到其它那些直接探察它们与基因表达之间关系(比如共定位研究)所看不到的证据。”
古谢夫说:“如果这类变异与癌症相关,这种影响在基因表达层面可能太轻微,看不出来;但可能从局部表观遗传层面——即该变异周围的环境中可以看得出来。”
古谢夫说,以前的研究就像探索加州山火对科罗拉多州的天气会起到怎样的影响,而他们的研究则是去考察山火对起火点山坡的影响。
于是,他们取了不同的两套数据进行共定位研究。一套数据仍然是与癌症相关的变异基因的GWASs数据;另一套则是七种常见癌症的局部表观遗传变化数据。结果他们看到了与以前的共定位研究反差很大的结果,找到了明显的相关性。
古谢夫说:“我们发现尽管看不到多数非编码变异对基因表达的影响,但是都能看到它们对局部表观遗传的控制。现在我们终于了解了大部分非编码基因变异如何与癌症相关的基本机制。”
这份研究6月13日发表于《自然·遗传学》(Nature Genetics)期刊。
!评论内容需包含中文