一个基因在激活之后,其发挥什么功能以及生成什么产物都受到严格地调控,对此科学家们已了解不少。首先,基因生成RNA分子,随后称作为RNA结合蛋白(RBPs)的小蛋白会结合到RNA上,控制它的命运。例如,一些RBPs会切掉RNA分子的某些部分使其生成特异的蛋白质,而另一些RBPs则在RNA生成蛋白质之前帮助破坏它。
由于解码RBPs结合的RNA序列非常的困难,目前对于这些机制仍然不是很清楚。为了充分了解基因调控以及疾病中的失控机制,科学家们需要采用先进的实验室技术和数据分析,才能鉴别这些RNA序列的模式。
由多伦多大学的高级研究员Tim Hughes领导的一个研究人员小组致力填补这一知识缺口,他们生成了第一个RNA结合序列目录,研究成果发表在7月11日的《自然》(Nature)杂志上。
Hughes说:“我们花费了大量的时间来生成和分析数据。在用数年时间开发及完善方法之后,我们开始寻找人类、果蝇和其他复杂生物体中,看起来有可能与RNA结合的所有蛋白质,并搜索它们喜欢结合的序列。我们的RNA结合序列目录将成为该领域研究人员一个重要的资源,其对于人类遗传分析尤为有用。
研究人员发现,由于人类和果蝇起源于共同的祖先,两者具有相似的RBPs。并且在许多情况下,它们基本上结合的是相同的序列。研究人员预计,其他的生物体中的RBPs蛋白也是如此。
“我们总共调查了200多种蛋白质,或许可以此推断其他许多生物体中数以万计蛋白质的偏好,”Hughes说。
此外,研究人员还发现许多跨物种的相似序列都位于RNA转录物的末端,RNA降解调控及细胞内易位均与这一区域有关。“这表明,RNA有可能在自身稳定或破坏方面,对基因表达进行了更多的调控,”Hughes说。
RBFOX1是一个得到广泛研究的蛋白质,众所周知它在RNA剪切调控中发挥作用,在自闭症中RBFOX1的表达减少。研究小组所取得的一个重要发现就是,证实RBFOX1参与调控了自闭症大脑中神经系统相关基因的表达水平,它使得RNA变得更加的稳定。
Hughes说,自闭症的潜在病因远比单基因功能失常要复杂得多。他认为,研究小组的RNA结合序列目录将在人类遗传分析中发挥作用。
“科学家们通常所做的事情只是鉴别与疾病相关的遗传变异,但他们却不了解遗传变异导致疾病的原因。这些序列发生改变造成了什么影响?如果序列位于RNA的调控区域,那么利用我们的目录,其他的科学家们将可以了解与之结合是哪些蛋白质,从而使得他们更好地认识正遭到破坏的事物。”
下一步,研究小组打算将他们的目录扩展至全部的复杂生物体。Frey还希望能够利用这些研究发现进一步构建出可以更准确描述基因表达模式的模型。
Frey说:“我的研究侧重于解码DNA中的调控序列,它们最终塑造了RNA分子的命运。我希望利用论文中发现的这些RNA结合序列作为标记,来查明它们是如何以一种调控模式来发挥作用的。这将帮助我们更好地认识DNA突变影响调控的机制,从而更深入地了解人类疾病。”