长散在重复序列(10ng interspersed nuclear elements,LINE),意为散在分布的长细胞核因子,是散在分布在哺乳动物基因中的一类重复序列,这种重复序列较长;另一类短散在重复序列的细胞核因子称为(short interspersed nuclear elements,SINE)。LINE是可以自主转座的一类反转录转座子,来源于RNA聚合酶Ⅱ的转录产物;SINE则是非自主转座的反转录转座子,来源于RNA聚合酶Ⅲ的转录物。 L1是LINE中的一种重复序列,长约6 500bp,哺乳动物基因组中的拷贝数可多达10万份,主要集中在AT富集区。L1以及由L1编码的反转录酶作用于其他非自主反转录转座子以后所生成的DNA序列,加起来至少占人类基因组全长的四分之一。LINE不同成员之间的序列有较大差别,但是同一物种中的LINE的不同成员仍有较大的同源性。
LINE有分别长1 137bp和3 900bp的可读框,这两种可读框有14bp的重叠序列。从LINE的结构分析,它并不具有反转录病毒特有的LTR,因此曾把LINE归于非病毒超家族。测序的结果发现LINE L1的一个可读框同反转录酶是同源的,这提示LINE可能来源于能够编码转座所需的酶进行自主转座的可动元件,所以现在在分类时被归人病毒超家族。1988年,人们第一次认识到可动元件可能是人类疾病的一种致病因素。当时在血友病A的凝血因子Ⅷ基因中发现了两个截短的L1,后来在凝血因子Ⅷ的基因中又发现了一个反转座的L1插入片段。进行性假肥大性—肌营养不良(Duchenne’smuscular dystrophy,DMD)基因中有三个L1,肠道癌的致病基因APC以及夕—珠蛋白基因中也都发现了L1。已发现的致病的L1插入片段绝大多数出现在生殖细胞或早期胚胎中。APC基因中的11插入片段则是在结肠癌中发现的。这表明L1的反转座作用也可以发生在体细胞中。L1的插入有以下两个,结构特征:①已发现的每一个插入片段的序列都各不相同,这表明它们是分别来自不同的原初元件(progenitor elements);②上面提到的已发现的8个L1插入片段中,有7个是5,端截短的,其长度变化很大,从538bp到3.8 kb,但是所有这些L1插入片段的蛋白质编码区都保持完整;插人口—珠蛋白基因的L1是全长的。这些数据提示,并非所有具诱变作用的L1片段在插入后都不再移动了,有些片段很有可能仍保持再次反转录转座的能力。例如,小鼠的全长L1插入片段,确实能再经历几轮的反转录转座。
L1插入片段的全长原初元件可能是哺乳动物中有活性的反转录转座子的来源。L1被认为是人类基因组中主要的可动因子,它不仅能自主转座,而且它的蛋白质产物可促使非自主转座因子的反转录转座。同时L1还能十分有效地将位于L1 3’端的侧序一起转座到新的位置,这种作用称为3'转导(3'transduction),其结果是将宿主基因组中原先不连锁的两个DNA片段排列在一起。许多真核细胞中都发生3'转导作用。当L1本身的转录终止信号较弱而3'侧序中有很强的转录终止信号时,RNA聚合酶进行L1转录时就会发生“连读”(read-through),而将11’和 3'侧序一起转录,其结果是包含L1和3'侧序的嵌合片段一起插入染色体新的位置,这对新基因的形成和基因组的进化都有重要作用。
|