长散在重复序列
互联网
长散在重复序列 (10ng interspersed nuclear elements , LINE) ,意为散在分布的长细胞核因子,是散在分布在哺乳动物基因中的一类重复序列,这种重复序列较长;另一类短散在重复序列的细胞核因子称为 (short interspersed nuclear elements , SINE) 。 LINE 是可以自主转座的一类反转录转座子,来源于 RNA 聚合酶Ⅱ的转录产物; SINE 则是非自主转座的反转录转座子,来源于 RNA 聚合酶Ⅲ的转录物。 L1 是 LINE 中的一种重复序列,长约 6 500bp ,哺乳动物基因组中的拷贝数可多达 10 万份,主要集中在 AT 富集区。 L1 以及由 L1 编码的反转录酶作用于其他非自主反转录转座子以后所生成的 DNA 序列,加起来至少占人类基因组全长的四分之一。 LINE 不同成员之间的序列有较大差别,但是同一物种中的 LINE 的不同成员仍有较大的同源性。
LINE 有分别长 1 137bp 和 3 900bp 的可读框,这两种可读框有 14bp 的重叠序列。从 LINE 的结构分析,它并不具有反转录病毒特有的 LTR ,因此曾把 LINE 归于非病毒超家族。测序的结果发现 LINE L1 的一个可读框同反转录酶是同源的,这提示 LINE 可能来源于能够编码转座所需的酶进行自主转座的可动元件,所以现在在分类时被归人病毒超家族。 1988 年,人们第一次认识到可动元件可能是人类疾病的一种致病因素。当时在血友病 A 的凝血因子Ⅷ基因中发现了两个截短的 L1 ,后来在凝血因子Ⅷ的基因中又发现了一个反转座的 L1 插入片段。进行性假肥大性—肌营养不良 (Duchenne ’ smuscular dystrophy , DMD) 基因中有三个 L1 ,肠道癌的致病基因 APC 以及夕—珠蛋白基因中也都发现了 L1 。已发现的致病的 L1 插入片段绝大多数出现在生殖细胞或早期胚胎中。 APC 基因中的 11 插入片段则是在结肠癌中发现的。这表明 L1 的反转座作用也可以发生在体细胞中。 L1 的插入有以下两个,结构特征:①已发现的每一个插入片段的序列都各不相同,这表明它们是分别来自不同的原初元件 (progenitor elements) ;②上面提到的已发现的 8 个 L1 插入片段中,有 7 个是 5 ,端截短的,其长度变化很大,从 538bp 到 3 . 8 kb ,但是所有这些 L1 插入片段的蛋白质编码区都保持完整;插人口—珠蛋白基因的 L1 是全长的。这些数据提示,并非所有具诱变作用的 L1 片段在插入后都不再移动了,有些片段很有可能仍保持再次反转录转座的能力。例如,小鼠的全长 L1 插入片段,确实能再经历几轮的反转录转座。
L1 插入片段的全长原初元件可能是哺乳动物中有活性的反转录转座子的来源。 L1 被认为是人类基因组中主要的可动因子,它不仅能自主转座,而且它的蛋白质产物可促使非自主转座因子的反转录转座。同时 L1 还能十分有效地将位于 L1 3 ’端的侧序一起转座到新的位置,这种作用称为 3' 转导 (3'transduction) ,其结果是将宿主基因组中原先不连锁的两个 DNA 片段排列在一起。许多真核细胞中都发生 3' 转导作用。当 L1 本身的转录终止信号较弱而 3' 侧序中有很强的转录终止信号时, RNA 聚合酶进行 L1 转录时就会发生“连读” (read-through) ,而将 11 ’和 3' 侧序一起转录,其结果是包含 L1 和 3' 侧序的嵌合片段一起插入染色体新的位置,这对新基因的形成和基因组的进化都有重要作用。