Alu序列
互联网
Alu 重复序列是哺乳动物基因组中 SINE 家族的一员,约有 50 万份拷贝。也就是说平均 4 ~ 6 kb 中就有一个 Alu 序列。由于这种 DNA 序列中有限制性内切核酸酶 Alu 工的识别序列 AGCT ,所以称为 Alu 重复序列。典型的人基因组 Alu 序列长 282 bp ,由两个同源但有差别的亚基构成。亚基来源于有缺失突变和点突变的 7SLRNA 基因。两个亚基间由腺嘌呤核苷酸密集的序列连接。右边的亚基中有无关的 31 bp 插入片段,称为 IH 。 Alu 序列两端各有一个正向重复序列,末端有一个 poly(A) 尾。
Alu 序列一般散在分布,少数呈簇状分布。在细胞遗传学水平上观察, Alu 重复序列集中在基因转录最活跃的染色体区段内。在所有已知的基因内含子中,几乎都发现了 Alu 序列。
与 Alu 序列亚基有很高同源性的 7SLRNA 是 7SRNA 的一部分,是将蛋白质运送到内质网以便分泌出胞外的信号识别颗粒 (signal — recognition particle , SRP) 的组成部分。 7SRNA5 ,端的 90 个核苷酸同 Alu 序列左端同源,中间的 160 个核苷酸与 Alu 序列没有同源性,而 3 ,端的 40 个核苷酸与 Alu 序列右端同源。 7SRNA 基因是由 RNA 聚合酶Ⅲ转录的。人体 Alu 重复序列绝大多数要由 RNA 聚合酶Ⅲ转录成 RNA ,而且 Alu 3 ,端有 polyA 尾,这些都提示 Alu 重复序列是通过 RNA 为中介,反转录成 DNA 后整合在基因组新位置上的。这里要提及的是,所有真核细胞里都含有 3 种 RNA 聚合酶; RNA 聚合酶 I 负责转录 rRNA 基因,产生核糖体 RNA(ribosomal RNA , rRNA) ; RNA 聚合酶Ⅱ负责转录所有编码蛋白质的基因,产生信使 RNA(messenger RNA , mRNA) ,再由多聚腺嘌呤核苷酸聚合酶 (poly(A)polymerase) 负责加上 poly(A) 尾; RNA 聚合酶Ⅲ负责转录转移 RNA(transfer RNA , tRNA) 以及细胞核和细胞质内的各种小 RNA ,这些被转录的基因一般长 300bp 左右,且在基因组的重复拷贝数可达几千份甚至上百万份。
Alu 家族不同成员之间的一致序列 (consensus sequence) 的同一性平均达 87 %。小鼠基因组内约有 5 万份拷贝的 B1 重复序列,长 130 bp ,与 Alu 的一个亚基的同源性达 70 % --80 %。
哺乳动物基因组中为什么有这么多重复拷贝的 DNA 序列,目前还不是很清楚。现已发现, Alu 序列中有一个 14 bp 的区段同乳多空病毒 (papova virus) 如 SV40 病毒,以及乙型肝炎病毒的复制起始序列几乎完全相同。这提示 Alu 序列很可能同真核生物基因组中的复制起始有某种相关,但这也存在争论。因为 Alu 重复序列的拷贝数比复制起始点的预期数多出几十倍。此外还发现,中国仓鼠的 Alu 类家族 (Alu-equivalent family) 的一些成员,当位于其他转录单位附近时,能在体内被转录生成单独的 RNA 分子。