Alu家族 Alu family
互联网
人类的 Alu 家族和小鼠 B 序列家族是十分典型的分散基因家族。
在人类的基因组中有一种中等重复序列,长约 300bp , 30 万个成员分散分布在单倍体基因组中,在其 170bp 处有一个限制性酶 AluI 的酶切位点,故称这个重复序列为 Alu 基因家族( Alu family ),大约平均每隔 6Kb 左右就有一个 Alu 序列,因此它可能含在内含子或基因附近的序列中。因此它可作为人类 DNA 片段的特异标记。
Alu 家族的每个成员彼此都很相似,由 130bp 的串联重复序列而组成,在二聚体的右半个中部有 31bp 无关的序列插入在里面。这个插入序列来自 7SL RNA (是信号识别蛋白 SRP 的一个成分)。 7SL RNA 长 300Nt ,其 5’ 端的 90Nt 和 Alu 序列左端同源,其中央的 160 个碱基和 Alu 并不同源,而 3’ 端的 40 个碱基和 Alu 右端同源。
Alu 家族的成员和转座子相似,两端有短的正向重复序列存在了。然而十分奇怪的是 Alu 家族的每个重复片段的长度不同。因为它们可能有 RNAPolIII 转录而来,所以每个成员可能带有下游启动子。
Alu 家族的广泛存在意味着它具有某种功能,。只是目前尚未能搞清楚。部分 Alu 序列中有 14bp 区域和乳头瘤病毒乙型肝炎病毒的复制起始区有同源性,因此人们推测 Alu 家族可能和真核基因组的复制区相连接。但与此相矛盾的是 Alu 序列的成员数要比推测的复制区多 10 倍。
Alu 家族的某些成员能在体外由 RNA Pol III 转录成 SnRNA ,在中国仓鼠中, Alu 家族成员可以转录。其转录本常在其它转录单位的边上。
在小鼠中有和 Alu 序列同源的序列称为 B1 基因家族,约有 5 万个成员。但在中国仓鼠中仍称 Alu 序列。 B1 的重复单位长 130bp ,相当于 Alu 序列的一个单体,和 Alu 序列的同源性约 70~80% 。 Alu 序列也称为短的分散因子( short interspersed elements, SINEs )。
它是由 RNA 多聚酶 III 转录的。在哺乳动物中还有另一种长的分散因子( long interspersed elements, LINEs ) RNA 多聚酶 II 转录的。如 L1 长 6500bp 左右,在基因组中约 6 万个拷贝。属于一种转座因子。
在每一种哺乳动物中只有单个 LINEs 家族。在不同物种中的 LINEs 家族之间具有较高的同源性,至少在一个家族中有的 LINEs 是编码蛋白质的,但这种蛋白尚未描述过。
所有真核生物中都具有 SINEs 和 LINEs ,但有不同的比例,例如果蝇和鸟类含 LINEs 较多,而在人类和蛙中则含 SINEs 较多。