基因组重复序列分类
2017-05-24 21:15阅读:
重复序列:串联重复序列和散在重复序列
一、卫星重复序列
又称串联重复序列,常集中的分布在基因组上特定的位置。
依据其单元的长度分类: 1.
巨型卫星重复序列:上千碱基对,少见,D定位定的着丝粒;
2.卫星重复序列:一百到几百个碱基对,存在广泛,物种间差异大,常出现在近端粒、着丝粒和近着丝粒区域;
2.1
可分为:定的着丝粒重复序列、近端粒卫星重复序列、近着丝粒卫星重复序列;
2.2
产生方式:不均等的重组交换,滚环扩增,复制滑动或者突变;
3.小卫星重复序列:几十个碱基对;
4.微卫星重复序列:常为到2到6个碱基对,作为分子标记SSR;
3及4一个区域内累积0.5-30kb,变异大,超变异位点就成了很好的多态性标记,适合基因型分析;
二、散在重复序列
多是失活的各种可转座元件,分为转座子和还原转座子。
1.转座子
按其在转座时切开的链数可以分为两类:
1. 1.在转座时从其反向重复末端(terminal inverted
repeats,TIRs)处进行典型“剪切“,产生一个和供者完全一样的拷贝,TIRs长度是不同;
1.1.1 序列和靶标序列复制的长度可以分为九类,分别为:Tc 1-Mariner,hAT,
Mutator, Merlin, Transib, P, PiggyBac,
Pic-Harbinger和CACTA;
1.1.2.转座时并不切幵双链,复制粘贴只涉及一条链的错误定位,主要有两类:Helitron(滚环复制)和Maverick;
2.还原转座子,转座时要通过作为中间过程,每次产生一个新的拷贝;
按照其转座机理,基因组构成和反转录酶的系统进化关系,可以将其分为大类:
2.1
长末端(LTR)还原转座子,完整元件的两端是完全一致的长末端重复;
2.2
类DIRS元件,元件并没有而有酪氨酸重组基因,转座并不产生TSD。两类末端,一类是断裂正向重复,—类是反向重复;
2.3
类Penelope元件,域编码的逆转录酶和端粒酶有更大的相似性,且其内切酶与内含子编码的内切酶和细菌修复蛋白有关;
2.4
LINES,长散在元件没有长末端,重复,古老,存在所有真核生物基因组,传统分5大类:R2,
L1, RTE, I和Jockey;自主的LINES至少需要编码和核酸酶;
2.5
SINEs,短散在元件,长度在80-SOObp之间,转座后产生5-15bp的TSDs,非自主转座,由多种聚合酶介导的随机转座;内含有聚合酶III的启动子序列,
依赖的LINES顺式调控,eg. Alu;