关于Y染色体的研究
2012-08-13 15:28阅读:
一、有关Y染色体的早期研究
1、Y染色体发现及研究历程
1890年赫尔曼·亨金(Hermann Henking)观察红蝽生殖器细胞时发现 “受冷落的染色体”(wallflower
chromosome)——“X染色体”。
1890-1892克拉伦斯·麦克伦(Clarence
Mcclung)根据在堪萨斯大学对蝗虫进行的独立研究,他判断X染色体是最可能对性别遗传起作用的物质。他称,带X染色体的精子与卵子结合会生男孩,而精液中如果没有X染色体则会生女孩。也因此他果断的将X染色体定义为“雄性决定因素”(male
determining)。
1903-1912年间内蒂·斯蒂文斯(Neittie
Stevens)发现拟步甲壳虫(Tenebrio)雌性幼虫细胞总含有20条标准尺寸的染色体,而雄性幼虫的细胞只含有19条大染色体和一条细小的染色体。此外雌虫产的卵细胞总含有10条大染色体,而雄虫的精子则含有9条大染色体和一条小染色体。-----“Y染色体”。并意识到是这个小家伙而非X染色体控制性别。
艾尔弗雷·约斯特(Alfred
Jost)通过对野兔进行系列实验发现如果摘除雄兔胚胎的睾丸,会使生出的幼崽里里外外具有雌性的机体结构。唯一例外的是变性的雌兔没有卵巢。而将睾丸植入雌性胚胎中,这些睾丸就会推动胚胎向雄性机体发育。证实:睾丸这一关键器官控制了胚胎对性别的确定。
Y染色体怎样制造睾丸的?约有0.005%的婴儿与性别确定法则相悖,即XX男孩和XY女孩。--分离性别倒置者性染色体—发现与它们原来的样子不完全相同,即受到了损伤。XY女孩的Y似乎少了一块,而XX男孩的某一条X多了一块。最可惊奇的是XY女孩少的那块染色体恰恰与XX男孩多出的那块染色体差不多。―通过越来越多的研究,比较――找到Y染色体的“雄性产生区”Sry基因,“Y染色体性别决定区”(sex-determining
region on the Y
chromosome)的缩写。Sry基因只有在生殖腺里才制造相应的蛋白质,而这中蛋白质仅仅存活几天随后便消失了。故意损坏XY老鼠胚胎中的Sry基因,这些胚胎就会以“女儿身”出生;如果将Sry基因添加到XX胚
胎的染色体上时,出生的则酷似雄鼠。Y染色体—Sry—Sox9—MIS—睾丸
缺少Sry的小孩出生后是健康的女孩,而缺少Sox9基因的小孩就会严重畸形。而睾丸通过分泌激素造就男孩。
1921年, Painter报道了利用光学显微镜发现了人类细胞存在男性特有的染色体: Y染色体。
1959 年, Jacobs对Klinefelter (XXY) 性染色体构成的男性研究和Ford对Turn2er (XO)
性染色体构成的女性的研究均说明了Y染色体可能携带性别决定的关键基因。长时间以来,因为只有男性有Y染色体,人们一直认为Y染色体的唯一作用就是性别决定。
人的初级性决定中Y染色体起决定作用,睾丸分化的关键在于Y染色体的性决定基因在祖细胞系中表达,由此启动了一系列事件的发生,最后生成睾丸。最初推测Y染色体上一定存在与性别相关的基因。后来,人们证实了Y染色体短臂上有睾丸决定因子(
Testis - Determining Factor, TDF)。
1976 年,
Tiepolo等研究发现Y染色体的长臂上存在与精子发生相关的基因,从而改变了人们传统观念上对Y染色体功能单一的认识,并开创了Y染色体功能研究的新领域。
1980 年代,美国麻省理工学院的佩基(DavidPage) 领导的实验室开始用现代分子遗传学方法寻找确定男性的基因。1986
年他们发现Y染色体上一特定小段含有决定男性的基因。第二年他们认为这段里面一个特定的基因ZFY是决定男性的基因。这个结论的关键一步是依据一个病人的情况确定的。这个病人表征是女的,可是染色体看上去是XY(不是正常女性的XX)
,原来她的Y染色体有异常—上面有一小部分缺失,他们推断这个缺失应该包含了决定男性的基因。佩基等人在对应于这个缺失段的正常男性Y
染色体发现了ZFY 基因。这个结果发表后引起了轰动,很多学校和学术会议都请佩基去演讲,介绍他们的工作。
1990 年,澳大利亚女科学家格雷乌斯(Marshall Graves) 和英国的洛威尔- 巴奇(Lovell - Badge)
发现了另外一个基因SRY。这个基因最终被证明才是决定男性的基因。那么,佩基的ZFY是怎么回事呢?
原来,他们资料来源的病人比较特别,她的Y 染色体不仅在佩基1987
年看到的区域有缺损,还在另外一个区域有缺损,后一个区域包含SRY,而SRY的缺损才是她变成女性的真正原因。遭受挫折后一个被科学界和一般公众重视的结论,结果被证明是错误的,对科学家来说心里是不好受的。其后许多年,佩基不再是别人争相邀请的“热门”人物。但佩基等人并没有垂头丧气,退出研究前沿,相反他们表现得像真正的“男子汉”:首先,佩基实验室自己报告了出错的原因;其后,他们开始了其他研究,特别是Y染色体的基因组学研究。
1990年, Sinclair等从人类Y染色体上分离出了性别决定基因SRY ( Sex - Determining Region Y)
。另外,大量研究表明SRY基因是TDF的候选基因。当然,
Y染色体SRY基因对于男人的发育只是必要条件,并非充分条件,还需要一些睾丸促进因子、生精相关基因等。只有它们相互作用,最后才能刺激雄性生殖器官生成。这一过程相当复杂而严密,任何一处出现异常都会导致发育异常,最终出现男性不育。
2002 年格雷乌斯推算:人类Y染色体的灭亡时间不超过1000 万年。
2003 年6 月19 日,佩基实验室和华盛顿大学基因测序中心联合公布了Y染色体DNA
序列及其分析。对于一般的人包括一般的生物学家,有关染色体测序的文章常常索然无味,而Y
染色体的测序结果却相当有趣。可以说,文章的发表使得佩基等人走出了重大挫折的阴影。前面提到,Y染色体不和其他染色体进行DNA
重组以交换遗传物质,这是其不断走向灭亡的主要原因之一。佩基实验室的研究发现:
Y染色体有许多重复的回文结构序列,且这些重复的回文结构有重组能力,Y染色体自己的一段和另一段之间进行重组,靠这样的自我重组来获得活力。这个能力是进化过程中用来自救的重要机制。
2、Y染色体进化历程
Y 染色体是由X 染色体进化来的,Y 染色体是进化的产物。通过DNA 序列分析, 科学家已经证明性染色体来源于常染色体, 而Y
染色体来源于X 染色体。古生物学家认为Y 染色体产生在哺乳动物与爬行动物及鸟类在进化树上分开之后,距今大约3.1 亿年。
科学家描绘了人类Y 染色体由X 染色体进化来的历程: 3 亿多年前, 原始的X、Y 染色体与一对常染色体无异, 偶然地, 原始Y
染色体上的SOX3 基因发生变异形成了决定雄性的SRY 基因。其实, 原始X、Y染色体上都还存在着与SRY
基因功能类似的基因RPS4; 岁月流逝, 在距今2~1.7 亿年之间, 原始Y 染色体发生了第一次“反转”( 一种染色体内的重组,
染色体两端的序列按反向交换位置) , 反转的发生使得原始X、Y 染色体能够配对的区域迅速减少, 不能配对的区域由于不能发生重组,
导致基因的突变、序列的丢失, Y 染色体开始缩小; 接下来的400 万年中, 原始染色体又经历了一次“反转”, 当然个头也进一步萎缩;
大约1.3 亿年前, 原始X、Y 染色体端部都接受了一段常染色体的易位, 同源配对区相应扩大了, 然而好景不长, 原始Y
染色体又“反转”了, DNA 片段继续丢失, 并且发生了染色体片段“重排”, 与X 染色体差异越来越大; 后来,
原始染色体从常染色体上得到了一个精子发生基因DAZ, 并一再复制, 直到今天, 人类染色体中有4 个DAZ 的拷贝。3
亿多年的进化使人类Y 染色体成了今天的样子: 大小只有X 染色体1/3, 全身布满了反向重复序列, 只携带与雄性性别决定相关基因,
并且它们常常是多拷贝的。Y 染色体最终与它的搭档X 分道扬镳。但为什么Y 染色体要通过几次自身的反转自动放弃了与X 染色体重组的能力?
最大的可能就是为了保护业已获得了SRY 基因。试想, 如果通过重组X 染色体也获得了SRY 基因, 那么所有个体都得发育成男性,
岂不天下大乱?
3、现代Y染色体的形成机制
要形成现在的Y染色体,必须经历两个事件:原始Y染色体的退化和辜丸特异基因的获得。Y染色体的遗传退化是性染色体进化的共同特点。Y染色体某一时刻获得能产生男性特征的SYR基因,为了保留该基因,通过抑制其重组,从而逐步关闭了X一Y交换。而进化中X一Y交换的关闭引发了Y染色体基因功能的单调下降(例如13种原本在X、Y中都存在的基因在MYS的X一退化序列中已经退化为假基因),大概还有几百个其它的X同源基因从进化的MYS中被彻底删除。可见Y染色体为了保持独特的性染色体功能,除保留必要的X同源基因以保证某些持家功能外,己经退化失去大部分基因或基因功能。而X染色体维持了功能的完整性,女性中有利的染色体交换仍得以持续。Y染色体为了维持SYR的功能,必须还要获得其它基因(主要为睾丸特异基因)来提高SYR的稳定性,从而提高男性生存能力。动物基因组利用基因突变来达到这一目的,突变形成的基因对男性至关重要但对女性并非如此。Fisher很早就指出选择压力倾向于在基因组的雄性特定区域积累这样的突变基因,这一区域体现在人类基因组中即为MSY。基于这些基因在选择中存在的优势,它们在MSY中得到了保留并被大量扩增,直接导致了睾丸特异基因的多倍性,形成了现在的扩增区域。可见睾丸特异基因家族是通过选择保留和基因放大而获得。因为扩增区同一基因家族之间的分歧率比较低,可以推测绝大多数这类基因是从最近时期才获得的。Lhan和Pa朗认为MSY中基因演化主要包含三种分子机制:基因保留、NDA转座和反转座。扩增序列的几个基因簇(例如DAZ簇、RMB簇和TSYP簇)是由其它常染色体基因转座到Y染色体并随后扩增的结果,而像CYD基因簇则是由常染色体基因CYDL的mNRA进行反转座,再对反转座基因扩增而产生。转座和反转座的结果是常染色体基因到Y染色体的复制性转移,在进化中原有基因和转移而来的Y染色体基因都得以保留。
Charlesworht认为正是重组抑制导致了原始X染色体和原始Y染色体逐步分歧,可以通过分析X、Y染色体上基因对的同源编码区的分歧率来了解X、Y染色体的分歧过程。同义取代在选择上是中性的,因此同义取代率(Ks)可以将序列变异的百分比转换为大约百万年级的分歧年龄,从而估计一个基因对的分化年龄。Lahn和Page分析了19个X一Y基因对,发现Ks值可以分为四个组,各组之间的Ks值存在显著性差异。这四个组的基因按KS值的大小顺序在X染色体上沿图谱顺序分布,但在Y染色体上,各组基因的顺序被打乱。可以推断,进化中X一Y的分歧按一定时间发生在某一区域,这些区域按X染色体物理图谱顺序排列。第一组基因对属于第一个进化层,这一层最早发生分歧;而第四层的分歧是最近的事件。从表2中的KS值判断,同一层的基因对在相对较近的时间内分歧。X、Y的差异可能是在X一Y重组中止之后出现的。上述发现表明进化过程中X一Y重组是区域化抑制的,从第一层开始逐步延伸到第四层。X染色体上基因分歧年龄是有序的,而Y染色体上基因分歧年龄是无序的,这是因为Y染色体最近发生了一系列倒位事件。
二、 Y染色体的结构
1、Y染色体分带、分区
在人类46条染色体中Y染色体的大于21、22号染色体,属于G组,是近端着丝粒染色体,长臂和短臂各只有一个区,短臂只有一个带,但又分为3各亚带(Yp11.1,Yp11.2,Yp11.3),Yp11.3又分为2个亚带(Yp11.31,Yp11.32);长臂分为2个带(Yq11,Yq12),Yq11分两个亚带(Yq11.1,Yq11.2),Yq12分为三个亚带(Yq11.21,Yq11.22,Yq11.23)。
Y染色体长度约为60Mb,由拟常染色体区和Y 特异区组成。拟常染色体区(pseudoautosomal region , PAR)
位于Y染色体两端即PAR21 和PAR22 , 在男性减数分裂过程中, 可与X 染色体发生重组,其占Y染色体全长的5%。占Y
染色体全长95%的是为决定男性特征的特异区域(the male- specificregion of the Y
chromosome,MSY)该区域由于不存在X-Y交换,曾被命名为非重组区域(NRY),但是研究发现这里有大量的重组,故而又称其为男性特异区域(MSY)。
MSY的常染色质序列长度约为23Mb,包括短臂(Yp)上的8Mb和长臂(Yq)上的14.5Mb。目前完成的序列大约占MSY的97%,其中错误率为1/
。
Y染色体的异染色区域主要包括三部分:1、着丝粒异染色质,约1Mb;2、长臂远端异染色质,约40Mb;这两个异染色质区域主要由低序列复杂性的串联重复序列组成。第3个异染色质区域是一个边界清晰的岛,覆盖了大概400kb的长度,包括3000个以上125bp的串联重复,该区域使得长臂近端的常染色质序列被打断。
2、MSY结构
MSY区域主要包括三类常染色质序列:X转位、X退化、增值子区域。可以认为MSY的常染色质是这三种序列的嵌合体。三类序列包含了所有156个已知转录单元,其中78个蛋白质编码基因,共编码27种不同蛋白质。在MSY的异染色质区域未发现任何转录单元。在约78个蛋白质编码单元中,又有60个属于9个不同的MSY特异性基因家族。家族之间,无论是内含子还是外显子都具有98%以上的核苷酸序列一致性。剩余的18个蛋白编码基因以单拷贝形式存在于MSY中。因此,MSY可能编码至少27种蛋白质或蛋白质家族。另外78个目前尚未找到编码蛋白质的转录单元,因此其中大多数可能是非编码的。这78个转录单元中,13个在MSY上是单拷贝的,剩余65个属于15个MSY特意的家族。因此,到目前为止,算上编码与非编码的转录单元,MSY可能包含24个MSY特异的家族,共占156个转录单元中的125个。
MSY上的大多数基因属于两类功能:第一个功能群中的基因在身体的大多数器官中都有表达,而第二个功能群中的基因主要或专一的在睾丸中表达。现在所识别的27个不同的MSY蛋白质编码基因或基因家族中,12个的表达广泛,而另外11个主要或专一的在睾丸中表达。
2.1.X转位序列
X转位序列与Xq21的序列99%一致。之所以以X转位序列命名是因为它们在人类MSY中的存在是在300万-400万年以前,人类与黑猩猩分离后,一个大范围的X到Y的转位的结果。随后,MSY的短臂上又发生了一个倒位从而将X转位区域一分为二,成为了两个不连续的片段,也就是现在这种状态。在男性减数分裂中X转位序列是不参与X-Y交换的,在X转位片段中有一长度为3.4Mb的序列,在其中仅仅识别出两个基因,都在Xq21中存在同源物。因此,在三种MSY常染色质序列中,X转位序列的基因密度最低,但是其散在重复序列的密度最高。特别是长散在重复元件1(LINE1)占了X转位序列的36%,这一比例几乎是基因组平均比例20%的2倍。正如预期的那样,Xq21中的同源序列同样是低基因密度、高重复序列。
2.2. X退化序列
X退化序列是现代X、Y染色体进化祖先的残留。X退化区段散布着与27个不同的X连锁基因同源的单拷贝基因和假基因。这些单拷贝基因和假基因与其X连锁同源物的核苷酸序列一致性分别是60%和96%,如后面所揭示的那样,似乎在X、Y染色体由它们的祖先常染色体共同进化的过程中,仍然没有退化掉。13个MSY的假基因的序列与其X染色体同源物的内含子和外显子都很相似。剩下的14个为可转录的功能基因,它们与X连锁同源物的编码非常相似,但是其蛋白质亚型并非一致。其中MSY上有两个与一个X连锁基因同源,Y连锁基因RPS4Y1和RPS4Y2是X连锁基因RPS4X的全长同源物,它们显然能够编码两种不同的全长亚型核糖体蛋白S4。相比来说,Y连锁基因Cyorf15A和Cyorf15B分别为X连锁基因CXorf15B的5’和3’部分的同源物,它们显然分别编码CXORF15B蛋白的氨基和羧基末端部分的同源物。总体来说,X退化序列能够编码27个不同蛋白质或蛋白质家族中的16个。尤其注意的是,所有的12个广泛表达的MSY基因都位于X退化序列区域。而11个主要和专一在睾丸中表达的基因中。只有一个基因——性别决定基因SRY是退化序列区域特异性的。
2.3. 增值子区域
增值子区域约占MSY常染色质的30%,该区域主要特征是有8个大的回文结构,
其中至少有6个包含睾丸相关基因。增值子区段是具有相同标记的稳定的长序列,相对于MSY的其它序列来说,几十或者上百kb的序列具有99.9%的序列一致性。我们将这些长的MSY特异性的重复单元成为增值子。增值子定位于7个离散分布在常染色质长臂或短臂极端的区段中,它们的总长为10.2Mb。在三种MSY常染色质序列中,增值子序列具有最高的基因密度,包括编码基因和非编码基因。其中包含9个不同的MSY特异性蛋白质编码基因家族,其拷贝数从2(VCY、XKRY、HSFY、PRY)到3(BPY2)到4(CDY、DAZ)到6(RBMY)一直到大约35(TSPY),这些拷贝数对所测序的染色体来说是特异的,因为在人群中它们会发生变化。这九个编码家族包含了大约60个转录单元。另外,增值子序列包含了至少75个其他的转录单元,没有有力证据证明这些转录单元会编码蛋白质。在这75个假定的非编码转录单元中的65个属于15个MSY特异家族,剩余的10个属于单拷贝。综合所有的编码和非编码元件,到目前为止,增值子序列涵盖了156个MSY转录单元中的135个。不同于大多数X退化基因的广泛的表达,增值子基因和转录单元的表达式高度限制性的。增值子区域的所有9个蛋白质编码家族都是主要或特异的表达于睾丸中,并且大多数的非编码转录单元也是这样。在三类常染色质序列中,到目前为止,增值子序列的LINE1和总散在重复元件的密度最低。事实上,MSY增值子序列的散在重复含量(35%)远低于人类基因组的平均水平(44%;z检验,p<0.000001)。
2.4.回文序列
Yq上的增值子区域最显著的结构特征是8个回文结构。每个回文序列的左右臂之间有着高度对称性,序列一致性在99.940%至99.997%之间。这些回文结构很
长,它们的臂的长度为9kb-1.45Mb。它们的缺陷在于每一个回文结构的中部都存在一个独特的、非双倍间隔区,长度为2~170kb。完美的回文结构指的双链DNA的每一条链按5′到3′方向读都具有相同的碱基顺序。Y
染色体的8个回文都不是完美回文,其中心均存在一个无回文结构的间隔区域【图1(A)】。
1997 年,Akgün
等的研究结果显示:完美回文序列并不稳定,通常需要借助一种不对称的删除方式来破坏回文序列的中心对称性,以提高其稳定性。这8
个回文序列按Y 染色体长臂(Yq)到短臂(Yp)的方向分别用P1~P8
表示,其分布见图1(B)。回文结构P1特别巨大,长度达2.9M并且在它的臂中还包含了两个二级回文结构(P1.1和P1.2,每一个长度达到24kb)这8个回文结构总长5.7Mb,是MSY常染色质的1/4。
8个回文序列中的6个具有蛋白质编码基因,共包含8
种控制睾丸发育的基因家族(几乎全占MSY上发现的有9个多拷贝编码蛋白质的基因家族,而且有6个家族是特异的定位于回文序列,这其中包括DAZ基因,它有4个拷贝(2个在P1上,2个在P2上);还包括CDY基因,它也有4个拷贝(2个在p1上,2个在P5上)。除此之外,至少有7个非编码转录单元家族在回文结构中,所有的都是主要或特异的表达于睾丸中。),其中的基因突变或片段删除会导致精子产生障碍症。男性在漫长的进化之中保持相对稳定性,回文序列发挥了重要的作用。序列比较分析发现,在人类和大猩猩的直系同源回文臂之间有1.44%的序列分歧率,这是自然突变积累的结果。而人类或大猩猩的回文序列左右臂之间的分歧率非常相近,不超过0.03%,远远低于自然突变产生的分歧率。因此可以推测,回文序列的形成先于人类和大猩猩世系的分化,而后两个世系的回文序列左右臂在进化中按照同一种机制保持一致。回文序列左右臂近似一致可能是基因转(geneconversion)的结果。基因转变就是遗传信息从一条DNA
链到另一条NDA 链的非交互转移(the non-reciprocal transfer)。通过检测回文序列P1
上的两个对称位点(分别为两个CDY
基因+381位点)发现,回文序列任一条臂可以作为母体导致另一条臂的基因转变,从而在进化过程中保持左右臂序列的一致性。正是由于回文序列的两臂对应序列的互补一致性,因而能够在内部完成“基因转变”过程,对基因变异进行修复,从而保证了Y
染色体回文区内基因的相对稳定性。据计算,Y 染色体回文内部基因转变的发生频率与一般染色体间的基因交换频率一样高,从父代到子代Y
染色体会有600 个碱基对被“重写”。 AZFc 区删除中的一种回文重组机制导致男性不育的精子缺乏症的异常区域有3种分布,
分别命名为: AZFa、AZFb 和AZFc(azoospermia factor c)[6],这3 种分布均出现在Y
染色体的长臂上。研究显示,AZFc 删除出现得最频繁,其中涉及的一种回文重组机制有助于我们更好地认识和理解Y
染色体上回文结构的形成规律。
2.5.AZFc区域
AZFc 区域(1976 年,
Tiepolo等通过细胞遗传学研究发现无精子症患者有Y染色体长臂缺失,推测Y染色体长臂上存在“精子生成基因”,由于他们是对无精子症患者进行研究,因此命名为无精子因子(
azoospermia factor, AZF)
。近年来,与男性精子发生相关的基因研究日益深入和广泛。无精子因子AZF位于Yq11,并在睾丸中特异性表达。1992年,Vogt等发现有许多位点与精子发生相关,其中最主要的是AZF上互不重叠的三个区段,包括:
Y染色体近段、中段和远段,分别称为AZFa、AZFb和AZFc。1999年, Kent -
First等报道认为在AZFb和AZFc还应该有一个基因,命名为AZFd。AZFa位于Yq11区域,大约400 - 600kb。目前,
UPS9Y( ubiquitin - specific p rotease 9, Y)基因和DBY( dead box Y
-pollible belicase) 基因被认为是AZFa 的重要候选基因。AZFb位于Yq11. 23的近端区域, RBM
(RNA bindingmotif)基因被认为是AZFb的主要候选基因。AZFc位于Yq11. 23的远端区域,DAZ (
deleted in
azoospermia)基因被认为是AZFc的重要候选基因。还没有发现AZFd的候选基因。SRY基因作为睾丸决定因子TDF的候选基因于1990年被Goodfellow定位在Y染色体短臂上。在性腺中,
SRY基因若发生突变,不能产生睾丸决定因子,导致未分化性腺的中胚层发育成卵巢,使胎儿雌性化,刺激生成雌性生殖器官,发育成表型女性。)由6
种独特的扩增子家族构成,
涉及Y 染色体中的P1、P2 和P3 ,3 个回文,这3 个回文含有5
种在睾丸中表达的蛋白质编码基因和一些不编码蛋白质的转录单元。这儿提到的扩增子是分布在Y
染色体扩增序列区的一种广义的重复单元,每一种扩增子家族由许多正向和或反向重复序列组成。正是由于分布在AZFc
区域两端的扩增子出现删除情况,造成基因失活,从而导致了精子缺乏症。Kuroda- Kawaguchi 等[7] 根据实验结果以及其中3
个Alu 元件(Alu element)的核苷酸序列的位点比较,提出了形成回文P1 的一种重组模型。该模型提出,先由6 种扩增子构成2
个较长的重复单位,然后分别在前一个重复单位中的Alu 元件A2 位点处和后一个重复单位中的Alu 元件A1
位点处进行剪切,最后将两个重复单位的切开处串连黏合(其中黏合点A2/1 的序列由A2的左半段和A1
的右半段组成)。黏合后的整段序列按照所包含扩增子的互补关系形成局部的发夹结构,发夹部分倒置后就形成了现在的回文P1。
图中不同图案的箭头代表不同的扩增子家族。通常在回文区内或附近的重复序列的同源重组很频繁[8],而这些重组事件能导致回文序列以重复延伸的方式进行扩张[9]。我们这儿提到的AZFc
中的这种回文重组机制实际上就是从小回文重组形成大回文的一种过程。正是借助于Y
染色体扩增区不同扩增子家族之间的组合,增加了这一过程发生的可能性,使得Y
染色体中的回文P1成为目前在自然界现存生物体基因组中发现的最大的同时也是两臂序列一致性最高的一个回文。回文结构之所以有如此显著的对称性,与其形成机制密不可分。对回文结构形成机制的研究已成为当前的一个热点,相关研究提出了一些可能的机制,这些机制主要还是以反向重复作为回文结构生长和重组的基础,但从根源上去探索回文结构的最初形成机制并无突破性进展。只有从根源上搞清其形成机制后,才能对回文结构和功能之间的关系有更深层次的理解,才能解开性别存在和延续的谜底。因此,对回文结构的形成进行全面深入的研究,揭示其中隐含的数学、物理和生物学机制,是我们面临的挑战和机遇。
2.6. 反向重复序列(IR)
除了8个回文结构外,Yq和Yp的增值子区域包含5套范围很广的反向重复序列(IR),其结构特点与回文序列基本一样,不同的是反向重复被间隔区更大程度地分割开来,序列一致性也相对较低。其长度为62~298kb,这些反向重复序列中的3个(IR1、IR2和IR3)的核苷酸一致性达到99.66%~99.95%。IR3重复的翻转,都定位于Yp,可能是将X转位序列分成两个不连续的区段的进化过程的直接结果。
2.7. 串联排列(NORF排列yuTSPY排列)
除了回文结构和反向重复,Yp和Yq上还包含了大量的串联排列。其中最主要的是新发现的NORF(非长刻度框)族和先前报道的TSPY族,其中前者位于Yp和Yq,总长度达到622kb,后者位于Yp,长度为700kb。
NORF排列是由一个2.48kb的重复单元组成。我们很容易识别到该重复单元的一个共有序列,但是这个独立重复单元的序列与该共有序列存在14%~20%的差异。之所以称为NORF排列,是因为它包含了大量的经过剪切但是不编码蛋白质的转录单元,这些转录单元包括TTTY1、TTTY2、TTTY6、TTTY7、TTTY8、TTTY18、TTTY19、TTTY21和TTTY22家族。NORY排列的所有铰链区都能够被转录,TTTY1和TTTY2的3’端区域是互补的。
TSPY排列是由一个20.4kb的重复单元组成,其中一个铰链区能够编码一个早就被发现的蛋白质TSPY。一个新发现的转录单元Cyorf16,位于相对的铰链区上,它的蛋白质编码情况需要进一步研究。在Yp近端的一个独立的高度规则的串联排列上大约有35个该重复单元,因此也就存在35个TSPY基因和35个Cyorf16重复单元,这里独立的重复单元的序列差异都不大于1%。而且,一个相对独立的TSPY族重复单元定位于Yp上更靠近远端的地方,包含在IR3反向重复的远端内,它与通常的序列间的差异达到3%。上面所提到的35个单元组成的TSPY族是到目前为止在人类基因组中发现的最大的、同源性最高的蛋白质编码串联排列。
2.8、Y结构特点及研究价值简述
截止2006年12月,在Y染色体上约有115个编码蛋白质基因列在基因库中。在MSY区域约有156个转录单位,其中78个基因共编码27种蛋白质,其中16个蛋白质,位于无精症因子区(
azoospermia factor, AZF) ,与精子的发生密切相关
。人类Y染色体结构具有鲜明的特点:大量的回文结构和重复序列或拷贝。人类Y染色体与其它染色体相比所含基因最少,但其重复序列的发生比例却最高。Y染色体基因多以多拷贝的形式存在,如VCK、XKRY、HSFY、PRY
基因等为2 拷贝; B PY2 基因3 拷贝;DAZ、CDY基因4拷贝、RBM Y基因有6拷贝;
TSPY基因约有35拷贝。人类Y染色体有独特的短串重复序列2微卫星DNA和中度Alu家族重复序列,可能是人类进化的产物。57Mb的Y染色体(Y染色体共长60Mb)序列是作为一个单倍体型遗传的。Y染色体单倍体型或称Y染色体家系是指从单进化枝得来的Y染色体[
14 ] 。使用一些分子标记(例如单碱基突变或插入/缺失标记)
,能够分辨出不同位点的Y染色体单倍体型。而Y染色体上存在着高度变异的标记,使用变性高效液相色谱,可将人类的Y染色体分为153个单倍体亚型。在人类基因库中列出的Y染色体结构,属于Y染色体单倍体亚型R1。由于Y染色体单倍体型分布于人种之间,在不同的人种中,一种表现型(例如某种疾病)与某种Y染色体基因背景的联系可能会有所变化。因此,不同的Y染色体单倍体型之间,对致病基因的临床反应会有所不同。
通过Y染色体基因组学的研究,我们对Y染色体本身的特点、Y染色体进化以及Y染色体微缺失与男性不育的关系有了全新认识。作为一条高度特化的性染色体,
Y染色体呈现高度的多态性。我们现在知道,相同的Y染色体微缺失,可引发男性不育,同时也可以不引起任何临床症状。根据这些特点,我们可以利用现有的分子生物学手段,研究Y染色体基因之间,性染色体基因之间以及常、性染色体基因之间对男性不育的调控机制,揭示男性不育的深层次分子机制,为提高男性生殖健康水平作出贡献。
三、Y染色体正在消亡理论及证据
19世纪60年代Ohno提出哺乳动物的X、Y染色体是由一对普通的常染色体进化而来。Ohno推测X染色体保留了原始常染色体的基因而Y染色体除了一个性别决定基因以外,丢失了所有的祖先基因。因此Y染色体别认为是一种高度退化的X染色体。
由于Y染色体主体部分的Y特异区在减数分裂时没有和X染色体重组,(事实上,配对染色体之间的重组可以使染色体上出现坏的突变后容易被进化选择而淘汰,从而保持染色体的“活力”。而在这方面,Y染色体并不具备这样的“更新”能力)因而除突变外,同一父系的所有男性个体都有相同的单倍型。精细胞是人类遗传变异的主要来源,而Y染色体重组能力下降,不能有效更正突变了的基因,结果会导致Y-DNA链不断毁坏和缩短。其次,由于Y染色体是通过男性精子传给下一代的,一个30
岁男性的精子DNA 复制次数,比卵子多了350
次。染色体每多复制一次,发生基因突变的可能性就大一点。基因突变会使新一代Y染色体不能百分之百的遗传上一代Y染色体的功能,这样,经过一段时间后,原始Y染色体的功能就会不复存在。可以说Y染色体上基因突变造成的损失是永久性的,并且会在男性中代代遗传下去。第三,对于在DNA
自我复制过程中造成的丢失, Y 染色体也不能像其他染色体那样通过配对重组的方法来相互弥补损失。由于Y
染色体重组能力下降,不能有效更正出了问题的DNA ,会导致DNA
链不断毁坏和缩短,从而使Y染色体上的基因逐渐丢失。依据这样的理论,以英国爱丁堡大学遗传学家布瑞恩·查尔沃斯为代表的研究人员提出了Y染色体消亡论:认为Y染色体上的基因突变造成的损失是永久的,并且会在男性中代代遗传下去,这样,经过一段时间后(约500万年),原始Y染色体的功能就不复存在,最终Y染色体从地球上消失。如果这一切成为现实的话,即使不会给人类带来灭顶之灾,也会导致种属变化,也就是说人类将变成与现在不同的另一类物种。
然而,人类基因组计划启动后,以Skalctsky为代表的研究人员提出反对Y染色体消亡论。研究发现Y染色体的结构有两个显著的特点:(1)含有大段的重复区域,这些重复很可能是为了确保这些基因不丢失的一种保护机制。(2)这些基因以回文结构排列,这种以回文结构排列的基因具有修复突变的作用,使Y染色体拥有了自我保护能力。
但坚持消亡论的格雷夫斯说:“他们会说, Y
染色体确实是在进行基因转换。但我认为它不是真正的性基因,只是染色体正在进行的‘基因自我转换’。我认为这项工作很了不起,但在解释上出现了错误。我认为这一过程并不能修复Y染色体,消除基因变异,因为健康的基因可能会被变异基因而不是其他方式所替代。事实上,
Y
染色体上还有几个序列的无用基因,我认为这些基因就是在这一过程中产生的。”格雷夫斯在《繁殖、生育和发育》杂志上发表的一篇论文称,“也许基因转换甚至会加快Y染色体消亡速度,使新的性染色体变异早日出现。”
另外随研究表明Y 染色体内部基因转变的发生频率与一般染色体的基因交换频率一样高。仅从父亲到儿子的一代遗传中, Y 染色体就会有600
个碱基对被“重写”。不过, 虽然回文结构能使基因得到修复, 但这种重复的结构也使基因更易丢失。