《我上遗传学》之四:染色体结构变异--吴燕华
2019-03-13 17:58阅读:
染色体畸变(chromosome aberration)中的结构变异(structural variation,
SV)是经典遗传学教材的重要内容之一,指的是染色体结构的大片段改变,包括重复(duplication)、缺失(deletion)、倒位(inversion)和易位(translocation)等(图1)。在过去的课堂上,我重点讲解“什么是结构变异”以及“不同结构变异的区别与联系”。近年来,随着医学遗传学和基因组学的不断发展,我尝试和学生们深入讨论“基因变异与结构变异的区别”、“结构变异从哪里来?”以及“结构变
异的遗传学效应”等问题。
我希望在思考这些问题的过程中,学生们能够更加深刻地领悟研究染色体结构变异的重大意义。
1. 遗传变异的定义与分类在很大程度上取决于技术的发展
我在教学中发现,不少学生将“基因变异”与“染色体畸变”错误理解为基因组遗传变异中非此即彼的两种类型。但事实上,遗传变异的分类与遗传变异的检测技术密切相关。传统的遗传变异检测方法包括Sanger测序和核型分析(图2)。Sanger测序能够发现微小的变异(通常小于1kb)。这些突变通常位于单个基因内部,所以称之为基因变异。但也可能出现因为变异所在的基因组位置特殊,涉及多个基因或位于基因间隔序列的情况。核型分析是借助染色体显色技术和光学显微镜发现的染色体变异。由于显色技术和显微镜分辨率等技术瓶颈,这种方法适用于检测较大尺度的变异(通常大于3Mb)。那么问题来了,介于1
kb 和 3
Mb之间的遗传变异是否存在呢?答案当然是肯定的。
随着现代生物学技术的发展(图3),一大批新技术如比较基因组杂交(comparative genomic
hybridization, CGH)、SNP芯片等能够有效检测介于1 kb ~ 3 Mb之间的多种遗传变异,我们称之为亚显微水平(submicroscopic)的结构变异。也就是说,遗传变异可以发生在从单个核苷酸到全基因组的不同尺度上,但需要不同技术方法进行筛选。
2. 染色体结构变异的产生机制包括非等位同源重组和非同源末端连接等。
棒眼果蝇是染色体重复的经典案例,纯合棒眼果蝇自交可以得到一定比例的重棒眼果蝇,这是由于非等位的棒眼基因之间发生了不等交换,得到了一条有三拷贝重复的染色体,表型也更严重。不等交换,现在被定义为非等位同源重组(nonallelic
homologous
recombination,NAHR),它是包括重棒眼基因变异在内的染色体结构变异的产生机制之一。如图4所示,发生在同源染色体上一对正向重复序列之间的NAHR可以造成一条染色体的重复和另一条染色体的缺失;发生在一条染色体上一对反向重复序列之间的NAHR可以造成倒位;发生在非同源染色体上的NAHR可以造成相互易位。值得注意的是,基因组中大量存在的Alu、LINE-1、LCRs等重复序列是发生NAHR的重要前提。除了NAHR,非同源末端连接(non-homologous
end joining, NHEJ)是另外一种重要的染色体结构变异的产生机制,它是染色体出现双链断裂后的另一种重要修复途径。如图所示,非同源的DNA断端错误地相连,也可以形成重复、缺失、倒位和易位等。此外,复制叉停顿和模板转换(Fork
Stalling and Template Switching,
FoSTeS)和反转录转座(retrotransposition)也是结构变异的形成机制。
3. 染色体结构变异是人群常见遗传变异的重要组成
1997年,遗传学家Collins等人提出了常见疾病,
常见变异(common disease, common variant, CD-CV)的假说。假说认为常见疾病的易患性和耐药性是由于人群中的常见变异引起的。为此,在人类基因组计划之后,“单倍型图谱计划”(Haplotype
Map Project)和千人基因组计划(1000 Genome Project)都以检测人群遗传变异为主要目标。研究发现,基因组内除了拥有大量单核苷酸变异(Single
nucleotide polymorphism, SNP)之外,还有相当数量的InDel(2-100bp的插入和缺失)、简单序列重复(微卫星等)以及拷贝数变异(copy
number variation, CNV)等,它们都是人类基因组遗传变异的重要组成(图5)。
其中,CNV正是一种新颖的染色体结构变异的重要类型(图6),它指的是长度在100 bp以上的基因组片段的拷贝数目的变化(相比于参考基因组),属于上文所说的亚显微水平的结构变异。根据DGV数据库(http://dgv.tcag.ca)的统计,当下人类基因组已报道的CNV已超过55万个(长度从100bp到几个Mb),覆盖了79.55%的人类基因组(注:由于目前检测平台的局限,可能有一定程度的偏差)。CNV虽然在数量上不及SNP(6.6╳108,数据来自dbSNP),但是涉及的基因组范围更广,且新发突变频率更高,强烈提示了它在人群遗传差异中的重要贡献。
另一方面,发生在基因区域的CNV可能会改变基因的剂量或原有阅读框,又或改变调控元件的数量与结构,从而影响基因产物形式或表达水平,诱发临床疾病表型。例如15q11–q12的母源性丢失可造成Angelman综合征,父源性丢失可造成Prader-Willi综合征等(注:该区域存在基因组印记,因此会因缺失染色体的亲本来源不同而有表型差异)。由于这些CNV能够直接致病,它们在人群中的频率也使极低的。如何判断人群中不同频率、不同基因座位的CNV有无致病性或是否易感风险仍然是当下人类医学遗传学的研究重点。
参考资料:
1. 刘祖洞,乔守怡,吴燕华,赵寿元。遗传学(第3版),高等教育出版社,2013。第十章、第十四章。
2. Anthony JF
Griffiths, Suan R Wessler, Richard C Lewontin, Sean B Carroll. An
Introduction to Genetic Analysis, 9th edition. W. H. Freeman and
Company, 2008. Chapter 17.
3. Leland H.
Hartwell, et al. Genetics: From Genes to Genomes, 4th edition,
McGraw-Hill Companies Inc. 2011. Chapter
11.
4. Lupski JR,
Stankiewicz P. Genomic disorders:
molecular mechanisms for rearrangements and conveyed
phenotypes. PLoS Genet.
2005;1(6):e49.
5. Feuk L,
Carson AR, Scherer SW. Structural
variation in the human genome. Nat
Rev Genet. 2006;7(2):85-97.
6. Zhang F, Gu
W, Hurles ME, Lupski JR. Copy
number variation in human health, disease, and evolution.
Annu Rev Genomics Hum Genet.
2009;10:451-81.
7. Conrad DF1,
Pinto D, Redon R, et al. Origins
and functional impact of copy number variation in the human genome.
Nature. 2010;464(7289):704-12.
【作者简介】
吴燕华,女,1982年10月出生,中共党员,正高级讲师,硕士研究生导师,上海市五一劳动奖章获得者。复旦大学生物科学国家级实验教学示范中心副主任,生命科学学院教学指导委员会委员。
主讲
“遗传学”、“基因工程实验”等课程,主持多项上海市级教学改革项目。以共同主编出版教材3部,其中《遗传学》第3版(刘祖洞、乔守怡、吴燕华、赵寿元。高等教育出版社,2013年)获得“国家十二五规划教材”和“上海市普通高校优秀教材奖”。2014年获得全国高校青年教师教学竞赛一等奖(理科组),2017年获得上海市教学成果奖一等奖(排名第1)。
利用基因编辑平台、细胞分析平台、蛋白质互作平台、基因表达分析平台与技术手段等,开展(1)肿瘤发生及转移中的关键基因的功能注释;(2)卵巢早衰候选基因的生物学功能分析和机制探索。主持国家自然科学青年基金,作为研究骨干参与国家重点研发计划。以第一作者或通讯作者在Clinical
Cancer Research、Cancer Letters、Molecular Oncology等杂志发表多篇研究论文。
(本文原载《现代遗传学教程》微信公众号)