新浪博客

假基因和疾病

2016-07-06 17:23阅读:

假基因和疾病

假基因和疾病

导语
假基因是一段具有与功能基因相似的DNA序列,但由于存在许多突变以致失去了原有的功能。过去的研究认为假基因是没有功能的DNA片段,是基因组进化过程中产生的噪音。然而,随着分子生物学技术的发展,越来越多的研究证明了假基因具有重要的生物学功能并且与疾病息息相关。
假基因的发现和简介
假基因和疾病

伴随着人类基因组计划的完成和后基因组计划的实施,对占人类基因组约97% 的非编码序列的研究,即对所谓的“垃圾”DNA(“Junk”DNA)的研究已展开,预计
人类基因组中有大约20,000种假基因,并且在线虫、果蝇¨ 以及酵母等当中发现了大量假基因的存在。
假基因(pseudogene)最初由Jacq等人提出。他们在非洲爪蟾DNA中克隆了一个5S rRNA相关基因,与其功能基因比较后发现,这个基因的5 端有16bp的缺失和另外14bp的错配,就将这个截短的5S rRNA的相关基因描述为假基因。
假基因的命名
假基因和疾病

不同类别假基因的命名,一般来说以gPx表示(g):g代表已经证实的来自于数据库的编码蛋白质的基因,P为假基因,x为具体代码。例如:人类线粒体的核糖体蛋白假基因表示为:MRPL34P
假基因的分类
假基因和疾病

根据假基因的形成机理可划分2大类:
未加工型假基因(Unprocessed pseudogene):它们都是直接由DNA序列演化而来,具有内含子-外显子的结构和调控元件。
加工型假基因(Processed pseudogene):由mRNA转录本逆转录成cDNA后随机整合到基因组,由于插入位点不合适或者序列发生突变而失去正常功能而形成的假基因。
未加工型假基因(Unprocessed pseudogene)又被称为复制型假基因和单一型假基因:
复制型假基因(Duplicated pseudogene):复制型假基因是基因组DNA串联复制或者染色体不均等交换过程中基因编码区或调控区发生突变,导致复制后的基因失去正常功能而成为假基因。
单一型假基因(Unitary pseudogene):单一型假基因是原本具有功能的单一拷贝基因在编码区或调控区发生自发突变(Spontaneous mutations),导致该基因无法转录和翻译而成为假基因。
假基因的识别
假基因和疾病

假基因的特性:大多数假基因本身存在多种遗传缺陷。这些遗传缺陷包括:(a)可读框中的无义突变;(b)非3的整数倍的核苷酸插入或缺失导致阅读框移码;(C)控制基因转录或剪接的调控区的缺失突变,这些缺陷引起基因功能的损失发生在转录水平和/或翻译水平
复制型假基因的特征复制序列如果包括完整的启动子序列和一些必要的调控元件就能被转录。复制型假基因与功能基因一般在同一染色体上,它们之间有不均等交换重组或串联复制。复制型假基因具有功能基因非完整性外显子的结构,有单外显子的,也有多外显子的。
加工后后假基因的特征 (a)无内含子序列;(b)有小的侧翼定向重复序列(flanking direct repeat);(c)假基因序列只与功能基因转录产物的起点和终点之间的序列相似,与5 端的调控序列无关;(d)假基因的3 末端紧接着有多聚腺嘌呤尾巴。
假基因和疾病

针对全基因组内大规模的识别假基因,可采用生物信息学的方法解决。鉴定假基因的主要生物信息方法有3种:PseudoPipe,RetroFinder和Pseudo- Finder。PseudoPipe是一种基于基因组数据利用同源性搜索鉴定假基因的方法,可区分假基因类型。PseudoFinder是一种利用同源匹配(Homologous mapping) 鉴定假基因的方法,而RetroFinder是一种专注于加工假基因的注释的方法;以上两种方法都需要物种的基因组和转录组信息,适用于模式生物。对于非模式生物,Molineris等提出Retrotransposed Gene EXPlorer(REGEXP)方法,该方法主要利用加工型假基因无内含子的特点鉴定加工型假基因,仅依赖物种的DNA序列信息。
转录的假基因
目前已报道的大多数有功能的假基因均是通过其转录本行使功能:
A.假基因的转录本作为反义RNA(Antisense RNA)抑制亲本功能基因的表达
1992年Zhou等发现在人类基因组中的加工型假基因TOPI(Topoisomerase I)能产生反义RNA,并且该反义RNA可与亲本功能基因TOPI的转录本互补配对。尽管这项研究并未说明假基因产生的反义RNA具有功能,但在随后的研究中证明了假基因转录的反义RNA在细胞水平上扮演的重要角色。如Korneev等在蜗牛里发现假基因NOS(Nitric oxide synthase)的转录本同样也是反义RNA,并证明了假基因NOS的转录本能与亲本功能基因的转录本形成RNA双链,从而抑制了功能基因NOS在蜗牛神经细胞中的表达。
B.假基因转录本竞争性地结合miRNA(MircoRNA)
假基因和疾病

编码磷酸张力同源物蛋白质的基因PTEN (Phosphatase and tensin homolog)是一个抑癌基因,通过抑制PI3K/AKT信号通路达到抑制肿瘤生长的功能。2010年,Poliseno等发现假基因PTENP1 (Phosphatase and tensin homolog pseudogene)是一个能转录的加工型假基因,并与PTEN具有高度的同源性。其中,在PTEN与PTENP1的3′UTR (Untrans-lated region)上有一段具有高相似度的DNA片段,并发现在该DNA片段上享有共同的miRNA结合位点。同时,证明了PTENP1的3′UTR可竞争性结合miRNA,并阻挡了miRNA结合亲本功能基因PTEN的3′UTR,从而确保了PTEN的正常表达。
C.假基因的转录本产生内源性小干扰RNA(Endogenous small interfering RNA,endo-siRNA)
假基因和疾病

反义转录机制在人类基因组中广泛存在,产生的天然反义转录物通过与其互补的RNA碱基配对,形成正义-反义双链RNA,进一步酶切形成siRNA,通过RNA干扰机制导致同源RNA表达活性的降低,从而在表观遗传水平、转录及转录后水平调节其同源编码RNA的转录活性。2013年,Chan等发现转录的假基因ψPPM1K(Protein phosphatase,Mg2+/Mn2+ dependent,1K pseudogene)通过上述第二种方式形成了小干扰RNA,并且在转染了这种小干扰RNA的细胞中功能基因NEK8(NIMA-related kinase 8)和PPM1K(Protein phosphatase,Mg2+/Mn2+ dependent,1K)的表达量下降。其中,相对于正常细胞,NEK8在肿瘤细胞中的表达量增加,而由假基因ψPPM1K产生的小干扰RNA抑制了NEK8的表达,说明这些小干扰RNA具有抑制肿瘤的活性和调控人类细胞生长的功能。
具有编码能力的假基因
假基因和疾病

最早定义的假基因是不具有编码蛋白质的功能,可是近年的研究却指出一些假基因也可编码短链肽或者截短的蛋白质,即相比亲本功能基因编码的蛋白质要短一些。在灵长目中非常保守的加工型假基因PGAM3(Phosphoglycerate mutase family 3)是首次被发现的具有编码能力的假基因。1977年,Dierick等发现假基因PGAM3是通过亲本功能基因PGAM1的mRNA反转录整合到基因组中形成,并且假基因PGAM3有完整的开放阅读框,同时还在开放阅读框上游发现了具有启动子特征的区域,但是通过RT-PCR和限制性内切酶酶切实验没有发现假基因PGAM3在任何组织里转录。2002年,Betran等以人的cDNA文库作为模板进行PCR扩增和限制性内切酶酶切实验,发现假基因PGAM3不仅能转录,而且证明了在正向选择压力的驱使下还进化出具有编码蛋白质的能力。
环形RNA来源的假基因
假基因和疾病

2016年3月29日,学术期刊Cell Research在线发表了中国科学院上海生命科学研究院计算生物学研究所杨力研究组关于环形RNA研究的最新进展。研究组利用建立的新型计算分析流程(CIRCpseudo),首次揭示哺乳动物基因组中蕴含环形RNA来源的假基因,其中小鼠circSATB1来源的假基因序列可以与CTCF结合,提示这种环形RNA来源的假基因序列具有调控基因表达的潜能,以全新的视角揭示环形RNA可以通过逆转座插入到基因组中进而改变基因组遗传信息以及调控基因表达的潜能。
随着新的测序以及相应计算生物学分析方法的发展和应用,反向剪接产生的环形RNA在许多物种中被大量发现。杨力研究组与上海生科院生物化学与细胞生物学研究所陈玲玲研究组开展合作,利用建立的新型计算生物学手段(CIRCexplorer)在转录组大数据中系统发现特殊反向剪接的发生,揭示反向剪接发生的RNA序列基础及其调控的普遍性规律,全面展示RNA反向剪接成环的多样性和复杂性(Zhangetal.,Cell2014)。
在最新的这项研究工作中,科研人员建立并利用另一种全新的计算分析流程(CIRCpseudo),在基因组水平上系统发掘环形RNA来源的假基因序列。科研人员发现,在小鼠的基因组中存在至少42个circRFWD2来源的假基因序列。更为有意思的是,circSATB1来源的小鼠假基因序列可以与CTCF/Rad21结合,提示环形RNA分子在逆转座插入到基因组中改变基因组遗传信息的同时,也进一步提供了调控基因表达的新潜能。
值得一提的是,在人的基因组中不存在这种circSATB1来源的假基因序列,因此也不存在该位点的CTCF结合。环形RNA来源假基因的发现,一方面揭示了环形RNA转录本通过逆转座改变基因组的遗传信息,另一方面也提出了更多有待回答的问题。比如:是否还有更多的环形RNA来源的假基因(在其它物种中)尚未被发现?环形RNA逆转座的分子机制是什么?与线性RNA来源的假基因有何异同?与线性RNA来源的假基因相比,环形RNA来源的假基因数量相对较少的原因是什么?环形RNA来源的假基因是否有表达的潜能?回答这些问题需要更多的深入研究。
假基因在相关癌症等疾病中的作用机制
假基因和疾病

越来越多的证据表明,假基因异常表达可能在肿瘤发生中起重要作用,而特异性假基因表达可作为肿瘤的预测因子。
首先,假基因通过编码具有功能的蛋白质行驶功能,如八聚体结合转录因子4(Octamer-binding transcription factor 4,Oct4)的假基因Oct4-pg1。2007年,Lin等发现假基因Oct4-pg1可抑制间充质干细胞的生长与分化,并且该假基因能促进细胞的增殖。同时,有研究指出,在人类胶质瘤、乳腺癌等细胞中没有发现功能基因Oct4的表达,却观察到其假基因的表达,并且这些假基因可以转录并翻译成蛋白质,但该蛋白质缺乏相应的生物学功能。2010年,Kastler等在前列腺癌细胞中发现假基因Oct4-pg1是Oct4家族成员中有且仅有的一个能表达的成员,并且该假基因可编码一个含有359个氨基酸的蛋白质,可能具有类似亲本功能基因的功能,即维持癌细胞的无限增殖和自我更新的能力。
核酸研究,找艾博思生物!
艾博思生物专注于核酸研究,关注请加微信号:ibsbio或


--------艾博思生物原创编辑,转载注明出处!​

我的更多文章

下载客户端阅读体验更佳

APP专享