2.1 线粒体DNA的结构组成
(以动物的线粒体为例)
动物mtDNA分子是共价闭合的双链分子,分子量较小,15.7~19.5 kb,基因组中无间隔序列,各基因间排列紧密,基因内基本不含内含子。mtDNA基因的排列顺序基本一致(鸟类稍有改变,鸟类是ND6和tRNA—Glu基因在控制区上游,而其他动物则是cytb。
mtDNA分为重链(H链)和轻链(L链),双链密度不同。在mtDNA基因组中,含有2个rRNA基因(12SrRNA和16S rRNA),22个tRNA基因,13个mRNA,D一环区和轻链复制起始区。在13个基因中,有5个mRNA翻译的产物是线粒体电子传递系统中的亚单位,包括细胞色素b基因(Gy曲)、细胞色素C氧化酶3个亚基的基因(COI、C0Ⅱ、COⅢ)和线粒体ATP酶复合体的第6亚基基因(ATPase 6),另外8个基因为线粒体ATP酶复合体的第8亚基基因(ATPase)和NaDH氧化还原酶7个亚基的基因(ND1、ND2、ND3、ND4、ND4L、ND5、ND6)。除1个mRNA基因(ND6)和8个tRNA基因由轻链(L)编码外,其余绝大部分基因均由H链编码。D一环主要由重链复制起始区OH、轻链启动子LSP(L—strand promoter),重链启动子HSP(H—strand promoter)、保守序列片段CSB I、CSB 11、CSBm (conserved sequence blocks)和终止结合序列TAS(ter—mination associated sequence)组成,又称控制区(controlregion)或非编码区(non—coding region)。
2.2 线粒体DNA的遗传特性
2.2.1 结构紧密,编码效率高
动物线粒体DNA一般无内含子,同核DNA相比,其mtDNA的编码效率较高。蛋白质编码基因间几乎没有间隙序列,即使存在也仅由1到几个核苷酸组成,一般少于10bp,基因转录物和产物呈现完全的共线性关系。并且在相邻基因之间有时相互交搭。
2.2.2 特异性组织
在研究过的所有哺乳动物及绝大多数其他脊椎动物中,个体内mtDNA具有高度的均一性,即同一个体的肾、心、肝、胎盘和皮肤等不同组织所得的mtDNA是一致的,也就是说没有组织特异性。这就有利于用限制性内切酶进行分析。但不同组织mtDNA的含量和断裂的程度有所不同,实验证明,从肝脏提取最容易。但在有些脊椎动物中,个体内也存在着多种重复序列数目不同线粒体基因组,称为异质性。重复序列能够形成发卡结构,发卡结构引起的高频率回复突变可能是异质性形成的原因,也不排除父本mtDNA的渗漏造成异质性。
2.2.3 严格的母系遗传
作为真核生物胞质遗传的重要组成部分,mtDNA是由卵细胞传递给后代,被认为属于典型的母性遗传。在高等动物中,以精子含有100个左右的mtDNA拷贝;而卵细胞内却含有1 个以上mtDNA分子。1983年Lamman等人用放射自显影技术证明,高等动物mtDNA来自父系所占的比例不超过0.004%。目前普遍认为严格的母系遗传,便于进行群体分析,一个个体就能代表一个母系集团,故通过几只随机的动物个体就可了解一个群体的遗传结构(Breseh H F,1984)。在应用mtDNA作为分子标记进行系统发育、种群遗传方面的研究时,取材及结果分析时要全面考虑。
2.2.4 进化速率快
虽然mtDNA基因组的长度及组织结构十分稳定,但其一级结构上的进化却很快,是单拷贝核DNA的5~10倍。研究表明,哺乳动物mtDNA的突变方式主要是碱基代换(Substitution),包括转换(transition)和颠换(transvertion)。很少有基因重排。
2.2.5 控制区D—Loop环的遗传特性
线粒体DNA的结构上有一个独特的D—Loop环(displacement loop region):位于tRNA—Pro和tRNA—Pile的基因之间,由少数碱基构成一个突出结构。该区可分为H一链复制起始区OH,保守序列节段(CSBI,II,Ⅲ)和L一链启动子(LSP),H一链启动子(HSP)及终止结合序列(TAS)等。大量研究表明,在脊椎动物中,线粒体DNA控制区的结构是相似的,一些序列非常保守,在鱼类、鸟类、哺乳动物中都存在,被认为是功能单位,受自然选择影响较大,但是又存在巨大的变异,插入、缺失、串联重复等变异导致序列长度很不一样。在线粒体DNA上,D—Loop环是整个线粒体基因组序列和长度变异最大的区域,其进化速度最快,一般用于种内种群间的系统进化分析。
2.2.6 线粒体基因组的复制
线粒体DNA的复制是以半保留复制方式进行的。用3H 嘧啶核苷标记证明,mtDNA复制时间主要在细胞周期的S期及G期,DNA先复制,然后线粒体分裂。线粒体最常见的复制方式是D一环复制:首先从L链上的启动子(LSP,L—Strand promoter)转录出一段RNA,这段RNA链受保守序列(CSB)片段的限制而与L—DNA链紧密缔合,从而置换出与H链配对的这段DNA链形成环,这时RNA链被线粒体RNA加工酶(RinseMaP)切断,形成H一链复制的引物,由线粒体DNA聚合酶完成H链的复制,这段新合成的DNA链代替相应的H链而与L链配对,从而形成三链D一环结构,当H链复制2/3时,由于双链解开而露出H链启动子(HSP)并在此处合成一段RNA引物而引发L链的合成。参与复制的酶主要有: RNA加工酶、DNA聚合酶γ (DNA polγ)及单链结合蛋白(SSBPr)。
2.2.7 线粒体基因的遗传密码及RNA编辑
研究表明,无论动物、植物、酵母,其线粒体的遗传密码与核基因的标准密码在某些密码上有所不同。如密码子UGA在核基因中表示终止子,而在哺乳动物、果蝇及酵母中翻译成色氨酸;密码子AUA、AUU在核基因中翻译成异亮氨酸,而在哺乳动物、果蝇及酵母中翻译成甲硫氨酸;密码子AGA、AGG在核基因中翻译成精氨酸,而在哺乳动物中表示终止子,在果蝇中翻译成丝氨酸等。陈惟昌等应用高维空拓扑分析的方法。对线粒遗传密码和基因组遗传密码的6维编码空间进行对称性分析,得出:(1)线粒体遗传密码的起始密码子是2而不是1个。(2)线粒体遗传密码的终止密码子是4个而不是3个。(3)线粒体遗传密码空间只有2、4、6三种偶数简并度而没1、3两种奇数简并度,表明其对称度较高。(4)线粒体遗传密码连通度较低。(5)共有3个简并平面出现变异等。
在线粒体中存在着RNA编辑(RNA editing)现象,即修饰或轻微改变mRNA的核苷酸序列,使它们与对应的模板DNA的顺序有所不同的过程。
2.2.8 与核基因组之间的共同序列
在早期通过DNA/DNA杂交实验进行线粒体遗传物质的研究中,未揭示出细胞核与线粒体有共同的核苷酸序列存在,从而使随后一段时期,科学工作者应用mtDNA与核基因组无共同序列这一理论,用PCR方法扩增mtDNA基因片断进行多方面研究,并设计出很多通用引物用于不同物种线粒体基因扩增。
但后来出现了许多关于线粒体基因相似序列在细胞核中被发现的报道,现已证实,细胞核基因组内的这些相似序列是以假基因形式存在的,可以用通用引物扩增出来,从而干扰了线粒体基因目的片段的扩增。这些mtDNA相似序列广泛存在于动物细胞中,并存在一些共同特征:(1)包括rRNA基因、蛋白质编码基因、调控区在内,均可在核基因组中找到其类似片段;(2)核拷贝序列不仅可以很长,而且拷贝数也可能很高; (3)与其对应的mtDNA有很高的同源性;(4)在同一核基因组内,不同的插入序列进化程度不同;(5)与其对应的线粒体基因相比,具有不同的进化模式;(6)易为通用引物扩增。
mtDNA与核基因组之间存在着共同序列,这反映了胞质遗传系统与细胞核遗传系统间广泛存在着遗传物质的交流。一方面是线粒体遗传物质向细胞核输入,另一方面是细胞核遗传物质向线粒体转移。
2.2.9 分子钟(Molecular clock)理论
Brown等最早将mtDNA作为分子钟来推测物种分歧时间。他们推测:在灵长类,序列的进化速率为1—2%/百万年。随后许多学者在其他哺乳类及鸟类种也得到这一进化速率。随着mtDNA序列数据的增加,现已估测出一些更为精确的进化速率:在偶蹄目的rRNA基因中,颠换的积累与时间呈线性关系,其进化速率为0.2%/百万年;在哺乳类,ctyb基因中的第三密码子颠换积累也与时间呈线性关系,而其进化速率为rRNA基因的2.5倍。在2500万年范围内,若只利用第三密码子的无义颠换,在转换:颠换为10:1的前提下,无义突变速率约为10%/百万年。第一、第二密码子的颠换和转换也都与时间呈线性关系,它们发生氨基酸取代的替代率为0.4%/百万年。
3、线粒体基因组与核基因组的关系
在线粒体中,线粒体基因组的DNA信息是有限的,大多数线粒体基因组仅能编码两种rRNA及20种tRNA(原生动物除外)及13种多肽。因此,线粒体虽然有自己的DNA及核糖体等遗传装置,但由于它所含的遗传信息不足以支持它的生命活动,仍然要受核基因的控制。线粒体中的绝大多数蛋白质都是由核基因编码并在细胞质中的核糖体内合成后,通过线粒体膜运至内部进行更新与组装。
对酵母的研究发现,核基因与线粒体基因两套遗传系统具有密切配合的协调性。如酵母在有放线菌酮存在的情况下,细胞质蛋白合成受到特异性抑制,即细胞核中控制蛋白质合成的基因受到抑制,当培养1小时左右,线粒体的生物合成活性也显著下降,这说明控制线粒体生物合成的基因由于核基因受到抑制,也受到了影响。在对链孢霉的实验中,还发现另一现象,即在氯霉素(专一抑制细菌的蛋白质合成,不抑制细胞蛋白质合成)存在的条件下,链孢霉线粒体RNA合成和蛋白质合成都受到抑制,但是却刺激了细胞中与线粒体基因表达和复制有关的RNA聚合酶、DNA聚合酶的活性。根据这个现象,人们假设在正常情况下线粒体基因可能编码一种阻遏物,具有阻遏细胞核DNA转录和合成与线粒体有关的蛋白质和酶的作用,在氯霉素作用下抑制了线粒体蛋白质的合成,同时使得这种阻遏物不能形成,从而导致了由核基因编码的RNA聚合酶活性的升高。
在对哺乳动物内细胞色素氧化酶的研究中,研究人员发现无论是抑制或是促进哺乳动物体内的酶活性,都需要13种基因的协同作用,而这13种基因有3种分布在线粒体基因组上,另外10种则分布在核基因组中。综上所述,线粒体基因表达是建立在核基因表达基础之上的,并且在生物体内所进行的生命活动需要线粒体基因组与核基因组共同配合、协调作用才能正常进行。这充分说明了线粒体基因组与核基因组相互关系的重要性。