遗传多态性和变异

Encyclopédie environnement - polymorphisme génétique - escargots - snails - polymorphism

PDF

  遗传多态性是指存在替代状态的DNA,决定生物体向更高水平整合的变异。生物体中存在不同种类的基因组修饰(突变),其中研究最多的是编码区和调控区中的核苷酸替换。

1. 定义

环境百科全书-遗传多态性和变异-等位性和同源性
图 1.等位性和同源性。表示两对基因通过血统线与它们的最后一个共同祖先(正方形)相连;水平的刻度代表世代,灰色圆圈代表祖先谱系的突变。如果两个基因有共同的祖先,那么它们就是同源的。它们在染色体上的位置是同源的,在后代上也是同源的。如果它们是不同的(图的右边),它们就被认为是等位基因,这意味着自他们最后一个共同祖先的时代(t)开始,至少发生了一个突变。否则,他们被认为状态是相同的(图的左边)。两个随机基因间突变数的期望为Ө =2Tµ,其中µ为单位时间(代)的突变率,T为种群中t的期望。从种群中随机选择的两个基因是等位基因,因此至少有一个突变的差异,其概率是H≈Ө/(Ө+1)。(图1 Temps passé 耗费的时间)

遗传多态性是指在一个种群中,在基因组或基因座的确定位置上(基因在染色体上的位置)存在好几种替代状态的DNA或等位基因在群体遗传学中,一组同源基因(同源类),如果两个基因与减数分裂相匹配,则它们是同源的。这个定义包括几个方面:
(1) 首先,这种特征必须由染色体携带并具有遗传性;
(2) 其次,等位基因在基因组中的位置必须同源如果两条染色体或两个基因在减数分裂过程中相互匹配并相互排斥,则称其为同源的
(3) 但由于特征可遗传,位置同源性也意味着等位基因在血统上同源;如果不同,那么在将它们与最后一个共同祖先联系起来的其中一个中(至少)发生了一个突变(图1)
(4) 最后,遗传多态性可以在组成 DNA 的最小单位的尺度上定义:核苷酸位点。因此,每个核苷酸变异都可以决定更高层次生物结构的多态性——个体的基因、蛋白质和表型——这构成可以描述遗传多态性的尺度(图2)。

以ABO血型系统为例,它涉及到输血过程中抗原相容性被抗体或淋巴细胞受体识别的部分抗原也称为抗原表位或抗原决定簇。同一个抗原有几个抗原表位(相同或不同),从而引起不同的免疫反应。这是一个存在于人类群体中的遗传多态性案例,涉及ABO糖基转移酶蛋白将含有糖的残基转移到蛋白质中的酶。在ABO系统中,糖基转移酶A和B诱导的个体分别属于A型或B型。当两种糖基转移酶都存在时,个体属于AB型。,含有三个等位基因,即A、B和O。一个人可以是(AA)、(AO);(BB)、(BO);(OO)或(AB)基因型。具体表现型将是[A]、[A]、[A];[B]、[B];[O]或[AB],在这里可以看到A和B“支配”O(即它们的表达掩盖了O的表达),并且它们之间是共显性的(A和B之间的杂合子具有可识别的表达,[AB])

  首先,多态性可以编码蛋白质的基因座DNA序列的角度加以描述。有些多态性是“同义的”,即它们不会改变蛋白质的氨基酸序列;它们通常是数量最多的多态性。其它的修饰氨基酸,称为“替换”多态性。ABO糖基转移酶的替换多态性有两种类型:改变氨基酸而不改变抗原单位的多态性(它们不干扰个体的ABO表型);其他替换多态性决定了ABO表型一组可观察到的个体特征

环境百科全书-遗传多态性和变异-核苷酸多态性和等位基因
图 2. 核苷酸多态性和等位基因。示例显示编码蛋白质的1000个核苷酸的10个同源序列的比对。10个可变位点(核苷酸A、C、G、T)及其在序列上的位置都采用彩色标记。它们包括8个沉默位点(s)和2个替换位点(r:氨基酸替换位点,用蓝色标出),位于480和821位(因此有三个蛋白质的变体,用彩色标记标识)。有六个不同的单倍型(多态位点的线性排列,编号为H1至H6)。这些单倍型按照一个无根树(图底)分组,由连接单倍型的分支组成,并携带10个突变(黑色圆圈),对应于10个多态位点。该树是唯一的,因为没有基因内重组;否则,有多少被重组事件分开的片段就有多少树。在这个例子中,蛋白质的等位基因多样性为H=0.42,单倍型多样性为H=0.80;核苷酸多样性为π=0.00416(定义和公式见正文)。(图2 10 séquences alignées de 1000 nucléotides编码1000个核苷酸的10个同源序列;Séquence1-10 序列1-10;Haplotype H1-H10 单倍型H1-H10)

  在核苷酸和等位基因水平之间,遗传分析考虑了中间水平的描述:基因座上可变位点的线性排列。这些称为单倍型的排列位于同一染色体上不同位点的等位基因组通常一起遗传。单倍型(Haplotype)是英语词组单倍体基因型(haploid genotype)的缩写。位于同一染色体上的所有基因及其等位基因在减数分裂一起分离形成单倍型。 这些基因被称为“遗传连锁”的。在进化遗传学中很有用,因为它们可以帮助发现等位基因之间的谱系联系(图2)。

  核苷酸多态性也存在于基因间区(编码区之外)。有些影响到基因表达调控的区域,因此具有表型表达。其他的则没有已知的影响,被称为“沉默的”。

环境百科全书-遗传多态性和变异-不同类型的突变
图 3. 不同类型的突变。1,核苷酸替换,影响碱基(A, C, G,或T);2,DNA片段的插入或删除;3,基因的复制;4,插入转座子;5,微卫星位点的伸长或缩短;6,基因间区的替代(沉默或不沉默);7,编码区替换(同义或氨基酸替换);8,通过插入转座子使基因失活;9,通过结合两个编码区创造嵌合基因;10,以另一个等位基因为模型,通过修复受损DNA进行基因转换;11,染色体倒置。(图3 Chromosome d’origine 原始染色体;Chromosome modifié 突变染色体)

  除核苷酸替换之外,一种特殊类型突变(微卫星突变)的多态性是指非编码DNA片段长度的变化(图3),这是由于短重复核苷酸序列重复次数的变化,如CACACACA或TGTGTG。

  并非所有遗传变异都属于遗传多态性定义的范畴,因为这需要替代物位置同源(图3)。因此,有一些重复序列可以通过复制一个基因得到,而每个位置上的两个重复序列都不同源。通常情况下,我们也无法谈论转座元件的同源性,因为它们一般在细胞世代中改变位置,可以成倍增加并侵入基因组。这样一来,就不能确定两个转座元件的同源性。另一方面,同一基因座的两个编码序列,其中一个是完整的,另一个因转座元件插入而失活,这非常符合同源情况。有一天,我们可能会考虑谈论所谓的“表观遗传”染色体修饰的多态性,这些修饰有时会在几代细胞中传播,包括体细胞界定非生殖细胞或体细胞。影响体细胞基因的体细胞突变随着携带者个体消失而消失。生殖细胞符合配子的条件。生殖细胞的突变可传给其子代。(符合配子的条件。生殖细胞的突变可传给其子代。),如甲基化。它们在种群进化中的重要性还有待评估。遗传多态性的概念仅限于某些类别的变异——本质上是核苷酸替换——这是因为后者在探索自然种群历史中具有巨大效用。这些变异可用于建立进化的数学模型。

  多态性这个词的意思是“多种形态”。它与单态相反,而单态表示没有变异。在生物学词汇中,这种对立早在遗传学出现之前就用来表示同一物种中几种不同类型个体并存,如群居昆虫的等级多态性(蚁后和工蜂);北极一些哺乳动物的季节性多态性(毛皮变化)。这些案例不属于遗传多态性,这一概念较新,含义更狭窄、更精确。连续变异(如大小变异)也不属于多态性的范畴,因为它们不存在不同的替代。然而,影响大小的基因座属于这一定义的范畴。我们将在下文讨论研究最多的遗传变异——核苷酸替换,因为它们在进化中最重要,然后我们将讨论表型变异。

2. 测量

  仅仅说一个基因座变异性大或小,而不给这个判断做定量评估,这还不够。研究人员可以在不同的尺度上研究变异。如果只对蛋白质的等位基因感兴趣,研究人员将测量等位基因多样性,用“H”表示。如果对DNA多样性感兴趣,研究人员将测量核苷酸多样性,用“π”来表示。

  等位基因多样性H定义是,在两次有替换的抽样中抽取两个不同等位基因的概率在一个装有n个代币的盒子中进行连续的抽签,取第一个代币,读取其价值,将其放回盒子中,取第二个代币,读取其价值,将其放回盒子中,等等,直到第p个代币。这意味着重复(可以多次选择相同的对象)并按顺序(选择对象的顺序很重要)在n个代币中选择p个代币。在n中连续抽出代币的次数为:n×n×n×…×n=np。。如果我们称pi为等级i的等位基因的频率,结果表明两次抽取相同等位基因的概率为F=Σ pi2。样本的等位基因多样性是其对1的补充,即:

H = 1 – Σ pi2 (1)

  该公式对于蛋白质等位基因和单倍型都适用,被称为单倍型多样性。也可以称为杂合度,因为在二倍体位点的情况下,它给出了杂合子的预期频率。

核苷酸多样性π相当于每个核苷酸尺度上的H。计算方法是用两两取样的样本中序列之间的核苷酸差异数的平均值(δij),除以DNA片段的长度获得核苷酸的数量(L)。

π = average (δij)/L (2) (参考文献[1]

  这个值因物种而异。在人类基因组的编码部分,从种群中随机选择的两条染色体平均每1000个核苷酸相差1个。在果蝇(Drosophila melanogaster)基因组中,这种差异约为百分之一。因此,果蝇的性状变异是人类的十倍。当这些值与编码区域的大小(果蝇大约有15500个基因,人类至少有22000个基因),甚至基因组的大小(果蝇每个单倍体基因组有1.4亿个碱基对,人类大约有32亿个碱基对,比果蝇多20倍)相关联时,多态位点的数量庞大,导致任何物种中有性世代诞生的生命,无论过去、现在还是将来,都不会与另一个生命的基因完全相同。DNA多态性的信息力量巨大。在法医学中,侦探可以通过16个微卫星位点来识别嫌疑人。

3. 历史

  “变异一词出现在达尔文(Darwin)的著作《物种起源》(1859)中前两章的标题中。在生物遗传规律的谜团尚未破解之前,达尔文将这一概念引入自然科学,专门撰写了另一本重要著作《动植物变异》(1868)。他深信,进化涉及微小变异,这些变异对生物体适应其生活环境几乎没有影响,因此他非常重视微小的数目变异,这促使其后继者【尤其是卡尔·皮尔森(Karl Pearson)】创立了生物统计学生命测量科学。 广义上指对生物的定量研究。。但是1900年孟德尔定律(Mendel’s laws)的重新发现,研究人员开始关注非连续变异。

环境百科全书-遗传多态性和变异-基因、基因型和表型:由一对等位基因说明种群遗传学的三个结构层次
图 4. 基因、基因型和表型:由一对等位基因说明种群遗传学的三个结构层次。等位基因频率分别为p=0.40(粉色等位基因或R)和q=0.60(黄色等位基因或j),基因型频率分别为x=0.16(RR纯合子),y=0.36(jj纯合子)和z=0.48(Rj杂合子),其中p+q=1,x+y+z=1。在这个例子中,用于基因型频率x, y和z的值是在配子随机结合情况下预测的理论值:这些是所谓的哈迪-温伯格比例,其中纯合子频率分别是p2和q2,以及杂合子频率2pq。(图4 deux allèles 一对等位基因;allèle R 等位基因R;allèle j 等位基因j;fréquences alléliques 等位基因频率;trois génotypes 三种基因型;homozygote RR 纯合子RR;homozygote jj 纯合子jj;hétérozygote Rj 杂合子Rj;fréquences génotypiques 基因型频率;deux phénotypes 两种表型;phénotypes rose 粉色表型;phénotypes jaune 黄色表型;dominance de l’allèle R 等位基因R的主导地位;phénotypes 表型;sélection 选择)

  从1908年到1930年,群体遗传学本质上是一门试图调和达尔文进化论与孟德尔遗传学基于单一基因在显性、隐性或性染色体连接模式X(或Y)下的传递的遗传。指具有简单决定性的遗传性状,由一对或少数几对基因决定。的理论学科,而且概率在其中发挥了主要作用。遗传学是反直觉的学科。它预测在子代中不存在亲代的复制,因为后者的基因型是由两个亲代半基因组融合之前等位基因随机抽取分离的结果。研究人员意识到,这是代际间传递的等位基因频率在种群中发现变异等位基因的频率。以比例或百分比表示。种群中一个基因的所有等位基因的等位基因频率之和因此定义等于1。在群体遗传学中,等位基因频率代表种群或物种水平的遗传多样性。,而不是基因型或表现型。这些频率从一代到下一代或多或少都保持稳定,除了个体之间的多重亲缘纠缠之外,还会产生相同的基因型频率种群的遗传结构。由等位基因频率决定的(图4)。因此,与变异数相关联的群体基因型分布是唯一可预测的因素。1930年左右,三位理论家罗纳德·费希尔(Ronald Fisher)、霍尔丹(JBS Haldane)和休厄尔·莱特(Sewall Wright)帮助明确了孟德尔种群遗传服从孟德尔定律的种群。的概念[2]。在这种情况下,进化必然涉及三个结构层次:基因、个体和种群。可以用以下公式来概括这三方面的关联:种群进化是等位基因频率的变化(基因尺度,也是群体尺度),这种变化取决于选择对表型的分类(个体尺度)。经验群体遗传学研究随后发展起来,但在很长一段时间内,研究人员因不了解染色体的工作原理而有所局限(1953年,研究人员开始了解DNA分子结构,而测序工作于1977年开始),不得不依赖研究少数可见的多态性,如瓢虫鞘翅或蜗牛外壳的色泽(详见聚焦——伟大的蜗牛辩论)。对于自然种群是普遍多态还是单态,以及多态性本身是否有益,遗传学家争论不休。直到1966年(涉及蛋白质)和1983年(涉及DNA),大分子尺度变异研究开启后,这些问题才有了答案。

4. 数量变异和遗传力

我们环顾四周时,注意到不同人的身体差异,有些差异复杂,如面部特征,有些差异容易测量,如体重或身高。常识表明,尽管很难明确遗传方式,有一部分差异可以遗传。这些特征通常由多基因依赖于许多基因。我们讨论多基因遗传。糖尿病是多基因遗传疾病。决定,这意味着它们受到许多基因位点的影响。发育遗传学及其在物种比较中的应用(evo-devo,意为“发育的进化”)揭秘了复杂的相互作用网络,这些相互作用使身体细胞在发育过程中都具有相同的遗传包袱,通过后生作用分化形成不同的组织。目前还不清楚复杂的特征是如何形成的。基于统计分布的特性,可以用生物统计学来研究可测量的表型。一个具有有用属性的值是方差在一个个体样本中,一个特定的性状被测量,方差是值的平方的均值与均值平方之间的差异。这种测量总是正的,表明个体的分散程度。[3]。当几个独立原因造成了一个谱系发生变异时,变异可累加,这些变异的和给出这个谱系的方差。如果原因不是独立的,则协方差之和要加到方差之和上。一个表型性状的总方差Vt是:

Vt=Vga+Vgd+Vgd+Vgi+Ve

  Vga,加性遗传方差,是由每个独立基因座产生的变异总和;Vgd,显性遗传方差,是同一基因座上两个等位基因相互作用的结果;Vgi,基因座之间的互作方差,是同一个体的基因座之间相互作用的结果;Ve,环境方差,这里假设独立于遗传方差。

  显性遗传变异对于同父同母的两个孩子来说很常见,因为在一个特定的基因座上他们从父母双方获得相同的等位基因,他们共享显性效应,即他们四个位点中就有一个。他们没有与父母共享这些效应,所以,尽管事实上两个孩子同父母共享如此多的基因,但两个孩子之间比他们同父母之间更为“相似”。当然,一个亲代可能偶然地在某个位点上获得了与其孩子相同的两个等位基因。这种机会取决于种群中等位基因的频率。我们看到,一个孩子和其父母在某一特定特征上的相似程度是一个公共属性。

  更笼统地说,遗传变异所有组成部分(Vga+Vgd+Vgi)在群体间都存在差异。在繁殖谱系中,一种常见的情况是近亲繁殖,这会耗尽遗传变异:结果,一个性状在两个种群中的平均值可能相同,但遗传变异不同。因此,育种家选择一种特性的能力是选择谱系的特性,而不是性状的特性。

  亲代与子代之间的关系由遗传力h2衡量。这被定义为加性遗传方差与总方差的比值[4]

h2 = Vga /Vt

环境百科全书-遗传多态性和变异- 亲子关系的定量特征
图 5. 亲子关系的定量特征。亲代平均数与子代不同理论情况的相关性大小如下:(1)相关性为1,其中子代的身高与亲代的身高完全相同,均值和方差没有差异。边际分布是指亲代均值和子代均值的大小。这些点(亲代、子代)的坐标位于坐标轴的等分线上。一个有价值的亲代均值产生一个有价值的子代a。(2)相关性为0,即子代的大小与亲代的大小无关。在子代的分布中,一个有价值的亲代均值产生了一个无价值的子代。各点的坐标位于一个圆上;其期望值位于与亲代轴线平行的线上(d)。(3)0和1之间的中间亲子相关性:点的坐标位于一个椭圆上。期望值不再是位于坐标轴的平分线上(这也是椭圆分布的长轴),但在回归线r上。一个数值的均值亲代产生了一个具有一定方差的数值b的子代(在0和a之间)。值得注意的是,案例(3)介于案例(1)和案例(2)之间。(图5 Parent moyen 亲代均值;enfant 子代)

图5显示了在各种假设下的情况。遗传力决定一个特征是否能被选择。图5-3显示,一个育种者如果选择了数值为a的个体,就能在一个杂交世代内将一个特征的平均值从0移到b。可以证明,b=h2a。为了选择一个性状,使环境标准化(从而减少环境方差)并将自己置于有利于性状出现的环境条件中,这有利于提高遗传率。遗传学家沃丁顿(Waddington)已经证明,在自然界中,环境变化可以揭示进化过程中将被选择的新性状。

 


参考资料及说明

封面照片:雷默瑞丽蜗牛和花园葱蜗牛的壳(Cepaea nemoralis & Cepaea hortensis)安德烈·昆泽尔曼(André Künzelmann),UFZ.

[1] 这个公式可以用更常规的方式写成:π=n(n-1)/2L.Σn-1Σnδij

[2] Fisher R.A. (1930) The Genetical Theory of Natural Selection, Clarendon Press, Oxford; Haldane J.B.S. (1932) The causes of evolution. London: Harper & Brothers; Wright S. Evolution and the Genetics of Populations. 1, 2, 3, 4; New Edition. University of Chicago Press. 1984 (reprint by the author of his main results).

[3] 作为测量研究性状的个体样本,方差可以定义为数值平方的平均值与数值平均值的平方之间的差异。这个度量总是正值,表明个体的分散性。

[4] 这是严格意义上的遗传力。广义上的遗传力是遗传方差之和与总方差之比。 这个公式给出了父母双方(“平均父母”)的遗传力;只有单亲的估计值将给出h2/2。


环境百科全书由环境和能源百科全书协会出版 (www.a3e.fr),该协会与格勒诺布尔阿尔卑斯大学和格勒诺布尔INP有合同关系,并由法国科学院赞助。

引用这篇文章: VEUILLE Michel (2024年1月28日), 遗传多态性和变异, 环境百科全书,咨询于 2024年5月26日 [在线ISSN 2555-0950]网址: https://www.encyclopedie-environnement.org/zh/vivant-zh/genetic-polymorphism-and-variation-2/.

环境百科全书中的文章是根据知识共享BY-NC-SA许可条款提供的,该许可授权复制的条件是:引用来源,不作商业使用,共享相同的初始条件,并且在每次重复使用或分发时复制知识共享BY-NC-SA许可声明。