控制动物身体结构的基因网络

图片
如何使用鸡蛋将鸡蛋变成幼虫,然后变成成年苍蝇?像其他昆虫一样,苍蝇也由线段组成。各个部分分为三组-头部,胸部和腹部。一个段可能有一对肢体。胸部分为三段,每段都有一条腿。第二个胸节也有翅膀,第三个节是地甲虫(小的尾翼,几乎没有放大镜就看不见)。腹部由八个部分组成;它们上没有四肢。最初,头部有六个部分,但是在昆虫进化过程中,它们之间的边界被完全消除了。他们的四肢是触角,苍蝇闻着并感觉到,还有三对嘴肢。对于虫子或蟑螂,将是下颌骨,上颌骨和下唇,而对于苍蝇,它们都会融合成长鼻。

为了使所有器官都到位,每个细胞必须知道它在胚胎中的位置。因此,在胚胎发育的早期阶段,当器官中还没有器官并且所有细胞看起来都相同时,生化“坐标网格”就会出现在其前后轴,背腹轴和左右轴之间。构成坐标网格的基因突变可以轻松快速地改变动物的外观-将器官移到另一个位置,改变它们的数量,等等。因此,这些基因对于动物的进化很重要,并且得到了积极的研究。标记果蝇蝇的胚胎的基因网络是遗传学家最喜欢的玩具,也许是动物基因网络中研究最多的基因网络。

沿前后轴标记卵的算法基本上很简单:

1)确定卵的哪一端将是头部,哪个尾巴
2)沿前后轴将胚胎分成17个段
3)将每个段分为前,中和后
4)标记头部(6个部分),胸部(3个部分)和腹部(8个部分)
5)标记这些部分的个体差异。

与此相关基因网络具有模块化的装置。每个模块都执行其自己的通用算法步骤。果蝇果蝇是非常方便的研究基因开发网络的对象,因为它具有非常明亮的遗传性畸形。例如,触角突变,其中所述天线被变换成的腿或VROTMNENOGI象鼻,当部分象鼻变成腿。比特胸腔突变产生四翼苍蝇,该苍蝇除了在第二胸部节段上具有通常的翅外,还在第三胸部节段上具有第二对翅。

图片
图片

人体某一部位变得非常相似的这种突变称为“顺势疗法”。从这些突变体开始,遗传学最终破译了控制果蝇发育的整个基因网络。这项工作获得了1995年诺贝尔奖。

这一切都始于卵的极性基因-bicoid和nanos。它们甚至在卵子受精之前就起作用,而卵子则在母亲果蝇的卵巢中成熟。辅助细胞将营养物质泵入鸡蛋,位于鸡蛋的一侧,因此鸡蛋从一开始就具有两个不同的末端。基质二倍体RNA积聚在卵的前端,在卵的末端附着,不能游走。 nanos mRNA同样固定在后端。受精后,开始使用这些mRNA合成蛋白质。它们的分子遍布整个鸡蛋。由于二类维生素和纳米蛋白的合成发生在卵的一端,并且到处都有衰减,所以二类维生素的蛋白梯度下降,从胚胎的前端到后部逐渐减小,而纳米级的蛋白梯度从后部到前端逐渐减小。

图片

如果用微量移液管将二倍体mRNA引入卵中的另一个位置,则第二个头部将在那里生长。如果人为关闭二倍体mRNA,将获得一个没有头且有两个驴的胚胎。
此外,该类比蛋白和纳米蛋白包括胚胎本身的基因,即,开始从它们中读取新的mRNA。缺口基因是第一个从英语缺口开始起作用的缺口基因。该组的前两个基因-驼背和尾巴-从头到尾(驼背)和从尾巴到头(尾巴)形成梯度。但是它们的梯度比双曲线和纳米的梯度更平滑。

为什么这么奇怪地称基因?
. . , hunchback — «», tailless — «», kruppel - — «», bithorax – « ». Sonic hedgehog , .

缺口组的其余四个基因各形成一个或两个具有相当清晰边界的宽条带(不止一个片段)。它们被更高基因的蛋白质产物(双峰,纳米,驼背和尾)结合。该基因之一的完全关闭会产生一个缩短的胚胎,该胚胎缺少几个区段,而该区段通常在该区段中起作用。

图片
间隙阻断基因的活性区域

为何会证明四个间隙阻断基因(kruppel,巨人,knirps和无尾)将胚胎分成多个条带,四个基因中的每一个都起作用?

首先,他们都压抑着彼此的活动。在单个细胞中,来自该组的一个基因会主动发挥作用并抑制所有其他基因(触发)的条件将是稳定的。但是正在发育的果蝇卵更加复杂。此时,成千上万的单个细胞核漂浮在总的细胞内液(细胞质)中。卵的大小足够大,以至于调节蛋白的降解速率与其在卵另一端的扩散速率相当。通过扩散和相互抑制的结合,当鸡蛋被分成几个带时,另一个稳定状态就会出现,每个带中的一个基因都起作用。蛋白质的扩散越慢或分解越快,这些条纹或斑点将越小。1952年,艾伦·图灵(Alan Turing)(是的,发明了“图灵机”)预测了这种系统(称为反应扩散)在动物体标记中的参与。当时,人们对基因和蛋白质知之甚少,但是图灵正确地推导了描述条纹和斑点结构的方程式。在这里这里,您可以使用两种物质的简单反应扩散模型,并感受其行为方式。

图片
缺口基因和卵极性基因之间的联系。 BCD-bicoid,HB-驼背,cad-尾巴,Kr-Kruppel,kni-knirps,GT-巨人,tll-无尾。

单独抑制对方的基因会把胚胎标记成一些条纹,但是四个基因的活性带相对于彼此的位置以及胚胎末端的位置将非常不同。为了使条带始终到位(例如,对于knirps,一条条带位于头部,另一条条带位于kruppel和巨型条带之间的后半部分),您需要第二个控制信号-双曲线和其他卵极性蛋白的梯度。这些调节子的缺口基因的输入函数在输入信号的不同水平上具有最大值(我们在第二篇文章的末尾推导了这种输入函数)。因此,缺口基因各自通过其二倍体,驼背和尾状蛋白的水平开启,其活性区自然位于胚胎的头部至尾部。

在间隔基因将胚胎粗略标记为7条带之后(它们与节段或头胸腹部不重合),打开了下一个模块-配对规则(“配对规则”)。它已经将胚胎分为多个部分,应该为17。成对规则模块由五个基因组成,正如您可能已经猜到的,它们全部相互抑制。这些基因中的每一个都在全部偶数或所有奇数片段中起作用-由它们编码的蛋白质比空位组的蛋白质分解得更快,并且条带相应地更窄。关闭该组基因的一部分会产生缩短的胚胎,其中所有偶数或所有奇数片段都消失。

图片
成对规则组中基因的活动区域。右图有14条,而不是17条,因为其他三个标记系统在头部的前三个部分中起作用。

配对规则模块本身可以在没有间隙和双曲面的情况下将胚胎标记为狭窄的条带,但是这些条带的数量将是不稳定的:区段可以是12、18甚至20。通常,配对规则基因很难控制基因缺口,第一个粗略标记(7个区域)有助于准确可靠地进行最终标记(14 + 3个片段)。

算法的下一点是标记每个段的前面,中间和后面。这是通过区段极性基因完成的。它们也相互抑制,并由基因网络的更高模块(配对规则和间隔)开启。仅选择其产品的扩散和衰减参数,以使条带非常薄-半段。与成对规则的基因相比,相互抑制它们的功能更弱且更有组织。因此,它们的活动条部分重叠,并且在每个段中获得了频繁的“线”,它们是不同重叠的条。

关闭区段极性基因通常不会导致胚胎缩短和其部分丧失(这是缺口和成对规则的典型特征),但会产生更微妙的影响。通常,在这种情况下,假定该基因起作用的每个片段的一半变成另一半的镜像。这是清晰可见的,因为蝇幼虫有成排的向后指向的小刺-为爬行提供了便利。区段极性基因中的突变体具有成排的向前刺。

最后,轮到该网络最著名和最先发现的基因-hox模块。他们的工作赋予了节段个性,使触角和长鼻在头部节段上生长,而腿和翅膀在胸部节段上生长。与以前的模块不同,hox基因不会抑制彼此的活性,并且可以在同一胚胎区段中协同工作。 hox基因的一个奇怪特性尚未得到解释:它们位于染色体上紧密的一组,并且以它们在胚胎体内起作用的顺序排列。

图片

胚胎的标记是基于“离胸部越远,hox基因越多,它越活跃”的原理:abdominal-A基因的活性始于2个腹部节段,增加到4个完整节段,并在随后的所有节段中以最大水平持续;腹部B基因从腹部的第5到第8区段起作用,从而在随后的每个区段中增加活性。 Ultrabithorax基因包含在第三胸段的半强度中,并且在整个腹部都具有完整的能力。当在bithorax突变体中将其关闭时,第3胸段的细胞不知道它们是第3胸段,它们具有与第2胸段相同的hox基因集(即仅触角足),并且第3胸段的发育沿程序2胸部-带翅膀而不是地面的甲虫和强大的飞行肌肉。

如果在一个单独的段中关闭所有hox基因,结果会很丑陋,但大多数情况下看起来像是1个胸部,有腿,没有翅膀。这是因为昆虫的远古祖先就像三叶虫或千足虫。他们的腿有许多相同的部分。随后,他们的身体变短,背部失去了腿,成为腹部,几个前段连接了头部,他们的腿成为了口腔器具的一部分(下颌骨,上颌骨和下唇)。

用于标记胚胎的遗传网络的数学模型


在大肠杆菌中的乳糖操纵子和直接连接环的情况下,可以构建具有相当数量参数的相当简单的数学模型,这些参数可以预测任何输入信号的基因行为。对于乳糖操纵子,就足够了:

-四个结合常数(带有DNA的阻遏物和激活子,带有阻遏物的乳糖,带有激活子的cAMP)
-四个化学计量参数(每个操纵子1个阻遏子4个乳糖,每个操纵子2个cAMP 1激活子,1个阻遏子和激活子)
-两个调节参数(阻遏物和激活物对RNA聚合酶着陆的可能性的影响)
-操纵子活性的基本水平(没有阻遏物或激活物时)
-转录延迟
共12个参数。

现在让我们看看Hox基因的调控区域。在下图中,腹部B基因的调控模块之一。

图片

彩色条表示调节蛋白结合位点。整个区块的大小约为1700个核苷酸,比乳糖操纵子的调控区长10倍。它有39个种植位点,可容纳来自该基因网络所有高级模块的7种不同的调节蛋白。而腹部B具有四个这样的调节块。它们从腹部的第5段到第8段依次打开,并在这些段中逐步增加腹部B蛋白的水平。也就是说,仅对于该基因的matmodel,以良好的方式,您需要100多个结合常数,相同数量的调节参数和未知数量的参数来描述不同输入之间的相互作用-在最坏的情况下,所有蛋白质着陆位点之间最多有1,500个成对相互作用监管单位。也就是说,这个基因网络的完整模型肯定会具有上千个参数。这是主要的问题:在实验中没有太多可以测量的输出信号-实际上,只有25种蛋白质中的每一种的水平及其在胚胎长度上的分布。因此,没有人试图用与乳糖操纵子相同的粒度来模拟该网络。

您可以尝试简化任务,并仅使用三个参数(结合,化学计量和调控参数)来描述每种调控蛋白对基因的影响。您可以选择这些参数(例如,使用马尔可夫链),以使模型准确地再现基因活性的真实条带。对于前两个网络单元(鸡蛋极性基因和基因间隙)这样的模型甚至(由例如)。

问题在于选择算法的不同开始会赋予不同的模型参数-但是它们都可以正常工作并在真实的蝇芽中繁殖基因的活性!这些模型具有共同的特征(例如,所有的间隙基因相互抑制并被母体蛋白激活),但差异不亚于相似性。

而且由于对建模的不同尝试会得出不同的结果,因此至少其中之一不可能与现实相符。更糟糕的是,此类模型可重现正常运行状态,但在预测突变结果时却错过了很多机会。

在下一部分中,我们将讨论为什么在生物学中不可避免地会遇到基因网络研究中的这些麻烦(而果蝇胚胎标记网络是最简单的研究之一!),对此可以做什么,以及应该向生物学家学习什么工程师。

Source: https://habr.com/ru/post/zh-CN400905/


All Articles