当英国形态学家乔治·杰克逊·迈瓦特[St. 乔治·杰克逊·米瓦尔特(George Jackson Mivart)于1865年发表了最早的进化树之一;他缺乏辅助材料。 他通过对动物刺的详细分析,建造了一棵树-各种灵长类动物的
分支图 。 根据动物肢体的比较,第二棵树显示了灵长类动物之间的
其他家庭联系 ,突显了迄今为止存在的进化生物学问题。
大约150年后,科学家获得了大量数据来构建所谓的
系统发育树 ,这是Mivart创建的结构的现代版本。 DNA解码技术和
生物信息学的进步使您能够比较来自不同物种的数百个基因(有时甚至是整个基因组)的序列,并比以往任何时候都更详细地创建生命树。
自1866年以来的历史生命树描述了植物,动物和单细胞的王国但是,尽管大量的数据帮助解决了在进化树的不同部分出现的一些冲突,但这也带来了新的困难。 如今,生命之树的版本更像是一个有争议的Wikipedia页面,而不是已出版的书-有关某些分支的讨论仍在继续。 就像脊柱和四肢导致灵长类动物进化图的出现一样,科学家现在知道,同一体内的不同基因可以讲述不同的故事。
根据一项新的研究,部分基于酵母的研究,由单个基因得出的有争议的图片比预期的还要矛盾。 耶鲁大学的进化生物学家迈克尔·多
诺休 (Michael
Donoghue)说:“据称1,070个基因中的每一个都与某种冲突有关。” 他说:“我们正在试图找出180万个物种的系统发育关系,而我们自己无法分选二十种酵母。”
为了解决这一矛盾,研究人员开发了一种基于信息论的算法来测量对树的各个部分的正确性的置信度。 他们希望这种新方法将有助于弄清拥有最有趣,最有用和最矛盾的数据的进化时期,例如
寒武纪爆发 ,即5.4亿年前动物生命的迅速多样化。
范德比尔特大学的生物学家
安东尼斯·罗卡斯 (
Antonis Rokas)表示:“从历史上看,最有趣的事件与引起关注并引起争议的领域有关”,例如动物,脊椎动物和开花植物的起源。
根据新算法的结果,科学家只能选择最有用的基因来构建系统树。 这种方法可以使过程更加准确和高效。 弗吉尼亚理工学院的生物学家希迪尔·希鲁(Khidir Hilu)说:“我认为这将有助于加快生命树的重建。”
生活的砖块
通过根据物种的亲缘关系对物种进行分组,可以创建系统发育树的基础。 如果我们比较人类,黑猩猩和鱼类的DNA,那么很明显,人类和黑猩猩彼此之间的距离比与鱼类的距离更近。
曾几何时,研究人员使用一个或多个基因来比较生物。 但是在过去十年中,系统发育数据激增,非常迅速地填补了创建这些树所需的基础。 分析填补了散布在树上的几个白色斑点,但仍然存在严重分歧。
例如,尚不清楚谁最接近蜗牛-双壳软体动物或
铲足软体动物 ,Rokas说。 鲜为人知的是,树上的一些最早的动物分支(例如水母和海绵)是如何相互连接的。 科学家可以举例说明在同一科学期刊上出现相冲突的树木的例子,相差数周
甚至是同一期 。
“因此产生一个问题:为什么我们这么难以同意?” -罗卡斯说。

Rokas和他的研究生Leonidas Salichos通过使用最有用的基因(带有与进化史有关的大多数信息)构建树木的版本,
分别评估基因来研究此问题。
他们从23种酵母开始,选择了1,070个基因。 首先,他们以标准方式(串联)创建了系统发育树。 为此,将来自单个物种的所有序列收集到一个兆基因中,然后将单个物种的序列与该长序列进行比较,在此基础上,创建了一棵最能解释差异的树。
生成的树在标准统计分析方面是准确的。 但是,由于类似的方法导致树木出现分歧,因此Rokas和Salichos决定深入研究该主题。 他们为单个酵母基因建立了系统进化树集,并应用了使用信息论开发的算法来搜索不同树之间最大对应的区域。 结果
发表在五月的《自然》杂志上 ,是出乎意料的。 每个研究的基因似乎都在讲述一个稍微不同的进化故事。
Hilu说:“几乎所有为单个基因构建的树都与一棵基于数据连接的树相撞。” “这令人震惊。”
他们得出结论,如果几个基因支持特定的结构,那么它必须是准确的。 但是,如果不同的基因集同样支持两种不同的架构,那么它们与现实精确匹配的可能性就会降低。 Rokas和Salichos使用一种称为
统计引导程序的方法来选择信息最丰富的基因。
实际上,“如果只获得积极支持的基因,您将获得正确的树,” Donogue说。
修改过的树与建立在进化信息的另一种来源上的树相吻合-代代相传的DNA片段的大规模变化-证明了他们的研究是正确的。
发现不仅限于酵母。 将相同的分析应用于更大和更复杂的生命形式,包括脊椎动物和动物的遗传数据,他们发现单个基因之间存在严重冲突。
一些研究人员需要习惯于选择性地从分析中排除数据的想法。 耶鲁大学的一位进化生物学家
杰弗里·汤森德说:“多年来,人们试图了解生物之间的关系的主要问题一直是收集足够数据的问题。” “社区一直被告知需要数据集,因此他们以这种方式完成任务并不奇怪。”
尽管进化生物学家多年来一直在努力应对这些问题,但这项新研究已成为迄今为止迄今为止研究个体基因冲突程度的最大尝试。 “人们会有两个反应:冲突比我想象的要多,我们需要学习如何更好地分析它们,”多纳格说。他希望在工作中使用这种新方法。 但是,他也指出了确认新方法准确性的困难。 尽管修改后的树与基于替代遗传信息的构建相吻合,但后者可能揭示其自身的不一致之处。 他说:“我不确定我们是否真正了解这种关系。” “而且,如果我们不确定事物的真实状态,那么我们就不会知道树是否正确。”
改变图片
研究人员需要更广泛地应用新技术,以了解它如何改变进化的概念。 但是,Rokas和Salichos已经表明,重建树的短分支或树的“繁忙”部分代表着快速的物种形成时期是最困难的,尤其是那些靠近树根并在进化史上很深的树。
Rokas说:“理论研究预测了这种行为,但是我们的研究首次证明了使用实验数据的证实。”
Rokas认为,新发现将改变研究人员解释树木框架不清晰部分的方式。 进化生物学家通常认为,如果树没有必要的细节,那是错误的。 因此,如果我们收集更多的数据并编写更好的算法,那么我们将得出正确的选择,”他说。 但是,尽管存在数据流和应用了新型分析方法,但仍然存在树中冲突的部分,这可能表明存在丛生的部分。 “我认为在某些情况下该算法将能够解决该冲突,而在另一些情况下,则可以标记我们不太可能解决的冲突区域。
对树木的这些茂密部分的研究可以使人们对进化的特别有趣的阶段有了新的认识,例如寒武纪爆发,当时生命从简单的生物占主导地位转向了各种各样的动物物种。
其他学者也认为,发现会影响专家如何处理关于进化的矛盾观点。 汤森德说:“我认为这是范式转变的预兆。” “如果我们使用合适的方法,我们将有机会更多地了解困扰我们很长时间的问题。”
汤森开发了自己的方法,根据
进化速率选择信息最多的基因,他指出,并非科学界的所有成员都同意对新方法的需求。 他说:“我希望这项工作有助于将这个问题放在首位。”
选择合适数量的基因来构建系统进化树的原型并不是困扰进化生物学家的唯一问题。 他们还需要就加工中要包含的物种达成共识-树中的物种越多,分析就越困难。 由于针对不同物种收集的数据质量的差异,结果也可能有所不同。 “如果我们需要了解所有事物如何相互联系的真实进化史,那么对此有什么更好的选择-收集更多的基因或更多的物种? -Donogue说。 “我都认为。”
允许研究人员使用更少的基因获得准确结果的新方法,可以扩展进化树。 仅选择信息最丰富的基因的能力可以使过程更高效,并使科学家可以使用更少的数据和资源来创建准确的树木。 Khilu说:“如果我们可以选择多个基因并获得与整个基因组相同的好树,那么我们可以在属的水平甚至在物种的水平上建立更详细的生命树,而不必满足于最重要的分支机构的骨架。”