DNA如何测序

近几十年来,DNA测序已从由少数科学家处理的狭窄领域发展成为发展最快的技术之一。生产力的增长和成本的下降甚至超过了摩尔定律,由于市场的激烈竞争和巨大的需求,发展将继续高速发展。此外,测序技术的发展导致了生物信息学的繁荣,并从根本上改变了生物学,并逐渐从根本上改变了医学。



通过凯特,我将向您详细介绍他们的做法。

什么是DNA
首先,要了解过程本身,需要一些必要的理论。
DNA是一条由四种类型的称为核苷酸的单体组成的聚合物链,其序列编码有关人体的信息。换句话说,DNA可以表示为以四个字母组成的文本。 DNA是由两条链组成的分子,尽管它们的核苷酸序列不同,但是如果知道另一条链的序列,则可以明确地恢复一条链的序列。因此,链条称为互补链。 (英文补语-补充)当DNA链被解开时复制细胞时,使用此属性,并且在每个矩阵上(例如在矩阵上)合成第二个,并且两个子细胞中的每个接收其双链DNA。生物体的整个DNA序列称为基因组。例如,人类基因组由46条染色体组成。

尽管有各种各样的实验方法和过时方法,但主流的商业方法却非常相似,为了不每次都保留,我将马上说这些主流方法。

总体外观在
描述排序技术之前,为了直观理解,我将进行以下比喻:它们将一堆完全相同的报纸炸开,使它们飞散成带有文本片段的小块,然后阅读每个片断,并从这些阅读中恢复文本。原始报纸。

要对DNA进行测序,首先要从测试样品中分离出DNA,然后将其随机切成小片段,这些片段称为读段。每次读取留下一条链,在该链上(如在基质上)合成第二条链,并以某种方式检测到每个后续核苷酸的连接类型。因此,记录连接核苷酸的序列,在每次读取时恢复其序列。然后,使用计算机程序从计算机读数中重建基因组。

重要的一点。读取的总长度应比所研究的DNA的长度长很多倍。这样做的原因是,当从样品中提取DNA并进行切割时,其中的一部分会丢失,因此没有人保证其每个部分都将至少进入一个读数。因此,为了确保每个部分都被读取,要大幅度地提取DNA。此外,测序过程中可能会发生错误,并且为了更可靠地读取DNA,应该将其每个部分读取几次。


DNA被切成可读取的读段,并从中恢复原始序列

这项技术没有被用于良好的生活。这增加了许多困难,并且如果研究人员能够一次读取并读取基因组的整个序列,他们会很高兴,但是,目前尚不可能。
有两个原因。首先是读取每个核苷酸时发生的错误。它们逐渐积累,随后的每个核苷酸的读取均比前一个核苷酸差,并且在某些时候读取质量降低,以至于无法继续该过程。对于不同的测序方法,它们可以很好地读取的读取长度约为数十或数百个核苷酸。第二个原因是DNA是一个很长的分子,仔细阅读朋友后的每个字母,测序将花费很长的时间,在这种情况下,此过程很容易并行化,并且可以同时读取数百万亿条读数。



照度
这种方案概述了所有流行的测序技术。它们仅在合成期间检测连接的核苷酸的方法以及材料的制备方法不同。

迄今为止,Illumina定序器中使用的是最常见的方法。在这种方法中,首先,将许多不同的读数附加到玻璃板上。然后,根据每次读取,在印版表面上会制作许多副本,因此只有相同的副本位于其每个小部分上。这样做是为了在后续测序期间不从单个分子而是从附近的一组相同分子接收信号。因此,信号更易于读取,并且读取的可靠性增加。这些分子是单链DNA,在测序过程中在其上合成了互补链。合成反应如下进行:每个核苷酸的开始连接一个核苷酸。该核苷酸被化学封阻,因此添加之后,合成不再进行下去。另外,在激光发光的作用下将标签附于标签上。而且,对于每种类型的核苷酸,发光的颜色是不同的。核苷酸连接后,用激光照射板,然后照相机捕获板发光的颜色。此后,将删除锁,同时也删除标记,并以相同的方式连接下一个核苷酸。将计算机中平板每个部分的光信号序列翻译成核苷酸序列,然后在输出中获得包含读取序列的文件。核苷酸连接后,用激光照射板,然后照相机捕获板发光的颜色。此后,将删除锁,同时也删除标记,并以相同方式连接下一个核苷酸。将计算机中平板每个部分的光信号序列翻译成核苷酸序列,然后在输出端获得包含读取序列的文件。核苷酸连接后,用激光照射板,然后照相机捕获板发光的颜色。此后,将删除锁,同时也删除标记,并以相同的方式连接下一个核苷酸。将计算机中平板每个部分的光信号序列翻译成核苷酸序列,然后在输出端获得包含读取序列的文件。


Illumina
1 — 2 — 3 — , 4 — 5 — 6 — 7 —



如果近亲生物的基因组之前未进行过测序,则可以通过读取,然后使用程序,尝试组装单个核苷酸序列。芦苇部分重叠,并且利用这些重叠,它们尝试构建单个序列。有很多要点使问题复杂化。例如,您可以污染样品,程序将尝试从不同生物的DNA构建一个序列。测序仪在读取读物时可能会犯错,或错误地链接基因组中的两个位置,因为它们非常相似。实际上,有很多困难,您将不会在这里列出所有人。而且,其中一些很难消除,以至于人类基因组(最重要且研究最广泛的基因组)仍未测序到底。


读取并在其下方读取基因组序列,该基因组序列是基于它们进行重组的。

组装完基因组序列后,您需要了解其含义。在上面发现了看起来像基因的区域。这样做的方法如下:在基因的开始和结尾处,存在某些核苷酸的“标记”,并且如果DNA包含这样的序列,且其距离足以使一个基因适合它们之间,则该位置会被输入到潜在基因列表中。然后,将该申请人与其他生物的已知基因的数据库进行比较,如果在其中找到了一个与该位点非常相似的基因,那么将为其分配该基因的功能。

如果已经对该物种的另一生物的基因组进行了测序,则将其用于组装。由于相同物种的不同生物的基因组仅略有不同,因此每次读取时,它们都会在测序的基因组中找到一个最接近的位置,并在此基因组的基础上组装一个新的序列。

Source: https://habr.com/ru/post/zh-CN385865/


All Articles