Como o DNA é sequenciado
O seqüenciamento de DNA nas últimas décadas evoluiu de um campo estreito, tratado por um pequeno número de cientistas, para uma das tecnologias de crescimento mais rápido. O crescimento da produtividade e a queda nos custos estão ainda à frente da lei de Moore e, devido à forte concorrência no mercado e à enorme demanda, o desenvolvimento continuará em ritmo acelerado. Além disso, o desenvolvimento do seqüenciamento levou ao mesmo boom em bioinformática e mudou radicalmente a biologia e, gradualmente, também mudou fundamentalmente a medicina.
Por kat, eu digo mais sobre como eles fazem isso.O que é DNAPara iniciantes, para entender o próprio processo, um pouco de teoria necessária.O DNA é uma cadeia polimérica composta por quatro tipos de monômeros chamados nucleotídeos, cuja sequência codifica informações sobre o corpo. Em outras palavras, o DNA pode ser representado como texto escrito em um alfabeto de quatro letras. O DNA é uma molécula que consiste em duas cadeias e, embora sua sequência de nucleotídeos seja diferente, a sequência de uma cadeia pode ser restaurada sem ambiguidade se a sequência da outra for conhecida. Portanto, as cadeias são chamadas complementares. (Complemento de inglês - suplemento) Essa propriedade é usada ao copiar uma célula quando as fitas de DNA são desembrulhadas e, em cada uma delas, como em uma matriz, a segunda é sintetizada e cada uma das duas células filhas recebe seu DNA de fita dupla. Toda a sequência de DNA de um organismo é chamada genoma. Por exemplo, o genoma humano consiste em 46 cromossomos.Apesar do grande número de métodos diversos, experimentais e obsoletos, os métodos comerciais convencionais são bastante semelhantes e, para não fazer reservas todas as vezes, direi imediatamente que será sobre esses métodos convencionais.Como parece em geralAntes de descrever a tecnologia de sequenciamento, para um entendimento intuitivo, vou traçar a seguinte analogia: eles explodem uma pilha de jornais idênticos para que se separem em pequenos pedaços com fragmentos de texto e, em seguida, cada um desses pedaços é lido e, a partir dessas leituras, o texto é restaurado jornal original.Para sequenciar o DNA, ele é primeiro isolado da amostra de teste e depois cortado em pequenos fragmentos aleatoriamente, os fragmentos são chamados de leituras. Uma cadeia é deixada de cada leitura, e a segunda é sintetizada nessa cadeia, como em uma matriz, e o tipo de cada nucleotídeo subsequente sendo anexado é de alguma forma detectado. Assim, ao gravar a sequência de nucleotídeos unidos, restaure sua sequência em cada leitura. Em seguida, o genoma é reconstruído a partir de leituras de computador usando programas de computador.Um ponto importante. O comprimento total das leituras deve ser muitas vezes maior que o comprimento do DNA estudado. Isso é feito porque quando o DNA é extraído da amostra e quando é cortado, parte dela é perdida, para que ninguém garanta que cada uma de suas seções caia em pelo menos uma leitura. Portanto, para garantir que cada seção seja lida, o DNA é coletado com uma grande margem. Além disso, podem ocorrer erros durante o sequenciamento e, para ler o DNA com mais confiabilidade, cada seção deve ser lida várias vezes.
O DNA é cortado em leituras que lêem, e a partir delas restaura a sequência originalEsta técnica não é usada para uma vida boa. Isso adiciona muitas dificuldades e, se os pesquisadores pudessem pegar e ler toda a sequência do genoma de uma vez, eles ficariam felizes, no entanto, isso não é possível no momento.Existem 2 razões para isso. O primeiro são erros que ocorrem ao ler cada nucleotídeo. Eles se acumulam gradualmente e cada nucleotídeo subsequente é lido pior do que o anterior, e em algum momento a qualidade da leitura é tão reduzida que não faz sentido continuar o processo. Para diferentes métodos de seqüenciamento, o comprimento da leitura, que eles podem ler bem, é da ordem de dezenas ou centenas de nucleotídeos. A segunda é que o DNA é uma molécula muito longa e, com uma leitura escrupulosa de cada letra após amiga, o seqüenciamento levaria um tempo indecente e, nesse caso, esse processo é facilmente paralelizado e milhões e bilhões de leituras podem ser lidas ao mesmo tempo.
IlluminaEsse esquema descreve todas as técnicas populares de seqüenciamento. Eles diferem apenas nos métodos de detecção de nucleotídeos unidos durante a síntese e no método de preparação do material.Até o momento, o método mais comum é usado nos seqüenciadores Illumina. Neste método, primeiro, muitas leituras diferentes são anexadas à placa de vidro. Em seguida, a partir de cada leitura, muitas cópias são feitas na superfície da placa, de modo que apenas cópias idênticas estejam localizadas em cada seção pequena. Isso é feito para que, durante o sequenciamento subsequente, receba um sinal não de uma única molécula, mas de um grupo de moléculas idênticas localizadas nas proximidades. Portanto, o sinal é mais fácil de ler e a confiabilidade da leitura aumenta. Essas moléculas são DNA de fita simples e cadeias complementares são sintetizadas sobre elas durante o seqüenciamento. A reação de síntese é realizada da seguinte forma: Um nucleotídeo é anexado ao início de cada molécula. Esse nucleotídeo é quimicamente bloqueadoque após sua adição, a síntese não avança. Além disso, uma etiqueta é anexada a ela, que sob a ação de um laser luminescente. Além disso, para cada tipo de nucleotídeo, a cor da luminescência é diferente. Depois que o nucleotídeo é conectado, a placa é iluminada com um laser e a câmera captura as cores com as quais a placa luminescente. Depois disso, a trava é removida, a etiqueta também é removida e o próximo nucleotídeo é anexado da mesma maneira. A sequência de sinais de luz em cada seção da placa no computador é traduzida em uma sequência de nucleotídeos e, na saída, é obtido um arquivo contendo a sequência de leituras.Depois que o nucleotídeo é conectado, a placa é iluminada com um laser e a câmera captura as cores com as quais a placa luminescente. Depois disso, a trava é removida, a etiqueta também é removida e o próximo nucleotídeo é anexado da mesma maneira. A sequência de sinais de luz em cada seção da placa no computador é traduzida em uma sequência de nucleotídeos e, na saída, é obtido um arquivo contendo a sequência de leituras.Depois que o nucleotídeo é conectado, a placa é iluminada com um laser e a câmera captura as cores com as quais a placa luminescente. Depois disso, a trava é removida, a etiqueta também é removida e o próximo nucleotídeo é anexado da mesma maneira. A sequência de sinais de luz em cada seção da placa no computador é traduzida em uma sequência de nucleotídeos e, na saída, é obtido um arquivo contendo a sequência de leituras.
Illumina
1 — 2 — 3 — , 4 — 5 — 6 — 7 —Se os genomas de organismos próximos não foram sequenciados antes, a partir das leituras, então, usando programas, eles tentam montar uma única sequência de nucleotídeos. Os juncos se sobrepõem parcialmente e, usando essas sobreposições, eles tentam criar uma única sequência. Há muitos pontos que complicam significativamente o assunto. Por exemplo, você pode contaminar uma amostra e o programa tentará criar uma sequência a partir do DNA de diferentes organismos. O sequenciador pode cometer um erro ao ler a leitura ou vincular incorretamente dois lugares no genoma porque eles são muito semelhantes. De fato, existem tantas dificuldades que você não listará todos aqui. E, alguns deles são tão difíceis de eliminar que até o genoma humano, o genoma mais importante e amplamente estudado, ainda não é sequenciado até o fim.
lê e abaixo da sequência do genoma, que é reconstruída com baseneles.Quando a sequência do genoma é montada, você precisa entender o que isso significa. Nele são encontradas áreas que se parecem com genes. Isso é feito da seguinte maneira: No início e no final dos genes, existem certos "marcadores" de nucleotídeos, e se o DNA contiver essas seqüências a uma distância que um gene possa caber entre eles, esse local será inserido na lista de genes em potencial. Então, esse candidato é comparado com um banco de dados de genes já conhecidos de outros organismos e, se um gene for encontrado bastante semelhante a esse site, ele receberá a função desse gene.Se o genoma de outro organismo desta espécie já foi sequenciado, é usado para montagem. Como os genomas de diferentes organismos da mesma espécie diferem apenas um pouco, a cada leitura eles encontram um lugar no genoma sequenciado do qual está mais próximo, e um novo é montado com base nesse genoma. Source: https://habr.com/ru/post/pt385865/
All Articles