Cómo se secuencia el ADN
La secuenciación del ADN en las últimas décadas ha evolucionado de un campo estrecho, que fue manejado por un pequeño número de científicos, a una de las tecnologías de más rápido crecimiento. El crecimiento de la productividad y la caída de los costos están incluso por delante de la ley de Moore y, debido a la fuerte competencia en el mercado y la gran demanda, el desarrollo continuará a un alto ritmo. Además, el desarrollo de la secuencia condujo al mismo auge de la bioinformática y la biología radicalmente cambiada, y, gradualmente, también cambia fundamentalmente la medicina.
Por kat, te cuento más sobre cómo lo hacen.¿Qué es el ADN?Para empezar, para comprender el proceso en sí, una pequeña teoría necesaria.El ADN es una cadena de polímeros que consta de cuatro tipos de monómeros llamados nucleótidos, cuya secuencia codifica información sobre el cuerpo. En otras palabras, el ADN se puede representar como texto escrito en un alfabeto de cuatro letras. El ADN es una molécula que consta de dos cadenas, y aunque la secuencia de nucleótidos es diferente, la secuencia de una cadena puede restaurarse sin ambigüedades si se conoce la secuencia de la otra. Por lo tanto, las cadenas se llaman complementarias. (Eng. Complemento - suplemento) Esta propiedad se usa al copiar una célula cuando las cadenas de ADN se desenvuelven, y en cada una, como en una matriz, se sintetiza la segunda, y cada una de las dos células hijas recibe su ADN de doble cadena. Toda la secuencia de ADN de un organismo se llama genoma. Por ejemplo, el genoma humano consta de 46 cromosomas.A pesar de la gran cantidad de métodos diversos, tanto experimentales como obsoletos, los métodos comerciales convencionales son bastante similares, y para no hacer reservas cada vez, diré de inmediato que se tratará de estos métodos convencionales.Cómo se ve en generalAntes de describir la tecnología de secuenciación, para una comprensión intuitiva, haré la siguiente analogía: explotan una pila de periódicos idénticos para que se separen en pedazos pequeños con fragmentos de texto, y luego cada una de estas piezas se lee y, a partir de estas lecturas, el texto se restaura Periódico original.Para secuenciar el ADN, primero se aísla de la muestra de prueba, luego se corta en pequeños fragmentos al azar, los fragmentos se llaman lecturas. Se deja una cadena de cada lectura, y la segunda se sintetiza en esta cadena, como en una matriz, y de alguna manera se detecta el tipo de cada nucleótido posterior que se está uniendo. Por lo tanto, registrando la secuencia de nucleótidos unidos, restaure su secuencia en cada lectura. Luego, el genoma se reconstruye a partir de lecturas informáticas utilizando programas informáticos.Un punto importante La longitud total de las lecturas debe ser muchas veces mayor que la longitud del ADN estudiado. Esto se hace porque cuando el ADN se extrae de la muestra, y cuando se corta, parte de él se pierde, por lo que nadie garantiza que cada una de sus secciones caiga en al menos una lectura. Por lo tanto, para garantizar la lectura de cada sección, el ADN se toma con un gran margen. Además, pueden ocurrir errores durante la secuenciación, y para leer el ADN de manera más confiable, cada sección debe leerse varias veces.
El ADN se corta en lecturas que leen, y de ellas se restaura la secuencia original.Esta técnica no se usa para una buena vida. Agrega muchas dificultades, y si los investigadores pudieran tomar y leer la secuencia completa del genoma a la vez, estarían felices, sin embargo, esto no es posible en este momento.Hay 2 razones para esto. El primero son los errores que ocurren al leer cada nucleótido. Se acumulan gradualmente y cada nucleótido posterior se lee peor que el anterior y, en algún momento, la calidad de lectura se reduce tanto que no tiene sentido continuar el proceso. Para diferentes métodos de secuenciación, la longitud de la lectura, que pueden leer bien, es del orden de decenas o cientos de nucleótidos. El segundo es que el ADN es una molécula muy larga y, con una lectura escrupulosa de cada carta después de un amigo, la secuenciación tomaría un tiempo indecente, y en este caso este proceso se paraleliza fácilmente, y se pueden leer millones y miles de millones de lecturas al mismo tiempo.
IlluminaTal esquema describe todas las técnicas de secuenciación populares. Solo difieren en los métodos de detección de nucleótidos unidos durante la síntesis y en el método de preparación del material.Hasta la fecha, el método más común se utiliza en los secuenciadores Illumina. En este método, primero, se unen muchas lecturas diferentes a la placa de vidrio. Luego, de cada lectura, se hacen muchas copias en la superficie de la placa, de modo que solo se encuentran copias idénticas en cada pequeña sección de la misma. Esto se hace para que, durante la secuenciación posterior, reciba una señal no de una sola molécula, sino de un grupo de moléculas idénticas ubicadas cerca. Por lo tanto, la señal es más fácil de leer y aumenta la fiabilidad de la lectura. Estas moléculas son ADN monocatenario y se sintetizan cadenas complementarias sobre ellas durante la secuenciación. La reacción de síntesis se lleva a cabo de la siguiente manera: se une un nucleótido al comienzo de cada molécula. Este nucleótido está químicamente bloqueado por lo queque después de su adición, la síntesis no va más allá. Además, se le adhiere una etiqueta que, bajo la acción de un láser, ilumina. Además, para cada tipo de nucleótidos, el color de la luminiscencia es diferente. Después de unir el nucleótido, la placa se ilumina con un láser y la cámara captura los colores con los que se ilumina la placa. Después de esto, se quita el bloqueo, también se quita la etiqueta y se une el siguiente nucleótido de la misma manera. La secuencia de señales de luz en cada sección de la placa en la computadora se traduce en una secuencia de nucleótidos y, a la salida, se obtiene un archivo que contiene la secuencia de lecturas.Después de unir el nucleótido, la placa se ilumina con un láser y la cámara captura los colores con los que se ilumina la placa. Después de esto, se quita el bloqueo, también se quita la etiqueta y se une el siguiente nucleótido de la misma manera. La secuencia de señales de luz en cada sección de la placa en la computadora se traduce en una secuencia de nucleótidos y, a la salida, se obtiene un archivo que contiene la secuencia de lecturas.Después de unir el nucleótido, la placa se ilumina con un láser y la cámara captura los colores con los que se ilumina la placa. Después de esto, se quita el bloqueo, también se quita la etiqueta y se une el siguiente nucleótido de la misma manera. La secuencia de señales de luz en cada sección de la placa en la computadora se traduce en una secuencia de nucleótidos y, a la salida, se obtiene un archivo que contiene la secuencia de lecturas.
Illumina
1 — 2 — 3 — , 4 — 5 — 6 — 7 —Si los genomas de organismos cercanos no se han secuenciado antes, entonces, a partir de las lecturas, luego, utilizando programas, intentan ensamblar una única secuencia de nucleótidos. Las cañas se superponen parcialmente y, utilizando estas superposiciones, intentan construir una sola secuencia. Hay muchos puntos que complican significativamente el asunto. Por ejemplo, puede contaminar una muestra y el programa intentará construir una secuencia a partir del ADN de diferentes organismos. El secuenciador puede cometer un error al leer la lectura o vincular incorrectamente los dos lugares en el genoma, porque son muy similares. De hecho, hay tantas dificultades que no enumerará a todos aquí. Y, algunos de ellos son tan difíciles de eliminar que incluso el genoma humano, el genoma más importante y ampliamente estudiado, aún no está secuenciado hasta el final.
lee y debajo de la secuencia del genoma, que se reconstruye a partir de ellos.Cuando se ensambla la secuencia del genoma, debe comprender lo que significa. En él se encuentran áreas que parecen genes. Esto se hace de la siguiente manera: al principio y al final de los genes hay ciertas "etiquetas" de nucleótidos, y si el ADN contiene tales secuencias a una distancia tal que un gen puede caber entre ellas, entonces este lugar se ingresa en la lista de genes potenciales. Luego, este solicitante se compara con una base de datos de genes ya conocidos de otros organismos, y si se encuentra un gen que es bastante similar a este sitio, se le asigna la función de este gen.Si el genoma de otro organismo de esta especie ya se ha secuenciado, entonces se usa para el ensamblaje. Dado que los genomas de diferentes organismos de la misma especie difieren solo ligeramente, para cada lectura encuentran un lugar en el genoma secuenciado al que está más cerca, y se ensambla uno nuevo sobre la base de este genoma. Source: https://habr.com/ru/post/es385865/
All Articles