¿Qué es el genoma completo y por qué es necesario?

Atlas ha lanzado un nuevo producto: The Complete Genome . Ahora podemos estudiar no solo puntos individuales en el genoma, como en la prueba genética, sino también leer la secuencia completa de nucleótidos del genoma. En este artículo te contamos qué es y por qué es necesario.

Atencion Le daremos el Genoma completo a uno de nuestros lectores que completará todas las tareas. Más detalles al final del artículo.

Genoma completo


¿Qué significa el genoma completo?


Para lidiar con el genoma completo o la secuenciación del genoma completo (WGS), primero le contamos brevemente sobre la tecnología de una prueba genética convencional.

Microchip y prueba genética de rutina


La prueba genética Atlas, como muchas pruebas similares, se realiza utilizando un microarray de ADN (microarrays de ADN, Beadchip). La superficie del microchip de ADN contiene muchas depresiones pequeñas (aproximadamente 700 mil), cada una de las cuales contiene una bola de silicio con un diámetro de aproximadamente 3 micrómetros. En la superficie de esta bola hay cientos de miles de secuencias de ADN cortas e idénticas de cadena simple unidas con ella, correspondientes a la parte del genoma humano ubicada junto a la variación estudiada (SNP, SNV). Cada bola corresponde a una sola variación genética, y las coordenadas de los agujeros en el chip para cada bola son conocidas (Figura 2D).

Bloque educativo 1
Snip o SNV (Single Nucleotide Varition) es una variación genética, es decir, un cambio en la secuencia de ADN en un solo nucleótido. Por ejemplo, uno de los tres nucleótidos (alelos) A, G o T puede existir en una determinada posición en el gen X, y los nucleótidos son idénticos en diferentes personas en el resto de la secuencia (Figura 1). De esta carta, puede depender una característica específica de una persona.


Figura 1 Imagen de Rentonorama

Por ejemplo, el polimorfismo rs4481887, que se encuentra en el primer cromosoma al lado del gen del receptor olfativo OR2M7, tiene tres alelos: A, G y T. La presencia del alelo A en uno o ambos cromosomas (genotipos A / G, A / T y A / A) determina la sensibilidad al olor a orina después de consumir espárragos. En ausencia del alelo A, una persona ni siquiera se dará cuenta de que después de comer espárragos en la orina, se libera una sustancia con un olor característico.

Indel o INDEL (Inserción / Deleción) es otro tipo de variación genética que implica la eliminación o inserción de uno o más nucleótidos. Los recortes y las indelecciones juntas, junto con posibles cambios estructurales: grandes deleciones, inserciones, translocaciones, inversiones, son la diferencia real en el genoma de diferentes personas.


Al pasar la prueba genética Atlas, se aísla el ADN genómico y mitocondrial de la saliva, aumenta el número de copias (amplifica) y fragmenta - corta en trozos pequeños (Figura 2A). Numerosos fragmentos monocatenarios de ADN humano están conectados con sus secuencias correspondientes en bolas de silicio (Figura 2B), después de lo cual estas secuencias se extienden por 1 nucleótido fluorescente artificial (Figura 2C). Diferentes nucleótidos brillan en diferentes colores: rojo y verde. Por la relación de las intensidades luminosas de cada color (Figura 2E), se puede determinar el genotipo que corresponde a la pelota.


Figura 2

Después de escanear todo el chip, obtenemos alrededor de 700 mil genotipos de variaciones y los pasamos a través de nuestro sistema de interpretación. A menudo, los usuarios intentan comparar los resultados de diferentes pruebas, pero notan una gran diferencia. Esto sucede por varias razones. En primer lugar, diferentes compañías usan diferentes versiones de chip y conjuntos SNV. Como resultado, en algunos chips hay conjuntos únicos de variaciones que no se pueden encontrar en otros chips. En segundo lugar, siempre existe un error de genotipado, que puede ocurrir por varias razones, aunque hace la menor contribución a la diferencia en los resultados. Los datos de la investigación muestran que la precisión del genotipado en microarrays de ADN que Atlas utiliza es superior al 99,5%. Pero la razón principal de las diferencias en los resultados de las pruebas genéticas en la interpretación es que las diferentes compañías lo hacen de manera diferente incluso para los mismos datos de genotipado iniciales.


¿Qué es la secuenciación del genoma?


La principal diferencia entre la secuenciación del genoma y el genotipado en microarrays es la tecnología y el procesamiento de los datos obtenidos. Con la secuenciación de todo el genoma, se determina casi toda la secuencia de ADN. Casi, porque hay secciones en el genoma que, por diversas razones, no se pueden leer. A menudo, estos son sitios de telómeros y centrómeros, de los extremos y el centro de los cromosomas. Para determinar las secuencias de tales regiones del genoma, se utilizan tecnologías inaccesibles altamente especializadas. Dichos estudios son principalmente de investigación en la naturaleza.

La determinación de la secuencia de ADN le permite conocer los genotipos de las variaciones en cualquier parte del genoma, incluidas las variaciones estudiadas en el microarray de ADN en la prueba genética Atlas. La tecnología NGS (secuenciación de próxima generación) se utiliza para determinar de forma rápida y eficiente la secuencia del genoma. Existen varios métodos fundamentalmente diferentes creados por diferentes compañías.

La esencia del método Atlas es la siguiente: el ADN extraído y purificado se amplifica muchas veces y se fragmenta a una cierta longitud. Para cada fragmento, se cosen secuencias especiales que le permiten controlar este fragmento. Son estos fragmentos procesados ​​los que se leen (Figura 3).


Figura 3 Proceso de secuenciación paso a paso: cada nucleótido posterior fluoresce en su canal de color único.

En cada paso, se produce una extensión de un nucleótido, con el que se asocia una sonda fluorescente. Cada uno de los cuatro nucleótidos está asociado con una sonda de un color específico. Así, paso a paso, por el color del resplandor, se puede determinar el orden de los nucleótidos en el fragmento estudiado. Las secuencias resultantes de cada fragmento se denominan lecturas, y producen alrededor de mil millones por cada muestra del ADN estudiado. Las lecturas y las métricas de calidad de lectura se almacenan en formato de texto FASTQ.

A continuación, las lecturas se alinean (asignan) al genoma de referencia. Usando un software especial, por ejemplo, el alineador Burrows-Wheeler, para cada lectura, se busca un lugar en el genoma de referencia al que corresponde. La lectura junto con la información sobre la posición en el genoma se registra en un formato de archivo SAM o BAM. La visualización de los genes mapeados en el genoma en el archivo SAM (BAM) usando el navegador genómico IGV se muestra en la Figura 4.


Figura 4 Visualización del archivo BAM en el programa IGV (sitio de cromosomas de una persona). Las lecturas asignadas se indican mediante bloques horizontales, la posición se indica en la pista de arriba.

La figura también muestra cuál es la profundidad de la cobertura cuando varias lecturas alineadas cubren cualquier posición en el genoma de referencia. El valor se promedia en todo el genoma y se utiliza como indicador de la calidad del estudio. Atlas garantiza una cobertura promedio del genoma de profundidades superiores a 30, lo que garantiza un genotipo de alta calidad. Aumentar la profundidad de lectura aumenta significativamente el costo de secuenciación, la precisión de determinar las variaciones genéticas y se utiliza en estudios oncológicos estrechos, por ejemplo, en el Atlas de Diagnóstico Oncológico.

Bloque educativo 2
Un genoma de referencia es una secuencia de ADN ensamblada artificialmente de una especie biológica. La mayoría de las secuencias a partir de las cuales se ensambló el genoma humano de referencia fueron tomadas de una persona de origen africano-europeo. El genoma de referencia se actualiza regularmente: la última versión, GRCh38, se lanzó en 2013 y contiene 3.300 millones de nucleótidos. A pesar de la disponibilidad de la nueva versión, muchas pruebas genéticas y servicios de análisis de datos genéticos utilizan la anterior: GRCh37. Atlas utiliza la versión GRCh38 para proporcionar los resultados de análisis más precisos.


Los archivos obtenidos después del mapeo (archivos SAM, mapa de alineación de secuenciación, o en forma binaria BAM - mapa de alineación binario) se filtran y se utilizan para buscar variaciones en el genoma, incluidas las variaciones de un solo nucleótido y las inserciones y deleciones cortas. La figura 5 muestra la presencia de la variante de un solo nucleótido en el cromosoma 1 en la posición 248333561 (el ejemplo anterior rs4481887 es la variante que determina la sensibilidad al olor a orina después de comer espárragos).


Figura 5 Visualización de un archivo BAM en un programa IGV. Gráfico del cromosoma 1. En la posición 248333561 se encuentra el polimorfismo rs4481887: el nucleótido en esta posición no corresponde al genoma de referencia y se resalta en color. En todas las lecturas que cubren esta parte del genoma, hay un nucleoide G, que indica la homocigosidad del genotipo. Una persona con estos resultados de secuenciación tendrá un genotipo G / G e insensibilidad al olor a orina después de comer espárragos.

Las variaciones genéticas encontradas se almacenan en un archivo VCF (formato de llamada variante). Contiene alelos detectados para cada posición del genoma, así como indicadores de la calidad del genotipo. El archivo VCF se filtra: los registros sobre la presencia / ausencia de variaciones que no corresponden a los umbrales de calidad y son potencialmente falsos se eliminan de él. A cada variación encontrada se le asignan datos de dbSNP conocidos, en particular, identificadores únicos rsID.

Puede familiarizarse con los detalles de los formatos para almacenar datos de secuenciación y genotipado en los siguientes enlaces:
FASTQ - maq.sourceforge.net
SAM - samtools.imtqy.com
VCF - samtools.imtqy.com

Para la visualización del mapeo de lecturas (archivos SAM o BAM) se utilizan varios programas. El más popular es IGV (Integrative Genomics Viewer de Broad Institute). Descargue IGV y familiarícese con él en el enlace .


¿Qué datos interpreta el Atlas?


El genoma completo contiene datos sobre esas variantes de genes que están en la prueba genética Atlas, así como sobre características que no pueden calcularse utilizando la tecnología de genotipado mediante microarrays de ADN. Por ejemplo, estos síntomas incluyen los riesgos de cáncer.

Salud


383 Enfermedades hereditarias
El enfoque principal de todas las pruebas Atlas es la sección de salud, y nuestra nueva prueba Full Genome no fue la excepción. A los síntomas de nuestra prueba principal, agregamos otras 65 enfermedades hereditarias.

Las enfermedades hereditarias o monogénicas incluyen enfermedades que se transmiten de padres a hijos y cuyo desarrollo no se ve afectado por el estilo de vida de una persona. Para el desarrollo de tal enfermedad, las mutaciones de uno o ambos padres son suficientes, dependiendo del tipo de herencia de la enfermedad.



21 enfermedad multifactorial
El desarrollo de enfermedades multifactoriales está influenciado por genes, estilo de vida y factores ambientales. Dichas enfermedades incluyen, por ejemplo, diabetes mellitus, obesidad, enfermedad de Parkinson y Alzheimer, dermatitis atópica. En su cuenta personal, el usuario puede calcular el riesgo relativo de desarrollar la enfermedad basándose en datos de pruebas y un cuestionario sobre estilo de vida.

6 otros síntomas relacionados con la salud
Aquí hemos recopilado signos que afectan el estilo de vida de una persona. Por ejemplo, duración del sueño, cronotipo, síndrome de fatiga crónica, miedo al dolor.



Genética clínica


43 riesgos de cáncer
Debido al hecho de que se están estudiando más variantes de genes en el genoma completo, obtenemos más datos y podemos evaluar los riesgos de desarrollar cáncer. Según los resultados de la prueba, evaluamos la predisposición a los síndromes de cáncer hereditario.

Los síndromes oncológicos hereditarios son enfermedades genéticas que se pueden transmitir en una familia de generación en generación y aumentan los riesgos de ciertos tipos de cáncer. Alrededor del 10% de los casos de oncología son hereditarios.

La búsqueda de síndromes de cáncer hereditario es útil principalmente para aquellos que han tenido casos de cáncer en la familia. La naturaleza hereditaria puede estar indicada por la edad temprana del inicio de la enfermedad (hasta 50 años), la presencia de varios familiares en la misma línea con el mismo diagnóstico, formas raras de cáncer. Según los resultados de la prueba, el médico determinará la cantidad de investigación adicional y elaborará un programa personal de gestión del riesgo de cáncer. Obtenga más información sobre cómo se desarrollan los tumores malignos en nuestra serie de artículos.



53 Indicaciones de susceptibilidad a los componentes activos del fármaco.
Cada persona reacciona de manera diferente a las drogas: en algunas, la droga funciona bien, otras sufren de efectos secundarios graves y en otras, el tratamiento es ineficaz. En algunos casos, esto se debe al trabajo de genes que afectan el metabolismo de las sustancias activas y los riesgos de reacciones adversas.

Por ejemplo, el medicamento Omeprazol reduce la secreción de ácido clorhídrico en el estómago. Utilizado en el tratamiento de la úlcera péptica del estómago y el duodeno, enfermedad por reflujo. El gen CYP2C19 codifica una enzima que es responsable del metabolismo del omeprazol. Por lo tanto, dependiendo de las variantes del gen, es necesario ajustar la dosis de omeprazol o usar un medicamento alternativo.

En la prueba, examinamos las variantes genéticas asociadas con el metabolismo de 53 fármacos. Entre ellos se encuentran los antidepresivos, los anticonceptivos hormonales, un medicamento para reducir la coagulación de la sangre y algunos otros.



Informe especializado sobre enfermedades hereditarias
El informe es la conclusión del Laboratorio de Bioinformática Clínica Fedor Konovalov. Los laboratorios de bioinformática buscan el transporte de enfermedades recesivas. Tal transporte a menudo no afecta la salud de una persona, pero puede provocar enfermedades en sus hijos por nacer. Además, el laboratorio puede identificar una mutación única que no se ha descrito previamente y dar una conclusión sobre si es probablemente patógena.

Los expertos realizan un análisis exhaustivo de la información científica relevante sobre mutaciones y enfermedades en cada caso. La conclusión contiene toda la información necesaria para el genetista. Con este informe puede contactar a un especialista en caso de necesidad.

Tales informes genéticos son similares a un documento legal con una abundancia de términos complejos, que solo un especialista puede evaluar correctamente, en nuestro caso, un genetista. Por lo tanto, no mostramos genética clínica antes de la consulta. Durante la reunión, el genetista le dice en detalle a qué debe prestar atención, teniendo en cuenta sus antecedentes familiares y la presencia de síntomas. Esto puede ayudar, por ejemplo, a aclarar la edad a la que comienza la detección de ciertas enfermedades o al planificar una familia.

Nutrición


28 informes
Según las pruebas genéticas e incluso el genoma completo, es imposible seleccionar la nutrición óptima y hacer una dieta. Hay tantos productos, sus métodos de cocción y platos que es difícil para los investigadores encontrar correlaciones con las variantes de los genes. Sin embargo, algunos datos todavía están allí.

A partir de ciertas variantes de genes, podemos averiguar si una persona tiene una predisposición a la intolerancia a la lactosa o al gluten, el cuerpo hace frente rápida o lentamente al alcohol o la cafeína, y también evaluar la predisposición a un cierto nivel de hierro, calcio, omega-3 y 6 ácidos grasos. Según estos datos, una persona puede decidir qué productos debe eliminar o viceversa agregar a la dieta.

Deporte


16 informes
Determinar el deporte que más le conviene genéticamente es tan difícil como recoger comida. Hay muchos tipos de actividad física, y el concepto de deporte se expande cada año. Así que el skateboarding y el surf se agregaron al programa de deportes olímpicos. Hay demasiados tipos de actividad física para determinar más genéticamente. Por lo tanto, no crea las pruebas genéticas que prometen encontrar el deporte más adecuado para usted. Elige el deporte que más te guste.

La comunidad de ciencias genéticas está preocupada de que los padres hagan pruebas genéticas a sus hijos para descubrir qué deporte es mejor para ellos. En este caso, el niño puede ser enviado a un grupo que no le gusta, pero que es adecuado para los resultados de la prueba. Si una persona quiere lograr resultados sobresalientes en el deporte, el éxito dependerá en gran medida de sus ambiciones, fuerza de voluntad y carácter. Las variantes genéticas juegan un papel más pequeño aquí.

Mediante una prueba genética, puede descubrir cómo los genes afectan el riesgo de lesiones deportivas, la cantidad de factor de crecimiento libre de insulina tipo 1, el nivel de glóbulos rojos, la eritropoyetina y también las características del metabolismo de los aminoácidos: valina, leucina y L-carnitina. A los resultados del Genoma Completo, también agregamos el riesgo de neuralgia del nervio ciático, el nivel de IGFBP-3, el volumen espiratorio y otros.

Otros síntomas


15 informes
En esta sección, hemos recopilado signos que se relacionan con las características del cuerpo: apariencia, percepción de la luz, sensibilidad a las hierbas y los olores. En nuestra prueba, no encontrará signos relacionados con las emociones, el comportamiento o el carácter. Básicamente, estos rasgos dependen de las características de la educación, el medio ambiente y los hábitos, y en menor medida se ven afectados por las variantes genéticas. Además, muchas cualidades personales se pueden cambiar o desarrollar en la edad adulta.

Origen


3 informes
La genética no utiliza el concepto de etnia o nacionalidad. En mayor medida, se deben a diferencias culturales y no a variantes genéticas diferentes. En cambio, la genética utiliza el concepto de población: un grupo de personas que han estado viviendo en el mismo territorio durante mucho tiempo. Hoy en día, los datos genómicos de ciertas poblaciones están disponibles, de los cuales los científicos han identificado secuencias y variantes de genes característicos de cada uno. Los estudios genéticos de origen son la búsqueda de tales variantes en el genoma y la determinación de la similitud genética con poblaciones conocidas en términos porcentuales.

Además de la composición de la población por el código genético, puede encontrar su haplogrupo. Un haplogrupo es un grupo de personas con la misma variante genética que ocurrió en un ancestro común hace miles de años. Además, el porcentaje de ADN de neandertal se puede determinar a partir del genoma. Alrededor del 1 al 4% del ADN de neandertal se encontró en el genoma de los humanos modernos. Ahora solo se conocen algunos signos que dependen de la disponibilidad de variantes del gen Neanderthal: crecimiento del vello posterior y el nivel de lipoproteínas LDL de baja densidad (colesterol malo).


Comparación de la prueba genética completa del genoma y el atlas


¿Por qué el genoma completo?


La principal ventaja del Genoma Completo es que obtienes toda la información sobre tu ADN. Cuando aparecen nuevos datos, simplemente los agregamos a su cuenta. No siempre funciona con la prueba genética habitual, ya que examina alrededor de 660,000 variantes, el 0.1% de todo el ADN.Para interpretar los nuevos signos, pueden no ser suficientes.

Los resultados de la prueba ayudarán a tomar medidas para la prevención de enfermedades, la planificación familiar y el médico podrá aclarar el diagnóstico en el futuro o ahora. La prueba se enviará a su hogar y todo lo que se requiere del usuario es recoger una muestra de saliva y llamar a un servicio de mensajería para transferir los tubos de ensayo al laboratorio.

La base del Atlas Complete Genome: análisis genético de alta precisión (99.5%), control de calidad de los datos obtenidos, un sistema patentado de interpretación de datos, acceso a los datos fuente, asesoramiento genético, así como artículos científicos seleccionados que están disponibles para todos los usuarios. El usuario recibe todo esto por 94.500, el precio más bajo para dichos servicios en Rusia. La prueba ya se puede comprar en el sitio web de Atlas .

Si sabe cómo trabajar con grandes datos, y especialmente con bioinformática, sus datos sin procesar del genoma completo pueden ser plastilina, con los que puede jugar a su gusto y aprender más sobre usted. Por ejemplo, puede eliminar las variantes de genes que otras compañías están estudiando y cargar interpretaciones en su base de datos, averiguar la relación con otra persona, tomar el ADN de referencia de un chimpancé o un neandertal y comparar qué tan similar es usted.

Y tambien


¡Atlas ha preparado un gran regalo para los lectores de Habr! En los siguientes artículos, daremos 3 tareas con ejemplos y datos de entrada, así como información sobre el software necesario. ¡El primero en resolver todos los problemas recibirá el Genoma Completo como regalo !

Source: https://habr.com/ru/post/479602/


All Articles