Algoritmo de selección de características para prueba de ADN

En la investigación científica, como en cualquier otra forma de ocupación humana significativa, un plan de acción es importante. Hay personas que se dedican a la ciencia pura, pero esta es una historia completamente diferente. Cuando se trata de la aplicación, es decir, el uso del método científico en la vida cotidiana, se necesita una secuencia clara de acciones, según la cual funcionará el transportador. Genotek se ocupa de la investigación genética aplicada, analiza e interpreta los datos registrados en el ADN. Nuestro departamento de investigación publicó un artículo sobre cómo elegir los genes correctos y por qué se puede confiar en los resultados del análisis de estos genes. Aquí hay un resumen de la publicación.

imagen

A veces en nuestra vida suceden cosas inesperadas (e incluso problemas), pero si tomamos nuestras acciones de manera responsable, podemos admitir que una parte significativa de lo que está sucediendo es una consecuencia de nuestras propias acciones, y no una cadena de eventos aleatorios. En general, es una cuestión de confianza en sí mismo. No puede preocuparse en absoluto, no dudar, no pensar en estas cosas y hacer algo hermoso. Por otro lado, la capacidad de encontrar sus propias instrucciones para una operación eficiente abre nuevas posibilidades. Todo es muy simple: hay varias cosas que una persona quiere saber con seguridad.

  • Primero: a qué enfermedades está más predispuesto. Las enfermedades relacionadas con la edad son consecuencia del estilo de vida y no de la intención de otra persona.
  • Segundo: salud infantil. Una vez más, hablar de esto tiene sentido si estamos hablando de una persona responsable que planifica conscientemente a su familia y no ahorra en anticoncepción, ignorando las consecuencias.
  • Tercero: qué hacer para vivir mejor. El cuerpo humano es un mecanismo. Y aunque los principios del trabajo son los mismos para todos, pueden variar ligeramente de un cuerpo a otro. Lo que le conviene a una persona puede ser dañino para otra.
  • Cuarto: qué es "yo". En términos de funcionamiento, conocer el origen de uno no ayudará a vivir más o mejor. Más bien, te hará sentir como un personaje en la historia de la humanidad, un héroe, actuando y desarrollándose independientemente de los intereses a corto plazo o las convicciones personales de alguien.

Todo esto se puede aprender del ADN leyendo ciertas secciones de genes. Un gen es un fragmento de ADN semántico separado que codifica un solo carácter en el caso más simple. Por cierto, la palabra "fenotipo" debe entenderse como la totalidad de todos los signos de la afección observada (por ejemplo, color de ojos, forma del lóbulo, tendencia a la diabetes, digestibilidad de la lactosa). Y luego surge la misma pregunta que en los años escolares: qué es exactamente lo que hay que leer, es posible leer no todo y cómo lidiar con lo que se ha leído.

Para hacer un servicio médico masivo a partir de la tecnología de prueba de ADN de pronóstico, debe prestar atención a varios puntos sutiles en el análisis de datos. En primer lugar, este es un problema de personalización: los tokens deben seleccionarse cuidadosamente. La mayoría de los estudios destinados a establecer la asociación "genotipo-fenotipo" se realizan en muestras grandes. Las muestras (grupos analizados de personas), por regla general, no son muy heterogéneas : pueden ser voluminosas, pero consisten en representantes de un grupo étnico. Por un lado, esto simplifica el análisis estadístico en el marco del estudio y, por otro, plantea la cuestión de la relevancia de la asociación encontrada para otros grupos de personas.

El segundo problema es el número de marcadores: este es el caso cuando necesita encontrar un punto medio. Y aquí no puede prescindir del equilibrio eterno entre dos parámetros de prueba: sensibilidad y especificidad. Un aumento en el número de marcadores genéticos indudablemente aumenta la sensibilidad del análisis a ciertas enfermedades. Y al mismo tiempo, la especificidad de la prueba puede disminuir. Como estamos hablando, por ejemplo, de identificar una predisposición a enfermedades graves, un error falso positivo en la identificación de un diagnóstico terrible será más peligroso que aclarar la probabilidad de desarrollar una enfermedad. Además, un aumento en el número de marcadores conduce a un aumento en el costo del sistema de prueba, lo que también dificulta la entrada al mercado masivo.

No existe una solución universal a estos problemas. En la etapa inicial del trabajo, el investigador se enfrenta a una situación en la que "hay muchos artículos y todos deben leerse". Por esta razón, el departamento de ciencias de Genotek ha propuesto un algoritmo de selección que simplifica enormemente la selección de polimorfismos para el análisis de caracteres. Es importante que hablemos de polimorfismos y no de genes en su conjunto: dos hombres en cada uno de los cromosomas X tienen el mismo gen del receptor de andrógenos, pero el primer hombre tiene adeninas (AA) en el locus rs6152 , y el segundo tiene guaninas. (GG) La probabilidad de que la última cabellera a los 40 años siga siendo la misma magnífica es de aproximadamente el 30% . En este caso, para comprender esto, no necesita leer la secuencia completa del gen, solo busque y lea solo un punto en el ADN y luego compárelo con el opuesto.

Que buscar


La genética llama a los rasgos característicos que adoptamos de nuestros antepasados ​​rasgos fenotípicos. El problema fundamental de la biología en su conjunto es la relación entre el genotipo y el fenotipo, así como la forma en que uno codifica al otro. En nuestro caso, hay dos puntos de vista sobre la heredabilidad de las características fenotípicas. Por un lado, la naturaleza de la herencia puede variar. Por lo tanto, un solo rasgo puede no heredarse en absoluto, y su manifestación no estará relacionada de ninguna manera con la contribución genética. Tales signos que surgen bajo la influencia del estilo de vida o las condiciones ambientales no son de interés para los desarrolladores de pruebas de ADN.

Por otro lado, si se hereda un rasgo, es importante comprender qué tipo de interacción genética subyace al estado observado. En el caso más simple, solo un gen puede afectar el desarrollo de la enfermedad, entonces estamos hablando de herencia monogénica. Por ejemplo, la fenilcetonuria es una enfermedad metabólica que se desarrolla en relación con una "descomposición" en un gen. En este caso, no se puede hablar de una predisposición: si una persona ya tiene dos copias de un gen roto, seguirá desarrollando una enfermedad. Sin embargo, en tal situación, el diagnóstico genético puede aclarar el diagnóstico para seleccionar un tratamiento más adecuado.

Es más difícil cuando varios genes contribuyen al rasgo fenotípico. Es importante comprender cómo se produce exactamente la formación del rasgo, ya sea poligénico o multifactorial. Un rasgo poligénico se desarrolla como resultado de varios polimorfismos; tampoco existe una naturaleza probabilística del desarrollo del rasgo. Con una cierta combinación de polimorfismos, se puede obtener de manera confiable un cierto color de los ojos de una persona. Ahora el problema de predecir el color de los ojos (y otras características externas) está en el análisis forense. Se resuelve tanto con la ayuda de modelos matemáticos como entrenando redes neuronales en grandes conjuntos de datos. El fenotipo multifactorial, además de la base genética, se desarrolla bajo la influencia de ciertas condiciones ambientales. Esos signos son de gran interés para el análisis de pronóstico médico, ya que estas son condiciones que pueden corregirse con la ayuda de cierto estilo de vida.

El algoritmo en sí se ve así:


imagen

El primer paso es verificar la presencia de un estudio de asociación amplia del genoma (GWAS). Esta área de investigación genética comenzó a usarse activamente con el desarrollo de la tecnología de microchip. El propósito del estudio es encontrar diferencias entre los genomas de personas con y sin un rasgo determinado. Los estudios de GWAS se caracterizan por grandes muestras. Por ejemplo, alrededor de 300,000 personas participaron en GIANT (Investigación del genoma de los rasgos antropométricos: un estudio genómico de los rasgos antropométricos). El estudio confirmó la grave influencia del factor genético en el desarrollo de la obesidad. La probabilidad de observar la asociación "genotipo - signo" en pacientes y sujetos sanos, siempre que la hipótesis de asociación sea incorrecta, es el valor p del experimento. Si este valor del estudio GWAS es menor que 0.01 (ajustado por multiplicidad), el polimorfismo cae en la lista corta de marcadores de enfermedad. Si cae dentro del rango de 0.01-0.05, se requiere el cumplimiento de uno de los criterios de significación funcional.

Solo hay un criterio: se conoce un mecanismo directo o indirecto de la influencia del polimorfismo en un rasgo. Si se conoce la vía metabólica de una sustancia (es decir, la cadena de transformaciones de la sustancia A en la sustancia X), entonces el conocimiento de qué enzimas están involucradas en esta cadena puede indicar la relevancia de este polimorfismo. Por ejemplo, conocemos una enzima que activa el ácido fólico para catalizar la conversión de homocisteína en metionina. La metionina es un aminoácido esencial, y con la acumulación de homocisteína, el endotelio de los vasos sanguíneos puede dañarse. Es decir, podemos hablar de una sustitución en el locus que codifica el centro activo de la enzima como una razón para la disminución del metabolismo de la homocisteína. Además, la presencia de un solo polimorfismo de este tipo no garantiza el desarrollo de la enfermedad.

Si el valor p de la asociación es mayor que 0.05 de acuerdo con los resultados de GWAS, entonces se requiere un metanálisis. Un metanálisis es un estudio en el que la identificación de una asociación se realizó resumiendo los resultados de muchos estudios. Si en el metanálisis se muestra la asociación "genotipo - fenotipo", se aplica el polimorfismo. Si no hay datos de metanálisis, el polimorfismo se prueba nuevamente por el criterio de significación funcional.

Dado que la parte principal del trabajo es el estudio de publicaciones, existen criterios estrictos para seleccionar artículos científicos para encontrar asociaciones. Para estudios GWAS de estos criterios 3:

  1. tamaño de la muestra: al menos 750 pacientes en el estudio inicial;
  2. Valor de p <0,01;
  3. las asociaciones deben confirmarse en al menos un estudio (no es necesario para enfermedades raras) y el factor de impacto de la publicación debe ser al menos 2.

Para las publicaciones destinadas a identificar el cumplimiento del criterio de significación funcional, los criterios son los siguientes:

  1. los datos deben obtenerse en el estudio de tejidos (biopsia intravital, material de autopsia, material postoperatorio) o fluidos biológicos de los participantes;
  2. las asociaciones deben obtenerse experimentalmente en la publicación científica en cuestión;
  3. Valor de p <0,05;
  4. los tamaños de muestra de los participantes deben ser lo suficientemente grandes como para poder detectar asociaciones de marcadores genéticos con frecuencias específicas de ocurrencia;
  5. Si hay varias publicaciones que examinaron la asociación de este marcador genético con el riesgo de desarrollar la enfermedad, entonces, para el análisis, elija: a) más adelante (por ejemplo, de dos artículos en 2009 y 2015 - un artículo para 2015); b) una publicación en la que el estudio se realizó en un mayor número de muestras.

Los resultados del metanálisis, si los hay, son una prioridad. Los requisitos para el metanálisis también son muy altos: en la publicación misma, las fuentes deben seleccionarse cuidadosamente, entre las cuales hay tanto la confirmación como la refutación de la asociación del polimorfismo con un signo. Deben indicarse las fuentes de información y las palabras clave utilizadas para la búsqueda, así como la justificación de los criterios para incluir y excluir publicaciones (tamaño de la muestra, artículos en inglés solamente, características demográficas de los participantes, etc.). Se presta especial atención al llamado análisis de sesgo de publicaciones individuales utilizando un gráfico en forma de embudo o análisis de sensibilidad. Cuando se incluye un marcador en el análisis, nos centramos en qué poblaciones participaron en el estudio.

A pesar del hecho de que la tecnología en sí misma ha estado en el mercado durante mucho tiempo, esto no es una especie de "práctica habitual", según la cual se escriben toneladas de manuales. La tubería de prueba de ADN funciona, y esta es una de sus secciones. Le presentaremos gradualmente cada uno de sus fragmentos.

Source: https://habr.com/ru/post/es401619/


All Articles