Estamos completando una serie de art铆culos pr谩cticos sobre c贸mo usar los datos de pruebas gen茅ticas. Hoy publicamos las respuestas correctas y los ganadores que resolvieron los tres problemas m谩s r谩pido que el resto.

Todos los art铆culos de nuestra serie:
驴Qu茅 es el genoma completo y por qu茅 es necesario?Tarea n煤mero 1. Descubra el g茅nero y el grado de relaci贸n.Tarea n煤mero 2. Determinaci贸n de la estructura de la poblaci贸n.Tarea n煤mero 3. Conversi贸n de datos y carga a servicios de tercerosPara completar las tareas de prueba, utilizamos 12 muestras de los datos abiertos del proyecto 1000 Genomes. Cambiamos el nombre de las muestras para que los participantes no pudieran usar los datos disponibles para las respuestas.

Tabla de correspondencia de los identificadores originales y utilizados en tareas.
Tarea n煤mero 1. Averig眉e el g茅nero y el grado de relaci贸n
El pedigr铆 de las muestras utilizadas se muestra en la Figura 1. Las decisiones se consideraron correctas, en las que se identificaron 3 familias y 3 muestras gen茅ticamente no relacionadas: 0030, 0090 y 0066. Este an谩lisis no puede establecer su relaci贸n con la familia si no hay muestras de ni帽os. Las 12 muestras deben estar presentes en la soluci贸n. El dise帽o de pedigr铆 tambi茅n se tuvo en cuenta (Figura 2). Escribimos sobre las reglas de dise帽o en la primera tarea.
Figura 1 Relaciones familiares de muestras del conjunto de datos de prueba de acuerdo con los datos de 1000 genomas. El archivo geneal贸gico est谩 disponible aqu铆 .
Figura 2 A la derecha est谩 la exhibici贸n incorrecta de una familia con un hijo: se representan dos matrimonios, no hay lazos familiares.Tarea n煤mero 2. Determinaci贸n de la estructura de la poblaci贸n.
En el conjunto de datos para la tarea, utilizamos muestras de dos superpoblaciones. La visualizaci贸n de la ubicaci贸n de 12 muestras a lo largo de los tres componentes principales se muestra en las Figuras 3 y 4. En los gr谩ficos de dispersi贸n, se puede ver la formaci贸n de cuatro grupos. Sin embargo, no se corresponden totalmente con los datos iniciales sobre la poblaci贸n: Figura 5, dos poblaciones. Explicamos las razones de una separaci贸n tan pronunciada y contradictoria de las muestras en el
art铆culo . Adem谩s, todas las muestras que muestran una divisi贸n inesperada del grupo pertenecen a la superpoblaci贸n de AMR: Ad Mixed American. La mezcla y la heterogeneidad son inherentes a las poblaciones mixtas y pueden manifestarse en la agrupaci贸n observada.
Figura 3 Diagramas de dispersi贸n de la ubicaci贸n de las muestras del conjunto de datos de prueba en pares de los primeros tres componentes principales.
Figura 4 Gr谩fico de dispersi贸n de las muestras del conjunto de datos de prueba para los tres componentes principales.
Figura 5 La poblaci贸n y el pedigr铆 de las muestras utilizadas en el conjunto de datos de prueba de acuerdo con los "1000 genomas". El archivo geneal贸gico est谩 disponible aqu铆 .
La Figura 6 muestra el 谩rbol de agrupaci贸n creado a partir del archivo
cluster3
. El 谩rbol podr铆a construirse manualmente o utilizando cualquier tipo de automatizaci贸n, pero ten铆a que corresponder a la agrupaci贸n realizada con Plink. Los 谩rboles que no se ajustan a la estructura y para los cuales los participantes usaron otros paquetes de PCA no fueron aceptados. No reflejaban la soluci贸n encontrada por Plink; por lo tanto, no eran adecuados para confirmar los grupos de Plink obtenidos.
Figura 6 脕rbol de agrupamiento binario para un conjunto de datos de prueba de 12 muestras.Tarea n煤mero 3. Conversi贸n de datos y carga a servicios de terceros
En esta tarea, les pedimos a los participantes que prepararan datos de pruebas gen茅ticas para cargar en el sistema de interpretaci贸n Promethease y analizar los resultados. Para verificar las respuestas, fue necesario recopilar una tabla con los identificadores de las muestras del conjunto de datos de prueba, su grupo sangu铆neo y el factor Rh.

Una tabla con los identificadores de las muestras del conjunto de datos de prueba y el grupo sangu铆neo detectado y el factor Rh del sistema de interpretaci贸n Promethease.
Ganadores
Escribimos que daremos regalos a aquellos que resuelven problemas m谩s r谩pido que otros. Por lo tanto, tomamos en cuenta no solo la exactitud de las respuestas, sino tambi茅n el tiempo desde el momento en que se public贸 la tarea hasta que se recibi贸 la respuesta. Se resumi贸 el tiempo para las tres tareas y, por lo tanto, seleccionamos a los tres ganadores m谩s r谩pidos.

Una tabla con los resultados de todos los participantes.
Un miembro con el dominio de correo ab12ab, no podemos contactarlo. Por favor escriba al autor del art铆culo en mensajes privados hasta el lunes. De lo contrario, presentaremos el premio al siguiente participante de la lista.Los ganadores ya han recibido cartas de ganancias. Por lo dem谩s, tambi茅n tenemos un peque帽o regalo. Hasta el a帽o nuevo,
el sitio web de Atlas tiene descuentos de hasta el 50%.