Algoritmo de seleção de recursos para teste de DNA

Na pesquisa científica, como em qualquer outra forma de ocupação humana significativa, um plano de ação é importante. Há pessoas envolvidas em ciência pura, mas essa é uma história completamente diferente. Quando se trata da aplicação, ou seja, o uso do método científico na vida cotidiana, é necessária uma sequência clara de ações, segundo as quais o transportador funcionará. A Genotek lida com pesquisa genética aplicada, analisa e interpreta os dados registrados no DNA. Nosso departamento de pesquisa publicou um artigo sobre como escolher os genes certos e por que os resultados da análise desses genes podem ser confiáveis. Aqui está um resumo da publicação.

imagem

Às vezes, em nossa vida, coisas inesperadas acontecem (e até problemas), mas se tomarmos nossas ações com responsabilidade, podemos admitir que uma parte significativa do que está acontecendo é uma consequência de nossas próprias ações, e não uma cadeia de eventos aleatórios. Em geral, é uma questão de autoconfiança. Você não pode se preocupar, sem dúvida, não pensar nessas coisas e fazer algo bonito. Por outro lado, a capacidade de encontrar suas próprias instruções para uma operação eficiente abre novas possibilidades. Tudo é muito simples: há várias coisas que uma pessoa quer saber com certeza.

  • Primeiro: a quais doenças ele está mais predisposto. As doenças relacionadas à idade são uma conseqüência do estilo de vida, e não a intenção de outra pessoa.
  • Segundo: saúde da criança. Mais uma vez, falar sobre isso faz sentido se estivermos falando de uma pessoa responsável que conscientemente planeja sua família e não economiza em contracepção, ignorando as consequências.
  • Terceiro: o que fazer para viver melhor. O corpo humano é um mecanismo. E embora os princípios de trabalho sejam os mesmos para todos, eles podem variar um pouco de corpo para corpo. O que combina com uma pessoa pode ser prejudicial para outra.
  • Quarto: o que "eu" é. Em termos de funcionamento, conhecer a origem não ajudará a viver mais ou melhor. Em vez disso, fará você se sentir como um personagem da história da humanidade, um herói, atuando e se desenvolvendo independentemente dos interesses de curto prazo ou das convicções pessoais de alguém.

Tudo isso pode ser aprendido com o DNA lendo determinadas seções dos genes. Um gene é um fragmento de DNA semântico separado que codifica um único caractere no caso mais simples. A propósito, a palavra “fenótipo” deve ser entendida como a totalidade de todos os sinais da condição observada (por exemplo, cor dos olhos, formato do lobo, tendência ao diabetes, digestibilidade da lactose). E então surge a mesma pergunta que nos anos escolares: o que exatamente precisa ser lido, é possível ler nem tudo e como lidar com o que foi lido.

Para tornar um serviço médico em massa a partir da tecnologia de teste de DNA prognóstico, você precisa prestar atenção a vários pontos sutis na análise de dados. Primeiro, esse é um problema de personalização: os tokens devem ser selecionados com cuidado. A maioria dos estudos que visa estabelecer a associação "genótipo - fenótipo" é realizada em grandes amostras. As amostras (grupos de pessoas analisados), por via de regra, não são muito heterogêneas : podem ser volumosas, mas consistem em representantes de um grupo étnico. Por um lado, isso simplifica a análise estatística no âmbito do estudo e, por outro, levanta a questão da relevância da associação encontrada para outros grupos de pessoas.

O segundo problema é o número de marcadores - este é o caso quando você precisa encontrar um meio termo. E aqui você não pode prescindir do eterno equilíbrio entre dois parâmetros de teste: sensibilidade e especificidade. Um aumento no número de marcadores genéticos, sem dúvida, aumenta a sensibilidade da análise a certas doenças. E, ao mesmo tempo, a especificidade do teste pode cair. Como estamos falando, por exemplo, da identificação de uma predisposição para doenças graves, um erro falso positivo na identificação de um diagnóstico terrível será mais perigoso do que esclarecer a probabilidade de desenvolver uma doença. Além disso, um aumento no número de marcadores leva a um aumento no custo do sistema de teste, o que também dificulta a entrada no mercado de massa.

Uma solução universal para esses problemas não existe. Na fase inicial do trabalho, o pesquisador se depara com uma situação em que "há muitos artigos e todos precisam ser lidos". Por esse motivo, o departamento de ciências da Genotek propôs um algoritmo de seleção que simplifica bastante a seleção de polimorfismos para análise de caracteres. É importante que falemos de polimorfismos, e não de genes como um todo: dois homens em cada um dos cromossomos X têm o mesmo gene receptor de andrógenos, mas o primeiro homem tem adeninas (AA) no locus rs6152 e o segundo possui guaninas (GG). A probabilidade de que a última cabeça de cabelo aos 40 anos permaneça a mesma magnífica é de cerca de 30% . Nesse caso, para entender isso, você não precisa ler a sequência completa do gene - basta encontrar e ler apenas um ponto no DNA e depois compará-lo com o oposto.

O que procurar


A genética chama os traços característicos que adotamos de nossos ancestrais de fenotípicos. O problema fundamental da biologia como um todo é a relação entre genótipo e fenótipo, bem como a forma como um codifica o outro. No nosso caso, há duas visões sobre a herdabilidade de características fenotípicas. Por um lado, a natureza da herança pode variar. Portanto, uma única característica pode não ser herdada, e sua manifestação não estará conectada de forma alguma à contribuição genética. Tais sinais que surgem sob a influência do estilo de vida ou das condições ambientais não interessam aos desenvolvedores de testes de DNA.

Por outro lado, se uma característica é herdada, é importante entender que tipo de interação genética está subjacente ao estado observado. No caso mais simples, apenas um gene pode afetar o desenvolvimento da doença - então estamos falando sobre herança monogênica. Por exemplo, a fenilcetonúria é uma doença metabólica que se desenvolve em conexão com uma "quebra" em um gene. Nesse caso, não se pode falar de uma predisposição: se uma pessoa já tiver duas cópias de um gene quebrado, ela ainda desenvolverá uma doença. No entanto, em tal situação, o diagnóstico genético pode esclarecer o diagnóstico para selecionar um tratamento mais adequado.

É mais difícil quando vários genes contribuem para a característica fenotípica. É importante entender como ocorre exatamente a formação da característica, seja poligênica ou multifatorial. Uma característica poligênica se desenvolve como resultado de vários polimorfismos - também não há natureza probabilística do desenvolvimento da característica. Com uma certa combinação de polimorfismos, uma certa cor dos olhos de uma pessoa pode ser obtida com segurança. Agora, o problema de prever a cor dos olhos (e outros recursos externos) está na perícia. É resolvido com a ajuda de modelos matemáticos e treinando redes neurais em grandes conjuntos de dados. O fenótipo multifatorial, além da base genética, se desenvolve sob a influência de certas condições ambientais. Esses sinais são de maior interesse para a análise prognóstica médica, pois são condições que podem ser corrigidas com a ajuda de um determinado estilo de vida.

O próprio algoritmo se parece com isso:


imagem

O primeiro passo é verificar a presença de um estudo de associação ampla do genoma (GWAS). Essa área de pesquisa genética começou a ser usada ativamente com o desenvolvimento da tecnologia de microchip. O objetivo do estudo é encontrar diferenças entre os genomas de pessoas com e sem uma certa característica. Os estudos da GWAS são caracterizados por grandes amostras. Por exemplo, cerca de 300.000 pessoas participaram do GIANT (Investigação Genômica de Características Antropométricas - um estudo genômico de características antropométricas). O estudo confirmou a séria influência do fator genético no desenvolvimento da obesidade. A probabilidade de observar a associação "genótipo - sinal" em pacientes e indivíduos saudáveis, desde que a hipótese de associação esteja incorreta, é o valor p do experimento. Se esse valor do estudo GWAS for menor que 0,01 (ajustado para multiplicidade), o polimorfismo cai na pequena lista de marcadores de doença. Se estiver dentro da faixa de 0,01-0,05, é necessário o cumprimento de um dos critérios de significância funcional.

Há apenas um critério: um mecanismo direto ou indireto da influência do polimorfismo em uma característica é conhecido. Se a via metabólica de uma substância é conhecida (ou seja, a cadeia de transformações da substância A em substância X), o conhecimento de quais enzimas estão envolvidas nessa cadeia pode indicar a relevância desse polimorfismo. Por exemplo, conhecemos uma enzima que ativa o ácido fólico para catalisar a conversão de homocisteína em metionina. A metionina é um aminoácido essencial e, com o acúmulo de homocisteína, o endotélio dos vasos sanguíneos pode ser danificado. Ou seja, podemos falar de uma substituição no local que codifica o centro ativo da enzima como uma razão para a diminuição do metabolismo da homocisteína. Além disso, a presença de um único polimorfismo desse tipo não garante o desenvolvimento da doença.

Se o valor p da associação for maior que 0,05, de acordo com os resultados do GWAS, será necessária uma metanálise. Uma metanálise é um estudo em que a identificação de uma associação foi realizada resumindo os resultados de muitos estudos. Se na metanálise a associação “genótipo - fenótipo” é mostrada, o polimorfismo é levado em consideração. Se não houver dados de metanálise, o polimorfismo é novamente testado pelo critério de significância funcional.

Como a parte principal do trabalho é o estudo de publicações, existem critérios rigorosos para selecionar artigos científicos para encontrar associações. Para estudos da GWAS com esses critérios 3:

  1. tamanho da amostra - pelo menos 750 pacientes no estudo inicial;
  2. Valor de p <0,01;
  3. as associações devem ser confirmadas em pelo menos um estudo (não necessário para doenças raras) e o fator de impacto da publicação deve ser pelo menos 2.

Para publicações destinadas a identificar a conformidade com o critério de significância funcional, os critérios são os seguintes:

  1. os dados devem ser obtidos no estudo de tecidos (biópsia intravital, material de autópsia, material pós-operatório) ou fluidos biológicos dos participantes;
  2. as associações devem ser obtidas experimentalmente na publicação científica em questão;
  3. Valor de p <0,05;
  4. o tamanho da amostra dos participantes deve ser grande o suficiente para detectar associações de marcadores genéticos com frequências específicas de ocorrência;
  5. se houver várias publicações que examinaram a associação desse marcador genético com o risco de desenvolver a doença, para análise, escolha: a) mais tarde (por exemplo, de dois artigos em 2009 e 2015 - um artigo para 2015); b) uma publicação em que o estudo foi realizado em um número maior de amostras.

Os resultados da meta-análise, se houver, são uma prioridade. Os requisitos para a meta-análise também são muito altos: na própria publicação, as fontes devem ser cuidadosamente selecionadas, entre as quais existem confirmações e refutações da associação do polimorfismo com um sinal. Devem ser indicadas as fontes de informação e as palavras-chave utilizadas na pesquisa, bem como a justificativa dos critérios para inclusão e exclusão de publicações (tamanho da amostra, artigos apenas em inglês, características demográficas dos participantes, etc.). É dada atenção especial à chamada análise de viés de publicações individuais usando um gráfico em forma de funil ou análise de sensibilidade. Quando um marcador é incluído na análise, focamos em quais populações participaram do estudo.

Apesar de a tecnologia em si estar no mercado há muito tempo, esse não é um tipo de "prática de rotina", segundo a qual são escritos vários manuais. O pipeline de teste de DNA funciona e esta é uma de suas seções. Gradualmente, apresentaremos você a cada um de seus fragmentos.

Source: https://habr.com/ru/post/pt401619/


All Articles