O geneticista chefe da popular empresa de pesquisa ancestral admitiu que era "parte da ciência, parte da arte"
Charlsey Agro à esquerda, sua irmã gêmea idêntica, Carly, à direita; verificando alguns dos resultados dos testes de DNAUm conjunto de gêmeos idênticos e dois perfis diferentes para ancestrais. Pelo menos, isso decorre dos resultados do trabalho de uma das maiores empresas que buscam ancestrais através do DNA.
Na primavera passada, Charlie Agro e sua irmã gêmea Carly compraram kits de teste de DNA do AncestryDNA, MyHeritage, 23andMe, FamilyTreeDNA e Living DNA, e enviaram amostras individuais de seu DNA para cada empresa para análise. E, apesar de o DNA deles ser quase o mesmo, eles não obtiveram resultados semelhantes de nenhum deles.
Na maioria dos casos, a mesma empresa rastreava os ancestrais dos gêmeos nas mesmas partes do mundo - com probabilidades diferentes. Mas os resultados do 23andMe deixam claro que cada um dos gêmeos no pedigree teve uma virada inesperada. Se você acredita neles, a hereditariedade de Charlie é 10% menos "européia" que a de Carly. Ela também tem antepassados da França e da Alemanha (2,6%), que sua irmã não possui.

Além disso, os gêmeos tiveram diferentes graus de pertencimento aos ancestrais da Europa Oriental - 28% para Charlie e 24,7% para Carly. E se Carly tinha esses ancestrais conectados com a Polônia, então Charles sua origem exata não era indicada.
"O fato de terem produzido resultados diferentes para você e sua irmã, acho extremamente misterioso", disse Mark Gerstein, biólogo computacional da Universidade de Yale.
DNA de gêmeos “surpreendentemente semelhantes”
Os gêmeos enviaram os resultados das cinco empresas para análise à equipe de Gerstein. Ele diz que quaisquer resultados obtidos de uma empresa por cada gêmeo devem ser idênticos. E há uma razão simples para isso: os dados coletados no DNA das irmãs são quase idênticos. "Eles são chocantemente parecidos", disse ele.
Uma equipe da Universidade de Yale conseguiu baixar e analisar os dados de origem usados por cada uma das empresas para os cálculos. Uma amostra completa de DNA consiste em três bilhões de partes, mas as empresas de verificação de origem usam cerca de 700.000 delas para trabalhar com diferenças genéticas.
Segundo dados do 23andMe, 99,6% das peças eram iguais, e é por isso que Gerstein e a equipe ficaram tão surpresos com o resultado. Eles concluíram que os dados iniciais de quatro outras empresas também eram estatisticamente idênticos. Mas, ao mesmo tempo, nenhuma das cinco empresas deu uma história de origem idêntica aos gêmeos.
"Acreditamos que os números deveriam ser exatamente os mesmos", disse Gerstein. E, embora ele não possa dizer exatamente por que essas diferenças surgiram, ele suspeita que se trata apenas dos algoritmos usados pelas empresas para processar o DNA dos usuários. “A coisa toda deveria estar nos cálculos. Esses cálculos são realizados por diferentes métodos. ”
Em resposta à pergunta por que os gêmeos não obtiveram os mesmos resultados, apesar da semelhança de seu DNA, um representante do 23andMe disse que mesmo essas pequenas diferenças podem levar o algoritmo a produzir estimativas ligeiramente diferentes da probabilidade de origem. Embora a empresa diga que aborda o desenvolvimento de suas ferramentas e relatórios com rigor científico, reconhece que os resultados são uma "aproximação estatística".
Diferenças por cinco empresas
No FamilyTreeDNA, os gêmeos foram informados de que seus ancestrais viviam na Sicília, na Polônia e na Ucrânia. No entanto, os resultados obtidos por cada uma das irmãs contêm detalhes muito surpreendentes - e, em alguns casos, contraditórios - da história da família.
Charles Agro com sua tia de férias em Malta no verão passado. Antes de usar testes de DNA, as irmãs Agro acreditavam que a maioria de seus antepassados vivia na Sicília, Ucrânia e Polônia.O AncestryDNA descobriu que a maioria dos ancestrais gêmeos veio do Leste Europeu (38% para Carly e 39% para Charles). Os resultados dos testes do MyHeritage atribuem a maioria de seus ancestrais à região dos Balcãs (60,6% para Carly e 60,7% para Charles).

Resultados mais surpreendentes foram apresentados pelo Living DNA, segundo o qual uma pequena parte dos ancestrais de Carly morava na Inglaterra e os ancestrais de Charles moravam na Escócia e na Irlanda.

Outra reviravolta inesperada foi encontrada nos resultados do FamilyTreeDNA, que atribuiu 13 a 14% dos ancestrais gêmeos ao Oriente Médio - muito mais do que outras empresas, já que dois deles não encontraram nenhuma raiz no Oriente Médio.
Paul Meyer, geneticista-chefe do FamilyTreeDNA, admite que identificar as diferenças genéticas entre pessoas de lugares diferentes é um desafio. "A busca por fronteiras é, em si mesma, uma vanguarda da ciência, portanto essa tarefa está na interseção entre ciência e arte", disse Mayer em entrevista por telefone.
Como isso funciona
Para aprender sobre ancestrais humanos, empresas como 23andMe comparam uma amostra de DNA com o que é chamado de painel de referência. Consiste em um conjunto de amostras de DNA de usuários que passaram no teste anteriormente e de amostras colhidas em bancos de dados publicamente disponíveis.
O Dr. Simon Gravel, especialista em genética de populações da Universidade McGill que participa do
1000 Genomes Project , diz que empresas similares pegam cerca de 700.000 segmentos de DNA e usam um algoritmo para compará-las com os segmentos do painel principal.
"Eles estão procurando partidas com diferentes regiões do mundo", disse ele. "No final, eles obtêm uma avaliação da contribuição daquela parte do painel de referência que combina mais de perto com seu DNA, e a avaliação de sua origem é derivada disso". Empresas diferentes usam painéis diferentes; portanto, é provável que cada uma delas dê resultados diferentes a uma pessoa.
O AncestryDNA reconheceu que o tamanho do painel de referência é um fator importante. Fomos informados de que a empresa "está constantemente trabalhando para melhorar a abordagem científica" e que "um novo painel maior fornecerá aos usuários resultados mais precisos".
De onde vieram as diferenças?
Segundo Gravel, muitos fatores podem afetar a precisão dos resultados obtidos da empresa envolvida na hereditariedade, mas o tamanho e a qualidade do painel de referência são especialmente importantes. Quanto maior, mais precisos são os resultados, diz ele. "Se você tem menos pessoas para comparar, precisa cortar custos mais ativamente", disse ele. "Você também corre o risco de perder a diversidade que você não sabia que existia em uma região específica."
Outra razão para a divergência dos resultados de diferentes empresas é uma abordagem arbitrária para dividir o mundo em regiões, diz Gravel. "Eles têm que, grosso modo, pegar um lápis e dizer:" Esta será a região. " E empresas diferentes traçam fronteiras diferentes. ”
Ele também diz que os testes são mais precisos para pessoas de descendência européia, à medida que mais pessoas com essa hereditariedade passaram por eles.
Ele adverte que você não deve considerar os resultados obtidos com certeza. Ele diz que uma empresa pode rastrear a hereditariedade de uma pessoa por amostra de DNA em um determinado continente com erro estatístico, mas algumas informações mais específicas, como um país ou cidade de origem, não serão confiáveis.
Falta de supervisão
As maiores empresas de hereditariedade de DNA já testaram milhões de pessoas. O MyHeritage, por exemplo, diz que espera exceder os US $ 100 milhões em vendas de serviços este ano. Mas, apesar da popularidade de tais testes, não há supervisão governamental ou profissional desse setor para garantir a autenticidade dos resultados. Para Gravel, essa situação é preocupante.
"Na ciência, geralmente existe um processo de realização de avaliações de especialistas e o acesso a dados e algoritmos é aberto - é assim que garantimos dados de alta qualidade", disse ele. "E, neste caso, não há acesso a eles, porque as empresas mantêm os dados em segredo."
Portanto, diz Gravel, os consumidores devem estar céticos quanto aos resultados desses testes. As pessoas precisam entender que esses testes não atendem a padrões como, por exemplo, a realização de exames médicos. Esses testes são mais como "entretenimento científico", disse ele.
Como o 23andMe, o MyHeritage diz que seus resultados são "estimativas étnicas aproximadas". Quando Rafi Mendelssohn, representante do MyHeritage, foi perguntado por que a empresa oferece seus resultados com tanta certeza - no vídeo com os resultados dos testes que o usuário recebe, "você pertence" à frente do pedigree do usuário - ele disse que considerava óbvio que os usuários estavam obtendo resultados estimados , e isso é especialmente claro para usuários da América do Norte.
Os resultados podem variar.
Quaisquer que sejam os resultados obtidos, não se apegue muito a eles. Eles podem mudar. Em setembro, o AncestryDNA informou seus clientes que as classificações foram atualizadas com a seguinte mensagem:
"Seu DNA não muda, mas agora temos 13.000 amostras de referência adicionais e um novo método científico poderoso que permite obter melhores resultados em termos de etnia". O artigo utiliza os resultados obtidos em 6 de novembro de 2018, quando a empresa já atualizou seus dados. Nos resultados atualizados, foram encontrados laços familiares com a Rússia, a Grécia, os Bálcãs e os países bálticos, que não foram indicados anteriormente.