A Atlas lançou um novo produto - The
Complete Genome . Agora podemos estudar não apenas pontos individuais no genoma, como no teste genético, mas também ler toda a sequência de nucleotídeos do genoma. Neste artigo, mostramos o que é e por que é necessário.
Atenção! Daremos o genoma completo a um de nossos leitores que concluirá todas as tarefas. Mais detalhes no final do artigo.

O que significa o genoma completo?
Para lidar com o genoma completo ou com o seqüenciamento completo do genoma (WGS), primeiro falamos brevemente sobre a tecnologia convencional de teste genético.
Microchip e teste genético de rotina
O teste genético do Atlas, como muitos testes semelhantes, é feito usando um microarray de DNA (microarray de DNA, Beadchip). A superfície do microchip de DNA contém muitas pequenas depressões (cerca de 700 mil), cada uma das quais contém uma bola de silício com um diâmetro de cerca de 3 micrômetros. Na superfície desta bola existem centenas de milhares de sequências curtas idênticas de DNA de fita simples, costuradas com ela, correspondendo à parte do genoma humano localizada ao lado da variação estudada (SNP, SNV). Cada bola corresponde a apenas uma variação genética, e as coordenadas dos buracos no chip para cada bola são conhecidas (Figura 2D).
Bloco educacional 1
Snip ou SNV (Single Nucleotide Variation) é uma variação genética, ou seja, uma alteração na sequência de DNA em apenas um nucleotídeo. Por exemplo, um dos três nucleotídeos (alelos) A, G ou T pode existir em uma determinada posição no gene X, e os nucleotídeos são idênticos em pessoas diferentes no restante da sequência (Figura 1). A partir dessa carta, um recurso específico de uma pessoa pode depender.

Figura 1 Imagem de Rentonorama
Por exemplo, o polimorfismo rs4481887, localizado no primeiro cromossomo próximo ao gene do receptor olfativo OR2M7, possui três alelos: A, G e T. A presença do alelo A em um ou ambos os cromossomos (genótipos A / G, A / T e A / A) determina a sensibilidade ao odor da urina após consumir aspargos. Na ausência do alelo A, a pessoa nem percebe que, depois de comer aspargos na urina, uma substância com odor característico é liberada.
Indel ou INDEL (inserção / exclusão) é outro tipo de variação genética que envolve a remoção ou inserção de um ou mais nucleotídeos. Recortes e recortes juntos, juntamente com possíveis alterações estruturais: grandes deleções, inserções, translocações, inversões, são a diferença real no genoma de diferentes pessoas.
Ao passar no teste genético do Atlas, o DNA genômico e mitocondrial é isolado da saliva, aumenta o número de cópias (amplifica) e o fragmento é cortado em pedaços pequenos (Figura 2A). Numerosos fragmentos de fita simples de DNA humano são conectados com suas seqüências correspondentes em esferas de silício (Figura 2B), após o que essas seqüências são estendidas por 1 nucleotídeo fluorescente artificial (Figura 2C). Nucleotídeos diferentes brilham em cores diferentes: vermelho e verde. Pela razão das intensidades luminosas de cada cor (Figura 2E), pode-se determinar o genótipo que corresponde à bola.
Figura 2Depois de digitalizar todo o chip, obtemos cerca de 700 mil genótipos de variações e os passamos pelo nosso sistema de interpretação. Muitas vezes, os usuários tentam comparar os resultados de diferentes testes, mas observam uma forte diferença. Isso acontece por vários motivos. Em primeiro lugar, diferentes empresas usam diferentes versões de chips e conjuntos de SNV. Como resultado, em alguns chips, existem conjuntos exclusivos de variações que não podem ser encontrados em outros chips. Em segundo lugar, sempre existe um erro de genotipagem, que pode ocorrer por várias razões, embora faça a menor contribuição para a diferença nos resultados. Dados de pesquisa mostram que a precisão da genotipagem em microarranjos de DNA que a Atlas utiliza é superior a 99,5%. Mas a principal razão para as diferenças nos resultados dos testes genéticos na interpretação é que diferentes empresas o fazem de maneira diferente, mesmo para os mesmos dados iniciais de genotipagem.
O que é sequenciamento de genoma?
A principal diferença entre o seqüenciamento do genoma e a genotipagem em microarrays é a tecnologia e o processamento dos dados obtidos. Com o seqüenciamento em todo o genoma, quase toda a sequência de DNA é determinada. Quase - porque há seções no genoma que, por várias razões, não podem ser lidas. Frequentemente, esses são locais de telômeros e centrômeros - das extremidades e do centro dos cromossomos. Para determinar as seqüências dessas regiões do genoma, são usadas tecnologias altamente especializadas inacessíveis. Tais estudos são principalmente pesquisas de natureza.
A determinação da sequência de DNA permite conhecer os genótipos de variações em qualquer parte do genoma, incluindo as variações estudadas no microarray de DNA no teste genético Atlas. A tecnologia NGS (sequenciamento de próxima geração) é usada para determinar rápida e eficientemente a sequência do genoma. Existem vários métodos fundamentalmente diferentes criados por empresas diferentes.
A essência do método Atlas é a seguinte: o DNA extraído e purificado é amplificado muitas vezes e fragmentado até um certo comprimento. Para cada fragmento, seqüências especiais são costuradas que permitem controlar esse fragmento. São esses fragmentos processados que são lidos (Figura 3).
Figura 3 Processo de seqüenciamento passo a passo: cada nucleotídeo subsequente fluorescente em seu canal de cores exclusivo.
Em cada etapa, ocorre uma extensão de um nucleotídeo, ao qual uma sonda fluorescente está associada. Cada um dos quatro nucleotídeos está associado a uma sonda de uma cor específica. Assim, passo a passo, pela cor do brilho, pode-se determinar a ordem dos nucleotídeos no fragmento estudado. As seqüências resultantes de cada fragmento são chamadas leituras e produzem cerca de 1 bilhão para cada amostra do DNA estudado. As leituras e as métricas de qualidade de leitura são armazenadas no formato de texto FASTQ.
Em seguida, as leituras são alinhadas (mapeadas) ao genoma de referência. Usando um software especial, por exemplo, o alinhador Burrows-Wheeler, para cada leitura, é pesquisado um local no genoma de referência ao qual ele corresponde. A leitura junto com as informações sobre a posição no genoma é registrada em um formato de arquivo SAM ou BAM. A visualização dos genes mapeados no genoma no arquivo SAM (BAM) usando o navegador genômico IGV é mostrada na Figura 4.
Figura 4 Visualização do arquivo BAM no programa IGV (site de cromossomos de uma pessoa). As leituras mapeadas são indicadas por blocos horizontais, a posição é indicada na faixa acima.
A figura também mostra qual é a profundidade da cobertura quando várias leituras alinhadas cobrem qualquer posição no genoma de referência. A média é calculada sobre todo o genoma e é usada como um indicador da qualidade do estudo. O Atlas garante uma cobertura genômica média de profundidades superiores a 30, o que garante genotipagem de alta qualidade. Aumentar a profundidade da leitura aumenta significativamente o custo do seqüenciamento, a precisão da determinação de variações genéticas e é usado em estudos oncológicos restritos, por exemplo, no Atlas of Oncology Diagnostics.
Bloco educacional 2
Um genoma de referência é uma sequência artificialmente montada de DNA de uma espécie biológica. A maioria das sequências das quais o genoma humano de referência foi montado foi tirada de uma pessoa de origem afro-europeia. O genoma de referência é atualizado regularmente: a versão mais recente, GRCh38, foi lançada em 2013 e contém 3,3 bilhões de nucleotídeos. Apesar da disponibilidade da nova versão, muitos serviços de testes genéticos e de análise de dados genéticos usam a anterior - GRCh37. O Atlas usa a versão GRCh38 para fornecer os resultados de análise mais precisos.
Os arquivos obtidos após o mapeamento (arquivos SAM, mapa de alinhamento de seqüenciamento ou em formato binário BAM - mapa de alinhamento binário) são filtrados e usados para procurar variações no genoma, incluindo variações de nucleotídeo único e inserções e exclusões curtas. A presença da variante de nucleotídeo único no cromossomo 1 na posição 248333561 (o exemplo acima é rs4481887 - a variante que determina a sensibilidade ao cheiro da urina após comer aspargos) é mostrada na Figura 5.
Figura 5 Visualização de um arquivo BAM em um programa IGV. Gráfico do cromossomo 1. Na posição 248333561 está o polimorfismo rs4481887: o nucleotídeo nessa posição não corresponde ao genoma de referência e é destacado em cores. Em todas as leituras que cobrem essa parte do genoma, há um nucleoide G, que indica a homozigose do genótipo. Uma pessoa com esses resultados de seqüenciamento terá um genótipo G / G e insensibilidade ao cheiro da urina após comer aspargos.
As variações genéticas encontradas são armazenadas em um arquivo VCF (formato de chamada variante). Ele contém alelos detectados para cada posição do genoma, bem como indicadores da qualidade da genotipagem. O arquivo VCF é filtrado: os registros sobre a presença / ausência de variações que não correspondem aos limites de qualidade e são potencialmente falsos são excluídos. Cada variação encontrada recebe dados do dbSNP conhecidos a partir dele, em particular, identificadores únicos rsID.
Você pode se familiarizar com as especificidades dos formatos para armazenar dados de sequenciamento e genotipagem nos seguintes links:
FASTQ -
maq.sourceforge.netSAM -
samtools.imtqy.comVCF -
samtools.imtqy.comPara visualização do mapeamento de leituras (arquivos SAM ou BAM), é utilizado um software diverso. O mais popular é o IGV (Integrative Genomics Viewer do Broad Institute). Faça o download do IGV e familiarize-se com ele no
link .
Quais dados o Atlas interpreta?
O genoma completo contém dados sobre as variantes de genes que estão no teste genético Atlas, bem como sobre características que não podem ser calculadas usando a tecnologia de genotipagem usando microarranjos de DNA. Por exemplo, esses sintomas incluem os riscos de câncer.
Saude
383 Doenças HereditáriasO foco principal de todos os testes da Atlas é a seção de saúde, e nosso novo teste de genoma completo não foi exceção. Aos sintomas do nosso teste principal, adicionamos outras 65 doenças hereditárias.
As doenças hereditárias ou monogênicas incluem doenças transmitidas de pais para filhos e cujo desenvolvimento não é afetado pelo estilo de vida de uma pessoa. Para o desenvolvimento de uma doença, as mutações de um ou de ambos os pais são suficientes, dependendo do tipo de herança da doença.
21 doença multifatorialO desenvolvimento de doenças multifatoriais é influenciado por genes, estilo de vida e fatores ambientais. Tais doenças incluem, por exemplo, diabetes mellitus, obesidade, doença de Parkinson e Alzheimer, dermatite atópica. Na sua conta pessoal, o usuário pode calcular o risco relativo de desenvolver a doença com base em dados de teste e em um questionário sobre estilo de vida.
6 outros sintomas relacionados à saúdeAqui, coletamos sinais que afetam o estilo de vida de uma pessoa. Por exemplo, duração do sono, cronótipo, síndrome da fadiga crônica, medo da dor.

Genética clínica
43 Riscos De CâncerDevido ao fato de que mais variantes de genes estão sendo estudadas em todo o genoma, obtemos mais dados e podemos avaliar os riscos de desenvolver câncer. De acordo com os resultados do teste, avaliamos a predisposição para síndromes hereditárias de câncer.
As síndromes oncológicas hereditárias são doenças genéticas que podem ser transmitidas em uma família de geração em geração e aumentam os riscos de certos tipos de câncer. Cerca de 10% dos casos de oncologia são hereditários.
A busca por síndromes hereditárias de câncer é útil principalmente para aqueles que tiveram casos de câncer na família. A natureza hereditária pode ser indicada pela idade precoce do início da doença (até 50 anos), pela presença de vários parentes na mesma linha com o mesmo diagnóstico, formas raras de câncer. Com base nos resultados do teste, o médico determinará a quantidade de pesquisas adicionais e elaborará um programa pessoal de gerenciamento de riscos de câncer. Saiba mais sobre como os tumores malignos se desenvolvem em nossa série de artigos.
53 Indicações de suscetibilidade aos componentes ativos da drogaCada pessoa reage de maneira diferente às drogas: em algumas, a droga funciona bem, outras sofrem efeitos colaterais graves e, em outras, o tratamento é ineficaz. Em alguns casos, isso ocorre devido ao trabalho de genes que afetam o metabolismo de substâncias ativas e os riscos de reações adversas.
Por exemplo, o medicamento Omeprazol reduz a secreção de ácido clorídrico no estômago. Usado no tratamento de úlcera péptica do estômago e duodeno, doença do refluxo. O gene CYP2C19 codifica uma enzima responsável pelo metabolismo do omeprazol. Portanto, dependendo das variantes do gene, é necessário ajustar a dose de omeprazol ou usar um medicamento alternativo.
No teste, examinamos variantes genéticas associadas ao metabolismo de 53 drogas. Entre eles estão antidepressivos, contraceptivos hormonais, um medicamento para reduzir a coagulação sanguínea e outros.
Relatório Especializado sobre Doenças HereditáriasO relatório é a conclusão do Laboratório de Bioinformática Clínica Fedor Konovalov. Os laboratórios de bioinformática estão procurando o transporte de doenças recessivas. Esse transporte geralmente não afeta a saúde de uma pessoa, mas pode levar a doenças em seus filhos ainda não nascidos. Além disso, o laboratório pode identificar uma mutação única que não tenha sido descrita anteriormente e concluir se ela é provavelmente patogênica.
Os especialistas realizam uma análise completa das informações científicas relevantes sobre mutações e doenças em cada caso. A conclusão contém todas as informações necessárias para o geneticista. Com este relatório, você pode entrar em contato com um especialista em caso de necessidade.
Tais relatórios genéticos são semelhantes a um documento legal com uma abundância de termos complexos, os quais somente um especialista pode avaliar corretamente, no nosso caso, um geneticista. Portanto, não mostramos genética clínica antes da consulta. Durante a reunião, o geneticista diz em detalhes o que você deve prestar atenção, levando em consideração o histórico familiar e a presença de sintomas. Isso pode ajudar, por exemplo, a esclarecer a idade em que começa o rastreamento de certas doenças ou ao planejar uma família.
Nutrição
28 RelatóriosDe acordo com testes genéticos e até o genoma completo, é impossível selecionar a nutrição ideal e fazer uma dieta. Existem tantos produtos, seus métodos de cozimento e pratos que é difícil para os pesquisadores encontrarem correlações com as variantes dos genes. No entanto, alguns dados ainda estão lá.
A partir de certas variantes de genes, podemos descobrir se uma pessoa tem predisposição à intolerância à lactose ou glúten, rápida ou lentamente, o corpo lida com álcool ou cafeína e também avaliar a predisposição a um certo nível de ferro, cálcio, ácidos graxos ômega-3 e 6. De acordo com esses dados, uma pessoa pode decidir quais produtos ele deve remover ou vice-versa adicionar à dieta.
Esporte
16 RelatóriosDeterminar o esporte que mais lhe agrada geneticamente é tão difícil quanto pegar comida. Existem muitos tipos de atividade física, e o conceito de esporte está se expandindo a cada ano. Então, o skate e o surf foram adicionados ao programa de esportes olímpicos. Existem muitos tipos de atividade física para serem mais determinados geneticamente. Portanto, não acredite nos testes genéticos que prometem encontrar o esporte mais adequado para você. Escolha o esporte que você gosta.
A comunidade de ciência genética está preocupada com o fato de os pais fazerem testes genéticos para seus filhos para descobrir qual esporte é melhor para eles. Nesse caso, a criança pode ser enviada para um grupo de que não gosta, mas é adequada de acordo com os resultados do teste. Se uma pessoa deseja obter excelentes resultados no esporte, o sucesso dependerá em grande parte de suas ambições, força de vontade e caráter. As variantes genéticas desempenham um papel menor aqui.
Usando um teste genético, você pode descobrir como os genes afetam os riscos de lesões esportivas, a quantidade de fator de crescimento semelhante à insulina-1 livre, o nível de glóbulos vermelhos, a eritropoietina e também as características do metabolismo dos aminoácidos - valina, leucina e L-carnitina. Aos resultados do genoma completo, também adicionamos o risco de neuralgia do nervo ciático, nível de IGFBP-3, volume expiratório e outros.
Outros sintomas
15 relatóriosNesta seção, reunimos sinais relacionados às características do corpo: aparência, percepção da luz, sensibilidade a ervas e cheiros. Em nosso teste, você não encontrará sinais relacionados a emoções, comportamento ou caráter. Basicamente, essas características dependem das características da educação, ambiente e hábitos e, em menor grau, são afetadas pelas variantes genéticas. Além disso, muitas qualidades pessoais podem ser alteradas ou desenvolvidas na idade adulta.
Origem
3 RelatóriosA genética não usa o conceito de etnia ou nacionalidade. Em maior medida, elas se devem a diferenças culturais e não a variantes genéticas diferentes. Em vez disso, a genética usa o conceito de população - um grupo de pessoas que vive no mesmo território há muito tempo. Hoje, os dados genômicos de certas populações estão disponíveis, dos quais os cientistas identificaram sequências e variantes de genes característicos de cada uma. Os estudos genéticos de origem são a busca de tais variantes no genoma e a determinação da similaridade genética com populações conhecidas em termos percentuais.
Além da composição da população pelo código genético, você pode descobrir o seu haplogrupo. Um haplogrupo é um grupo de pessoas com a mesma variante genética que aconteceu em um ancestral comum milhares de anos atrás. Além disso, a porcentagem de DNA neandertal pode ser determinada a partir do genoma. Cerca de 1 a 4% do DNA neandertal foi encontrado no genoma dos humanos modernos. Agora, são conhecidos apenas alguns sinais que dependem da disponibilidade de variantes genéticas do Neandertal - crescimento de pelos nas costas e nível de lipoproteínas de LDL de baixa densidade (colesterol ruim).

Comparação do teste genético completo do genoma e do Atlas
Por que o genoma completo?
A principal vantagem do Genoma Completo é que você obtém todas as informações sobre seu DNA. Quando novos dados são exibidos, simplesmente os adicionamos à sua conta. Nem sempre funciona com o teste genético usual, uma vez que examina cerca de 660.000 variantes - 0,1% de todo o DNA.
Para interpretar os novos sinais, eles podem não ser suficientes.Os resultados do teste ajudarão a tomar medidas para a prevenção de doenças, planejamento familiar e o médico poderá esclarecer o diagnóstico no futuro ou agora. O teste será entregue em sua casa e tudo o que é necessário do usuário é coletar uma amostra de saliva e ligar para um transportador para transferir os tubos de teste para o laboratório.A base do Atlas Complete Genome: análise genética de alta precisão (99,5%), controle de qualidade dos dados obtidos, sistema de interpretação de dados patenteado, acesso aos dados de origem, aconselhamento genético e artigos científicos selecionados disponíveis para todos os usuários. O usuário recebe tudo isso por 94.500 - o preço mais baixo para esses serviços na Rússia. O teste já pode ser comprado no site da Atlas .Se você sabe trabalhar com big data, especialmente bioinformática, seus dados brutos do genoma completo podem ser plasticina, com os quais você pode brincar à vontade e aprender mais sobre si mesmo. Por exemplo, você pode eliminar as variantes de genes que outras empresas estão estudando e carregar interpretações em seus bancos de dados, descobrir o relacionamento com outra pessoa, obter o DNA de referência de um chimpanzé ou neandertal e comparar a sua similaridade.E também
Atlas preparou um grande presente para os leitores Habr! Nos artigos a seguir, daremos três tarefas com exemplos e dados de entrada, além de informações sobre o software necessário. O primeiro a resolver todos os problemas - receberá o genoma completo como um presente !