
Pesquisadores da Microsoft e da Universidade de Washington demonstraram o primeiro sistema de DNA somente leitura totalmente automatizado no DNA criado artificialmente. Este é um passo fundamental para mover novas tecnologias de laboratórios de pesquisa para data centers comerciais.
Os desenvolvedores confirmaram o conceito com um teste simples: eles codificaram com sucesso a palavra "olá" em fragmentos de uma molécula de DNA sintético e a converteram novamente em dados digitais usando um sistema de ponta a ponta totalmente automatizado, descrito em um artigo publicado em 21 de março na Nature Scientific Reports.
Este artigo está em nosso site.Nas moléculas de DNA, você pode armazenar informações digitais com uma densidade muito alta, ou seja, no espaço físico, que é muitas ordens de magnitude menor do que os data centers modernos ocupam. Essa é uma das soluções promissoras para armazenar uma enorme quantidade de dados que o mundo gera todos os dias, desde registros comerciais e vídeos com animais fofos até imagens e imagens médicas do espaço.
A Microsoft está explorando maneiras de preencher a lacuna em potencial entre a quantidade de dados que produzimos e queremos armazenar e nossa capacidade de armazená-los. Entre esses métodos está o desenvolvimento de algoritmos e tecnologias de computação molecular para codificação de dados em DNA artificial . Isso permitiria que todas as informações armazenadas em um grande data center moderno se ajustassem a um espaço aproximadamente igual ao tamanho de vários dados.
“Nosso principal objetivo é colocar em operação um sistema que, para o usuário final, pareça quase o mesmo que qualquer outro sistema de armazenamento em nuvem: as informações são enviadas ao data center e armazenadas no mesmo, e simplesmente aparecem quando o cliente precisa”, diz o sênior Karin Strauss, pesquisadora da Microsoft. "Para isso, precisávamos provar que faz sentido prático do ponto de vista da automação".
As informações são armazenadas em moléculas de DNA sintético criadas em laboratório, e não no DNA de humanos ou outros seres vivos, e podem ser criptografadas antes de serem enviadas ao sistema. Embora máquinas complexas, como sintetizadores e seqüenciadores, já executem partes importantes do processo, muitas das etapas intermediárias ainda exigem trabalho manual no laboratório de pesquisa. "Isso não é adequado para uso comercial", disse Chris Takahashi, pesquisador sênior da Paul Allen School of Computer Science & Engineering da Universidade de Ciência e Tecnologia da Computação dos EUA.
“Pessoas com conta-gotas não podem correr pelo data center; com essa abordagem, a probabilidade de erro humano é muito alta, é muito cara e requer muito espaço”, explicou Takahashi.
Para que esse método de armazenamento de dados faça sentido do ponto de vista comercial, é necessário reduzir o custo da síntese de DNA - a criação de blocos de construção fundamentais com sequências significativas e o processo de sequenciamento necessário para ler as informações armazenadas. Os pesquisadores dizem que há um rápido desenvolvimento nessa direção.
Segundo pesquisadores da Microsoft, a automação é outra parte importante desse quebra-cabeça, permitindo organizar o armazenamento de dados em escala comercial e torná-lo mais acessível.
Sob certas condições, o DNA pode durar muito mais tempo do que as modernas ferramentas de armazenamento de arquivos que foram destruídas por décadas. Algum DNA conseguiu sobreviver em condições longe do ideal por dezenas de milhares de anos - nas presas gigantescas e nos ossos dos primeiros seres humanos. Portanto, os dados podem ser armazenados dessa maneira, desde que a humanidade exista.
O sistema automatizado de armazenamento de DNA utiliza software desenvolvido pela Microsoft e pela Universidade de Washington (UW). Ele converte as unidades e zeros dos dados digitais em seqüências de nucleotídeos (A, T, C e G), que são os "blocos de construção" do DNA. Em seguida, o sistema utiliza equipamento de laboratório barato, principalmente padrão, para fornecer os fluidos e reagentes necessários ao sintetizador, que coleta os fragmentos de DNA preparados e os coloca em um tanque de armazenamento.
Quando o sistema precisa extrair informações, ele adiciona outros produtos químicos para preparar adequadamente o DNA e usa bombas microfluídicas para empurrar líquidos para as partes do sistema que lêem as seqüências das moléculas de DNA e as convertem em informações legíveis por computador. Os pesquisadores dizem que o objetivo do projeto não era provar que o sistema pode funcionar de forma rápida ou barata, mas simplesmente mostrar que a automação é possível.
Uma das vantagens mais óbvias de um sistema automatizado de armazenamento de DNA é que ele libera cientistas para resolver problemas complexos, eliminando a necessidade de perder tempo procurando garrafas de reagente ou adicionando monotonamente gotas de líquido nos tubos de ensaio.
"Ter um sistema automatizado para realizar trabalho repetitivo permite que a equipe do laboratório faça pesquisas diretamente, desenvolva novas estratégias para inovar mais rapidamente", disse o pesquisador da Microsoft Bihlin Nguyen.
A equipe do Laboratório de Sistemas de Informação Molecular (MISL) já demonstrou que pode armazenar fotografias de gatos, maravilhosas obras literárias, vídeos e registros de arquivo no DNA e extrair esses arquivos sem erros. Até o momento, eles foram capazes de salvar 1 gigabyte de dados no DNA, quebrando o recorde mundial anterior de 200 MB .
Os pesquisadores também desenvolveram métodos para realizar cálculos significativos , como pesquisar e recuperar apenas imagens que tenham uma maçã ou uma bicicleta verde, usando as próprias moléculas para fazer isso, sem converter os arquivos novamente no formato digital.
“É seguro dizer que estamos testemunhando o nascimento de um novo tipo de sistema de computador no qual moléculas são usadas para armazenar dados, e eletrônicos são usados para controle e processamento. Essa combinação abre oportunidades muito interessantes para o futuro ”, disse Louis Sese, professor da Allen School of Washington University.
Ao contrário dos sistemas de computação baseados em silício, os sistemas de armazenamento e computação baseados em DNA devem usar líquidos para mover moléculas. Mas os líquidos são inerentemente diferentes dos elétrons e exigem soluções técnicas completamente novas.
A equipe da Universidade de Washington, em colaboração com a Microsoft, também está desenvolvendo um sistema programável que automatiza experimentos de laboratório usando as propriedades da eletricidade e da água para mover gotículas em uma grade de eletrodos. A gama completa de software e hardware, conhecidos como Puddle e PurpleDrop , pode misturar, separar, aquecer ou resfriar vários fluidos e executar protocolos de laboratório.
O objetivo é automatizar experimentos de laboratório que atualmente estão sendo realizados manualmente ou por robôs caros de manipulação de líquidos e reduzir custos.
As próximas etapas para a equipe MISL incluem a integração de um sistema automatizado de ponta a ponta simples com tecnologias como Purple Drop, bem como outras tecnologias que permitem pesquisar em moléculas de DNA. Os pesquisadores fizeram especificamente seu sistema automatizado modular, para que ele possa evoluir à medida que novas tecnologias para síntese, sequenciamento e trabalho de DNA.
"Uma das vantagens deste sistema é que, se quisermos substituir uma das peças por algo novo, melhor ou mais rápido, podemos apenas conectar uma nova peça", disse Nguyen. "Isso nos dá uma grande flexibilidade para o futuro."
Imagem superior: Pesquisadores da Microsoft e da Universidade de Washington registraram e leram a palavra hello usando o primeiro sistema de armazenamento de dados de DNA totalmente automatizado. Este é um passo fundamental na transferência de novas tecnologias de laboratórios para data centers comerciais.