Como a inteligência artificial está mudando a ciência

Os mais recentes algoritmos de IA compreendem a evolução das galáxias, calculam as funções das ondas quânticas, descobrem novos compostos químicos e assim por diante. Existe algo no trabalho de cientistas que não possa ser automatizado?




Nenhuma pessoa ou mesmo um grupo de pessoas pode acompanhar as informações em cascata produzidas por um grande número de experimentos em física e astronomia. Alguns deles deixam terabytes de dados diariamente, e esse fluxo está aumentando apenas. O conjunto de antenas Square Kilometer Array, um radiotelescópio que eles planejam ligar em meados da década de 2020, produzirá anualmente um volume de dados comparável a toda a Internet.

Essa enxurrada de dados levou muitos cientistas a procurar ajuda em inteligência artificial (IA). Com o mínimo envolvimento humano, sistemas de IA, como redes neurais - redes de neurônios simulados por computador que imitam a função cerebral - são capazes de percorrer montanhas de dados, encontrando anomalias e reconhecendo seqüências que as pessoas nunca teriam notado.

Obviamente, a ajuda de computadores em pesquisas científicas é utilizada há cerca de 75 anos, e o método de classificação manual de dados em busca de sequências significativas foi inventado milhares de anos atrás. Mas alguns estudiosos argumentam que a mais recente tecnologia em aprendizado de máquina e IA representa uma maneira fundamentalmente nova de fazer ciência. Uma dessas abordagens, modelagem generativa (GM), pode ajudar a determinar a teoria mais provável entre explicações concorrentes dos dados observados, com base apenas nesses dados e sem nenhum conhecimento pré-programado de quais processos físicos podem ocorrer no sistema em estudo. . Os proponentes da GM consideram inovador o suficiente para ser visto como uma “terceira maneira” potencial de estudar o universo.

Normalmente, adquirimos conhecimento da natureza por meio da observação. Como Johannes Kepler estudou as tabelas da posição dos planetas de Tycho Brahe, tentando encontrar o padrão subjacente (ele finalmente percebeu que os planetas se movem em órbitas elípticas). A ciência também avançou através de simulações. Um astrônomo pode simular o movimento da Via Láctea e da galáxia vizinha, Andrômeda, e prever que eles colidirão em alguns bilhões de anos. Observações e simulações ajudam os cientistas a criar hipóteses que podem ser verificadas usando observações futuras. GM é diferente de ambas as abordagens.

"Essencialmente, esta é a terceira abordagem, entre observação e simulação", disse Kevin Shavinsky , astrofísico e um dos apoiadores mais pró-GM, que até recentemente trabalhava no Instituto Federal Suíço de Tecnologia. "Esta é uma maneira diferente de atacar a tarefa."

Alguns cientistas consideram a GM e outras tecnologias apenas ferramentas poderosas para a prática da ciência tradicional. Mas a maioria concorda que a IA afetará significativamente esse processo, e seu papel na ciência só aumentará. Brian Nord , astrofísico do Fermi National Accelerator Laboratory que usa redes neurais artificiais para estudar o espaço, é um daqueles que temem que nenhuma das atividades do cientista humano escape à automação. "O pensamento é bastante assustador", disse ele.

Descoberta de geração


Mesmo no instituto, Shavinsky começou a construir uma reputação na ciência com base em dados. Enquanto trabalhava em seu doutorado, ele teve a tarefa de classificar milhares de galáxias com base em sua aparência. Como não havia programas prontos para essa tarefa, ele decidiu organizar o crowdsourcing para esse fim - foi assim que nasceu o projeto Galactic Zoo . Desde 2007, usuários comuns têm sido capazes de ajudar os astrônomos a fazer suposições sobre qual galáxia pertence a qual categoria, e geralmente a maioria das vozes classifica corretamente a galáxia. O projeto foi bem-sucedido, no entanto, como observa Shavinsky, a IA deixou de fazer sentido: "Hoje, um cientista talentoso com experiência na região de Moscou e acesso à computação em nuvem pode fazer esse projeto em meio dia".

Shavinsky voltou-se para a nova ferramenta poderosa da GM em 2016. De fato, o GM faz a pergunta: qual a probabilidade de que, na condição X, obtenhamos o resultado Y? Essa abordagem se mostrou incrivelmente eficaz e universal. Por exemplo, digamos que você tenha alimentado a GM com um conjunto de imagens de rostos humanos e para cada pessoa sua idade é aposta. O programa combina esses dados de treinamento e começa a encontrar uma conexão entre rostos antigos e a maior probabilidade de rugas aparecerem neles. Como resultado, ela pode indicar a idade de qualquer pessoa, ou seja, prever quais mudanças físicas uma pessoa de qualquer idade deve sofrer.


Nenhum desses indivíduos é real. A linha superior (A) e a coluna esquerda (B) são criadas por uma rede generativa-adversária (GSS) usando blocos de construção derivados de elementos de pessoas reais. Em seguida, o GSS combinou os principais recursos faciais da série A, incluindo sexo, crescimento e formato do rosto, com recursos faciais menores da coluna B, por exemplo, cor dos cabelos e dos olhos, e criou rostos no restante da tabela.

Dos sistemas GM, as redes adversárias generativas (GSS) são mais conhecidas. Após o processamento de dados de treinamento adequados, o GSS pode restaurar imagens com pixels ausentes ou danificados ou tornar as fotos borradas nítidas. Os GSSs são treinados para extrair as informações ausentes com base na competição (daí o "adversário"): uma parte da rede, o gerador, gera dados falsos, e a segunda, o discriminador, tenta distinguir dados falsos dos reais. Enquanto o programa está sendo executado, ambas as partes gradualmente funcionam melhor. Você pode ter visto algumas "faces" super-realistas criadas pelo GSS - imagens de "pessoas incrivelmente realistas que não existem na realidade", como escreveram em uma das manchetes.

Em um caso mais geral, um GM pega um conjunto de dados (geralmente imagens, mas não é necessário) e os divide em subconjuntos dos blocos de construção abstratos básicos - os cientistas os chamam de "espaço oculto" dos dados. O algoritmo manipula elementos do espaço oculto para ver como isso afetará os dados iniciais, o que ajuda a revelar os processos físicos que garantem a operação do sistema.

A idéia de espaço oculto é abstrata e difícil de imaginar, mas como uma analogia grosseira, pense no que seu cérebro pode fazer quando tentar determinar o sexo de uma pessoa pelo rosto. Talvez você note um penteado, um formato de nariz, etc., assim como padrões que não são fáceis de descrever em palavras. Um programa de computador também procura sinais ocultos nos dados: embora não tenha idéia do que é bigode ou sexo, se foi treinado em um conjunto de dados em que algumas imagens são rotuladas como "homem" ou "mulher" e algumas têm o rótulo "bigode" ", Ela entenderá rapidamente o relacionamento.


Kevin Shavinsky, astrofísico, chefe da empresa de IA Modulos

Em um artigo publicado em dezembro na revista Astronomy & Astrophysics, Shavinsky e seus colegas, Denis Tharp e Che Zhen, usaram a GM para estudar as mudanças físicas nas galáxias durante a evolução (o software que eles usam calcula o espaço oculto um pouco diferente do GSS, por isso é tecnicamente impossível chamar GSS, embora seja bastante próximo nas propriedades). Seu modelo criou conjuntos de dados artificiais para testar hipóteses sobre processos físicos. Eles, por exemplo, perguntaram como a “atenuação” da formação estelar - uma acentuada diminuição na velocidade de sua formação - está associada a um aumento na densidade da galáxia.

Para Shavinsky, a questão principal é quanta informação sobre processos estelares e galácticos pode ser extraída com base em apenas um dado. "Exclua tudo o que sabemos sobre astrofísica", disse ele. "Até que ponto podemos redescobrir esse conhecimento usando apenas dados?"

Primeiro, as imagens das galáxias foram reduzidas ao espaço oculto; então Shavinsky poderia corrigir um elemento desse espaço para que ele correspondesse a uma certa mudança no ambiente da galáxia - por exemplo, a densidade de seu ambiente. Então ele poderia regenerar a galáxia e ver quais diferenças apareceriam dessa vez. "E agora eu tenho uma máquina para gerar hipóteses", explicou ele. "Eu posso pegar um monte de galáxias originalmente cercadas por baixa densidade e fazer parecer que a densidade delas é alta." Shavinsky, Tarp e Zhen descobriram que, passando de uma densidade mais baixa para uma densidade mais alta do ambiente, ficam mais vermelhos e suas estrelas se concentram mais densamente. Isso é consistente com as observações existentes de galáxias, disse Shavinsky. A única pergunta é o porquê.

O próximo passo, diz Shavinsky, ainda não foi automatizado. "Eu, cara, preciso intervir e dizer: Bem, que tipo de física pode explicar esse efeito?" Há duas explicações possíveis para esse processo: é possível que as galáxias se tornem mais avermelhadas em ambientes mais densos porque contêm mais poeira ou porque há um declínio na formação de estrelas (em outras palavras, suas estrelas geralmente são mais antigas). Usando o modelo generativo, podemos testar as duas idéias. Mudamos os elementos do espaço oculto associados à poeira e à velocidade da formação estelar e vemos como isso afeta a cor das galáxias. "E a resposta é clara", disse Shavinsky. Galáxias mais vermelhas são aquelas "onde a velocidade da formação estelar caiu, e não aquelas onde há mais poeira. Portanto, somos inclinados a favor da primeira explicação. ”


A linha superior são galáxias reais em regiões de baixa densidade.
Segunda linha - reconstrução baseada no espaço oculto.
Em seguida, vêm as transformações feitas pela rede e abaixo estão as galáxias geradas em regiões de alta densidade.

A abordagem está associada a simulações tradicionais, mas tem diferenças importantes. A simulação, de fato, "é baseada em suposições", disse Shavinsky. "Este é o mesmo que dizer:" Acho que entendi quais fundamentos físicos estão subjacentes a tudo o que observo no sistema. " Eu tenho uma receita para formar estrelas, para o comportamento da matéria escura e assim por diante. Coloco todas as minhas hipóteses e começo a simulação, e depois pergunto: isso parece realidade? ” E com a modelagem generativa, isso, ele disse, parece "de certo modo, exatamente o oposto da simulação". Não sabemos nada, não queremos assumir nada. Queremos que os dados nos digam o que pode acontecer. ”

O aparente sucesso da modelagem generativa em tal estudo, obviamente, não significa que astrônomos e estudantes de pós-graduação se tornaram desnecessários - mas parece demonstrar uma mudança no grau em que a IA pode aprender algo sobre objetos e processos astrofísicos, tendo quase apenas uma enorme quantidade de dados. "Esta não é uma ciência totalmente automatizada, mas demonstra que somos capazes de criar ferramentas que automatizam o progresso científico pelo menos parcialmente", disse Shavinsky.

A modelagem generativa é obviamente capaz de muito - mas se realmente representa uma nova abordagem da ciência, esse é um ponto discutível. Para David Hogg , cosmólogo da Universidade de Nova York e do Instituto Flatiron, essa tecnologia, embora impressionante, é de fato uma maneira muito complexa de extrair seqüências de dados - e os astrônomos fazem isso há séculos. Em outras palavras, é um método avançado de observação e análise. O trabalho de Hogg, como Shavinsky, é altamente dependente da IA; ele usa redes neurais para classificar estrelas por espectro e tirar conclusões sobre outras propriedades físicas de estrelas usando modelos orientados a dados. Mas ele considera seu trabalho e o trabalho de Shavinsky um método científico antigo, gentil e comprovado. "Não acho que essa seja a terceira maneira", disse ele recentemente. “Eu acho que nós, como comunidade, estamos cada vez mais usando nossos dados. Em particular, somos muito melhores na comparação de dados. Mas, do meu ponto de vista, meu trabalho se encaixa perfeitamente na estrutura do regime de observação. ”

Assistentes zelosos


Se a IA e as redes neurais são ferramentas conceitualmente novas ou não, é óbvio que elas começaram a desempenhar um papel crítico na astronomia moderna e na pesquisa física. No Instituto Heidelberg de Pesquisa Teórica, o físico Kai Polsterer lidera um grupo de astroinformática - uma equipe de pesquisadores que trabalha com novos métodos em astrofísica baseados no processamento de dados. Recentemente, eles usaram um algoritmo com MOs para extrair informações de desvio para o vermelho dos conjuntos de dados da galáxia - uma tarefa que costumava ser debilitante.

Polsterer considera esses novos sistemas baseados em IA "assistentes zelosos", capazes de vasculhar os dados por horas sem se cansar e reclamar das condições de trabalho. Esses sistemas podem fazer todo o trabalho monótono e árduo, disse ele, deixando-nos com uma "ciência interessante e interessante".

Mas eles não são perfeitos. Em particular, alerta Polsterer, os algoritmos só podem fazer o que foram treinados. O sistema é indiferente à entrada. Dê a ela uma galáxia e ela poderá apreciar seu desvio para o vermelho e a idade. Mas dê a ela uma selfie ou uma foto de peixe podre, ela apreciará a idade (naturalmente, errada). No final, ele disse, a supervisão das pessoas continua sendo necessária. “Tudo fecha para nós, os pesquisadores. Nós somos responsáveis ​​pela interpretação. ”

Nord, do Fermilab, por sua vez, alerta que é importante que as redes neurais produzam não apenas resultados, mas também erros de trabalho, como qualquer aluno está acostumado. É tão aceito na ciência que se você fizer uma medição, mas não der um erro, ninguém levará seus resultados a sério.

Como muitos pesquisadores de IA, Nord também está preocupado que os resultados das redes neurais sejam difíceis de entender; a rede neural dá uma resposta sem fornecer uma maneira clara de obtê-la.

No entanto, nem todo mundo acredita que a falta de transparência é um problema. Lenka Zdeborova, pesquisadora do Instituto de Física Teórica da França, aponta que a intuição humana também é às vezes impossível de entender. Você olha a foto e descobre que o gato está retratado nela - "mas você não sabe como sabe disso", diz ela. "Seu cérebro, de certa forma, também é uma caixa preta."

Não apenas astrofísicos e cosmólogos migram para o lado da ciência usando IA e processamento de dados. O especialista em física quântica Roger Melko, do Instituto de Física Teórica do Perímetro e da Universidade de Waterloo, usou uma rede neural para resolver alguns dos problemas mais complexos e importantes nessa área, por exemplo, representando uma função de onda que descreve um sistema de muitas partículas. A IA é necessária por causa do que Melko chama de "maldição exponencial da dimensão". Ou seja, o número de formas possíveis da função de onda aumenta exponencialmente com um aumento no número de partículas no sistema descrito. A dificuldade é semelhante a tentar escolher a melhor jogada em um jogo como xadrez ou ir: você tenta calcular a próxima jogada imaginando como o seu oponente irá e escolher a melhor resposta, mas a cada jogada o número de oportunidades aumenta.

Obviamente, a IA dominou esses dois jogos, aprendendo a jogar xadrez há algumas décadas e derrotando o melhor jogador de 2016 - isso foi feito pelo sistema AlphaGo. Ela diz finamente que eles também estão bem adaptados aos problemas da física quântica.

Mente da máquina


Se Shavinsky está certo ao declarar que encontrou uma “terceira maneira” de se envolver na ciência, ou, como Hogg diz, essas são apenas observações tradicionais e análise de dados “com esteróides”, é claro que a IA muda a essência de uma descoberta científica e a acelera claramente. Até onde vai a revolução da IA ​​na ciência?

Periodicamente, são feitas declarações altas sobre as realizações dos "robo-cientistas". Há dez anos, o químico robô Adam examinou o genoma da levedura e determinou quais genes são responsáveis ​​pela produção de certos aminoácidos. Ele fez isso observando cepas de leveduras que careciam de certos genes e comparando os resultados de seu comportamento entre si. A revista Wired escreveu: "O robô fez uma descoberta científica por conta própria ".

Um pouco mais tarde, Lee Cronin, químico da Universidade Glazko, usou um robô para misturar aleatoriamente produtos químicos para verificar se novos compostos apareceram. Ao rastrear reações em tempo real usando um espectrômetro de massa, uma máquina de ressonância magnética nuclear e um espectrômetro de infravermelho, o sistema acabou aprendendo a prever as combinações mais reativas. , , , 90%.

. , - , , , , . , , , , , .

, , , . , , – , , . The Book of Why 2018 - , – « ». - « », . « , , , , , , , , ». , , « ». , . « , , ».

, , , , , , . , - , . « , , , , , — . – , , ». ? , – , , , . « , . , - ». , «» «» , Deep Blue and AlphaGo. , , , , .

; Modulos, , , , « ». , , . , .

« , , , ? – . – , ? Eu não sei ».

Source: https://habr.com/ru/post/pt445806/


All Articles