Ao procurar novas partículas fundamentais, os físicos sempre tiveram que especular como as partículas podem se comportar. Novos algoritmos de aprendizado de máquina não precisam disso.

Em uma colisão que ocorreu no Large Hadron Collider em abril deste ano, foram encontradas partículas carregadas individuais (linhas laranja) e grandes jatos de partículas (cones amarelos)
O Large Hadron Collider (LHC) reúne bilhões de pares de prótons a cada segundo. Às vezes, essa máquina consegue agitar um pouco a realidade e criar algo sem precedentes nessas colisões. Mas como esses eventos são, por definição, inesperados, os físicos não sabem exatamente o que precisam procurar. Eles temem que, examinando dados de bilhões dessas colisões e amostrando uma quantidade mais viável, possam remover inadvertidamente evidências de alguma nova física. "Sempre nos preocupamos que possamos
jogar água no bebê", diz
Kyle Kranmer , especialista em física de partículas da Universidade de Nova York que trabalha como parte do experimento do ATLAS LHC.
Diante da tarefa de reduzir inteligentemente a quantidade de dados, alguns físicos estão tentando usar essa tecnologia de aprendizado de máquina como "redes neurais profundas" para arrastar o mar de eventos familiares em busca de novos fenômenos físicos.
Em um caso típico de uso dessa tecnologia, a rede neural profunda aprende a distinguir gatos de cães estudando uma pilha de fotos rotuladas como “gato” e outra pilha rotulada como “cachorro”. Mas essa abordagem não funcionará na busca de novas partículas, uma vez que os físicos não podem alimentar as imagens das máquinas de algo que nunca viram. Portanto, eles precisam “aprender com pouca supervisão” quando as máquinas começam a aprender com partículas conhecidas e, em seguida, procuram eventos raros com informações menos detalhadas - por exemplo, com que frequência esses eventos podem ocorrer em geral.
Em um artigo publicado em maio na pré-impressão do arxiv.org, três pesquisadores propuseram uma estratégia semelhante para expandir a caça colisão, uma técnica clássica de busca de partículas que encontrou o bóson de Higgs. A idéia geral, como escreve um dos autores do trabalho,
Ben Nachman , pesquisador do Laboratório Nacional Lawrence Berkeley, de treinar a máquina em busca de variações raras no conjunto de dados.
Considere o exemplo mais simples, no espírito dos cães e gatos mencionados, como uma tentativa de encontrar uma nova espécie animal em um conjunto de dados repleto de observações das florestas da América do Norte. Se assumirmos que novos animais serão agrupados em determinadas áreas geográficas (essa idéia corresponde ao fato de que novas partículas são agrupadas em torno de uma determinada massa), o algoritmo deve ser capaz de selecioná-las por uma comparação sistemática das regiões vizinhas. Se houver 113
caribu [renas na América do Norte] na Colúmbia Britânica e 19 no estado de Washington (apesar da presença de milhões de esquilos por aí), o programa aprenderá a distinguir caribu de esquilo sem estudá-los diretamente. "Não é mágico, mas parece que sim", disse
Tim Cohen , especialista teórico em física de partículas da Universidade de Oregon, que também estuda vigilância fraca.
Para pesquisas tradicionais em física de partículas, ao contrário do descrito, os pesquisadores precisam fazer suposições sobre a aparência de um novo fenômeno. Eles criam um modelo de como as novas partículas se comportarão - por exemplo, uma nova partícula pode gravitar em direção à decomposição em um determinado conjunto de partículas conhecidas. E somente depois que eles determinam o que estão procurando, eles podem criar uma estratégia de pesquisa especial. Um estudante de graduação geralmente gasta um ano de trabalho para realizar essa tarefa, mas Nachman acredita que isso poderia ser feito de maneira mais rápida e completa.
O algoritmo CWoLa proposto, que significa "classificação sem rótulos" (KBM), é capaz de pesquisar nos dados existentes por partículas desconhecidas que se decompõem em duas partículas desconhecidas mais leves do mesmo tipo ou em duas partículas conhecidas do mesmo ou de diferentes tipos. Usando os métodos de busca comuns, levaria
pelo menos 20 anos para as equipes que trabalhavam no LHC filtrarem todas as possibilidades que coincidiam com a segunda opção e, para a primeira opção hoje, não existem estratégias de busca. Nachman, que trabalha no projeto ATLAS, diz que o KBM é capaz de fazer todas essas pesquisas de uma só vez.
Outros especialistas em física experimental de partículas concordam que o jogo pode valer a pena. "Já pesquisamos em diferentes lugares previsíveis, por isso é muito importante
seguirmos o outro caminho e preencher os vazios que ainda não procurávamos", disse
Kat Pachal , física que procura colisões de novas partículas no projeto ATLAS. Ele e seus colegas brincaram com a idéia de desenvolver software flexível capaz de lidar com uma ampla variedade de massas de partículas, mas nenhuma delas era qualificada em aprendizado de máquina. "Acho que é hora de tentar", disse ela.
Espera-se que as redes neurais sejam capazes de detectar correlações de dados subjacentes que não estão disponíveis para os modelos atuais. Outras tecnologias de aprendizado de máquina já aceleraram com êxito a eficácia de determinadas tarefas no LHC, por exemplo,
determinando os jatos emitidos pelos quarks inferiores. Nesse trabalho, ficou perfeitamente claro que os físicos perdem alguns sinais. "Eles estavam perdendo algumas informações, e se você pagou US $ 10 bilhões pela unidade, nenhuma informação deve ser perdida", disse
Daniel Whitson , especialista em física de partículas da Universidade da Califórnia, Irvine.
E, no entanto, o campo do aprendizado de máquina é cheio de
histórias de
advertência sobre programas que misturam mãos com halteres (ou
pior ). Alguns no LHC estão preocupados que todos esses caminhos curtos reflitam o trabalho dos gremlins na própria máquina, que os pesquisadores tentam com tanto cuidado não notar. "Quando você encontrou a anomalia, ela não ficou imediatamente clara - é uma nova física ou é apenas algo errado com o detector?" Diz
Till Eifert , físico que trabalha no projeto ATLAS.