
Recentemente, minha tia enviou e-mails para seus colegas com o tema “problema de matemática! Qual é a resposta correta? ” A carta tinha um quebra-cabeça enganosamente simples:
1 + 4 = 5
2 + 5 = 12
3 + 6 = 21
8 + 11 =?
Para ela, a decisão foi óbvia. Mas seus colegas decidiram que a decisão deles estava certa - o que não coincidiu com a decisão dela. O problema foi com uma de suas respostas ou com o próprio quebra-cabeça?
Minha tia e seus colegas depararam com o problema fundamental do aprendizado de máquina, uma disciplina que estuda o aprendizado de computadores. Quase todo o treinamento que esperamos dos computadores - e o que fazemos por nós mesmos - consiste em reduzir as informações às leis básicas, com base nas quais é possível tirar conclusões sobre algo desconhecido. E o enigma dela era o mesmo.
Para uma pessoa, a tarefa é procurar qualquer padrão. Obviamente, nossa intuição limita o alcance de nossas suposições. Mas os computadores não têm intuição. Do ponto de vista de um computador, a dificuldade em reconhecer padrões está em abundância: se existe um número infinito de padrões igualmente legítimos, por causa dos quais alguns estão corretos e outros não?
E esse problema mudou recentemente para um plano prático. Até a década de 1990, os sistemas de IA geralmente raramente se envolviam em aprendizado de máquina. Suponha que um computador de xadrez Deep Thought, o antecessor do Deep Blue, não aprendeu xadrez por tentativa e erro. Em vez disso, os mestres do xadrez e os assistentes de programação criaram cuidadosamente as regras pelas quais se poderia descobrir se uma posição no xadrez era boa ou ruim. Esse ajuste manual meticuloso era típico dos “sistemas especialistas” da época.
Para abordar o mistério de minha tia usando a abordagem de sistemas especializados, é necessário que uma pessoa seja estrabismo nas três primeiras linhas de exemplos e observe o seguinte padrão nelas:
1 * (4 + 1) = 5
2 * (5 + 1) = 12
3 * (6 + 1) = 21
Então a pessoa instruiria o computador a seguir o padrão x * (y + 1) = z. Aplicando esta regra ao último resultado, obtemos uma solução - 96.
Apesar do sucesso inicial dos sistemas especialistas, o trabalho manual necessário para desenvolver, afinar e atualizá-los se tornou esmagador. Em vez disso, os pesquisadores chamaram a atenção para o desenvolvimento de máquinas que podem reconhecer padrões por conta própria. O programa poderia, por exemplo, examinar mil fotografias ou transações de mercado e derivar delas sinais estatísticos correspondentes à pessoa na foto ou um aumento nos preços de mercado. Essa abordagem rapidamente se tornou dominante e, desde então, está no centro de tudo, desde a classificação automática de correio e a filtragem de spam até a detecção de fraudes no cartão de crédito.
Mas, apesar de todos os sucessos, esses sistemas MO requerem um programador em algum lugar do processo. Tome como exemplo o enigma da minha tia. Assumimos que em cada linha há três componentes significativos (três números em uma linha). Mas há um quarto elemento potencial nele - o resultado da linha anterior. Se essa propriedade de cadeia for válida, outro padrão plausível será exibido:
0 + 1 + 4 = 5
5 + 2 + 5 = 12
12 + 3 + 6 = 21
De acordo com essa lógica, a resposta final deve ser 40.
Que regularidade é verdadeira? Naturalmente, ambos - e não um deles. Tudo depende de quais padrões são permitidos. Você pode, por exemplo, criar um padrão pegando o primeiro número, multiplicando pelo segundo, adicionando um quinto da soma da resposta anterior e três e arredondando tudo para o número inteiro mais próximo (muito estranho, mas funciona). E se permitirmos o uso de propriedades relacionadas à aparência de números, talvez exista uma sequência associada a serifas e linhas. A busca de padrões depende das suposições do observador.
O mesmo vale para MO. Mesmo quando as máquinas se treinam, os padrões preferidos são escolhidos pelas pessoas: o software de reconhecimento de rosto deve conter regras explícitas se / então, ou deve considerar cada recurso como evidência adicional a favor ou contra todas as pessoas possíveis a quem a pessoa pertence? Quais recursos da imagem o software deve lidar? Ela precisa trabalhar com pixels individuais? Ou talvez com as bordas entre as áreas claras e escuras? A escolha de tais opções limita quais padrões o sistema considera provável ou até possível. A busca por essa combinação ideal tornou-se o novo trabalho de especialistas do Ministério da Defesa.

Mas o processo de automação não parou por aí. Assim como os programadores foram torturados para escrever as regras do trabalho, agora eles relutam em desenvolver novos recursos. "Não seria bom se o próprio computador pudesse descobrir quais recursos ele precisava?" Então, eles desenvolveram uma rede neural de aprendizado profundo, uma tecnologia MO que pode tirar conclusões independentes sobre propriedades de alto nível com base em informações mais simples. Alimente um conjunto de pixels a uma rede neural e ela aprenderá a levar em conta bordas, curvas, texturas - e tudo isso sem instruções diretas.
E assim, os programadores perderam seus empregos por causa do One Algorithm, Edit to Everyone?
Ainda não. As redes neurais ainda não são ideais para nenhuma tarefa. Mesmo nos melhores casos, eles precisam ser ajustados. Uma rede neural consiste em camadas de "neurônios", cada uma das quais realiza cálculos com base nos dados de entrada e envia o resultado para a próxima camada. Mas quantos neurônios serão necessários e quantas camadas? Cada neurônio deve receber informações de cada neurônio do nível anterior ou alguns neurônios devem ser mais seletivos? Que transformação cada neurônio deve realizar nos dados de entrada para produzir o resultado? E assim por diante
Esses problemas limitam as tentativas de aplicar redes neurais a novas tarefas; uma rede neural que reconhece perfeitamente rostos é completamente incapaz de tradução automática. E, novamente, os elementos estruturais escolhidos pelo homem claramente empurram a rede para certas leis, afastando-a de outras. Uma pessoa experiente entende que nem todas as leis são criadas da mesma forma. Os programadores não serão deixados sem trabalho.
Obviamente, o próximo passo lógico serão as redes neurais, adivinhando independentemente quantos neurônios devem ser incluídos, quais conexões usar, etc. Os projetos de pesquisa sobre esse assunto estão em andamento há muitos anos.
Até onde isso pode ir? Os carros aprenderão a trabalhar sozinhos tão bem que a afinação externa se transformará em uma relíquia antiquada? Em teoria, pode-se imaginar um estudante universal ideal - aquele que pode resolver tudo por si mesmo e sempre escolhe o melhor esquema para a tarefa escolhida.
Mas em 1996, o especialista em ciência da computação David Walpert provou a impossibilidade de um aluno assim. Nos seus famosos "teoremas sobre a ausência de refeições gratuitas", ele mostrou que, para qualquer padrão em que o aluno seja bem treinado, há um padrão que ele estudará terrivelmente. Isso nos leva ao mistério de minha tia - ao número infinito de padrões que podem surgir a partir de dados finitos. A escolha de um algoritmo de treinamento significa a seleção de padrões com os quais a máquina lidará mal. Talvez todas as tarefas, por exemplo, reconhecimento de padrões, acabem caindo em um algoritmo abrangente. Mas nenhum algoritmo de aprendizado pode aprender tudo igualmente bem.
Isso faz o aprendizado de máquina parecer um cérebro humano. Embora gostemos de nos considerar inteligentes, nosso cérebro também não estuda perfeitamente. Cada parte do cérebro é cuidadosamente ajustada pela evolução para reconhecer certos padrões - seja o que vemos, a linguagem que ouvimos ou o comportamento de objetos físicos. Mas não estamos indo tão bem com a busca de padrões no mercado de ações; aqui as máquinas nos vencem.
A história do aprendizado de máquina tem muitos padrões. Mas o mais provável será o seguinte: treinaremos máquinas para aprender por muitos mais anos.