Esperanto para robôs e agentes Smith

O dicionário de William Shakespeare tem 12.000 palavras. O dicionário do negro da tribo canibal "Mumbo-Yumbo" tem 300 palavras. Ellochka Schukin do livro "12 Chairs" custa fácil e livremente trinta.

O homem entende facilmente Ellochka. Infelizmente, Shakespeare prefere entender um computador a Ellochka. É o suficiente para entendermos o contexto e a entonação - descobriremos o resto - e o computador precisa de clareza a cada termo. De preferência sem sinônimos. Quanto mais imagens ocultas por trás de cada palavra, mais difícil é entender. A natureza dependente do contexto das palavras humanas é apenas uma das dificuldades no ensino da inteligência artificial em linguagem natural. Se você conseguir distinguir cebolas comestíveis de cebolas se tiver uma descrição completa da situação, a negação de significado por ironia ou perguntas retóricas será reconhecida apenas por entonação. A sintaxe e a ordem das palavras em uma frase cria complexidade adicional.

Igor Mordach, um funcionário do OpenAI American Laboratory of Artificial Intelligence, no entanto, decidiu que a linguagem Ellochkin está longe de ser um beco sem saída, mas um exemplo muito adequado, no qual os bots criarão uma linguagem para sua comunicação, e então eles nos entenderão. Apenas 30 palavras para o computador Ellochka ele se arrependeu. Em seu experimento, um programa de computador criou a linguagem do zero.



Em busca de uma linguagem universal para comunicação com máquinas


A precisão do reconhecimento de linguagem natural agora entre os líderes de sistemas cognitivos (IBM Watson, Google, ABBYY, Microsoft, Nanosemantics) nos permite geralmente entender o significado e responder a uma pergunta escrita com uma base de conhecimento pré-determinada, mas a conversa mesmo com precisão de reconhecimento de frase de 90% é realmente muito cansativo. O discurso conversacional, saturado de interjeições e geralmente ocorrendo em uma grande empresa com a interseção de diálogos, coloca o bot em sua capacidade de manter a conversa no nível de uma criança de três anos de idade.

A capacidade dos programas de responder com precisão ao significado das frases resolveria muitos problemas de interface, o que significa conectar bots (agentes de inteligência artificial) a qualquer tarefa humana cotidiana. Há um diálogo com as máquinas até agora - a televisão, por exemplo, se comunica no idioma do controle remoto. Mas entende muito poucas equipes. E ele os entende somente após a programação. A partir deste exemplo simples, fica claro que, para uma comunicação rápida e flexível com programas e dispositivos multiuso (pelo menos robôs), os intermediários devem ser removidos do diálogo. Entre os quais, infelizmente, são programadores.

Os otimistas da linguística de computador associam esperanças a redes neurais. Na sua compreensão, o único problema é a necessidade de processar um grande número de exemplos. Os oponentes consideram a tarefa insolúvel. Não tanto por causa da escala de treinamento, mas por causa da equivalência dessa tarefa à tarefa de criar consciência nas máquinas. Cada uma das partes interpreta exemplos de contar golfinhos ou comunicar macacos em proveito próprio - alguns como perspectiva, outros como beco sem saída. Para os interessados ​​em detalhes sobre Habré e GT, existem muitos posts sobre linguagem natural. Por exemplo, "Introdução ao reconhecimento de linguagem natural" .

O assunto deste post é a terceira abordagem, tomada como base por Igor Mordach - deixe que as próprias máquinas aprendam a se comunicar primeiro no idioma que criarem. O processo de desenvolvimento de sua linguagem permitirá que agentes de software de inteligência artificial compreendam melhor o algoritmo para ajustar termos a novos significados, regras de formação de frases e usem esse conhecimento para conversas com pessoas. Foi exatamente isso que Mordach, que anteriormente trabalhou como especialista na criação de heróis de filmes de robôs em movimento, definiu a tarefa. Com esse pano de fundo em mente, Igor decidiu que o treinamento em movimentos contém algoritmos para coletar informações e seu uso simultâneo parcial, que pode ser usado em qualquer treinamento.

Para ensinar aos bots a linguagem dos bots (agentes de software), eles os colocaram no universo condicional do “quadrado branco”, definiram metas, energia de movimento e a capacidade de processar a experiência de se relacionar com o objetivo. Inicialmente, os bots tinham um conjunto mínimo de comandos de ação, experiência pessoal de sucesso e também permitiam trocar informações - por meio de um "contato tátil" próximo ou por um protótipo remoto de "audição e visão" (aqui é mais apropriado usar o termo direção do fluxo de informações). O objetivo dos bots no universo condicional do “quadrado branco” era alcançar um certo ponto para si mesmo, informar seu objetivo a outro agente, trocar objetivos, empurrar outro agente para o alvo na ausência de troca de informações entre eles. Os alvos e bots diferiam em cor ou tamanho.

Para o agente Smith, a matriz, quando criada por Mordach, ficaria assim:


No experimento OpenAI, o parâmetro medido de sucesso de tentativa e erro foi o fato e a velocidade de alcançar as metas. Eles podem ser a inação ou movimento de um determinado ponto (contato direto com o alvo ou contato através de outros agentes) no mundo virtual do quadrado branco. Quanto mais rápido o objetivo foi alcançado, mais útil foi reconhecida a lista de termos usados ​​no diálogo de objetivos atual. Os objetivos e o sucesso eram individuais e coletivos.

No processo de conclusão de tarefas, os bots enriqueceram a reserva linguística com novos conceitos convencionalmente correspondentes aos humanos - dos termos do movimento aos conceitos: superior, inferior, direita, esquerda. Mordach espera que, ao estabelecer as regras para a formação de palavras, os robôs possam mais facilmente "entender" as mesmas regras nas línguas humanas. Incluindo o aprendizado da precisão do uso de termos comparativos e indefinidos. A IA tem um entendimento fraco de termos abstratos e generalizados. Mais precisamente, ele não entende nada, mas está pronto para trabalhar com algumas frases e, para outras, é necessário obter informações esclarecedoras. Na expressão "o carro passa rápido", pelo menos a palavra "rápido" - precisa ser medida. Mesmo em termos de regras de tráfego, "rápido" ainda é uma matriz de valores que se encaixam em algum intervalo. Mais precisamente, vários intervalos - para a cidade, autobahns e áreas rurais.

As redes neurais, é claro, são capazes de trabalhar com termos vagos, mas seu treinamento geralmente não começa do zero, contém várias regras de processamento inicial e também não depende do acúmulo de experiência de sinalização no tipo de canal pelo qual as informações são transmitidas. Estas são as principais novidades dos experimentos de Mordach.

Comparação de comunicações remotas e comunicação tátil de bots:

A falta de corpo e limites torna todos esses termos condicionais, é claro.

Um ponto notável é que o sucesso de cada bot foi calculado como uma fração do sucesso de todos os bots, incentivando a cooperação para alcançar a meta. Ou seja, a qualidade do vocabulário foi estimada pela totalidade da linguagem utilizada. Acontece que alguém precisava necessariamente coletar e relatar as circunstâncias secundárias para atingir a meta, o que, no caso de cumprimento individual das metas por cada transportadora, impediria que elas fossem alcançadas. A regra estatística 20/80 - receber 20% das informações fornece 80% da realização da meta - funciona no nível de um indivíduo, mas em uma equipe alguém sempre deve fornecer 100% das informações coletadas a 1% adicional de atingir a meta.

Todos os casos de comunicação de contato "verbal" e "não verbal" de bots durante o estudo de Mordach são mostrados no vídeo:


Matriz artificial e discreta como resultado da comunicação bot


A principal idéia de Mordach é garantir que, compreendendo o "mundo circundante", os bots criem a linguagem necessária para essa compreensão. Em seu conceito, a linguagem é o resultado da ação. Outros cientistas chamam a atenção para o fato de que uma linguagem desenvolvida e a capacidade de se comunicar em tópicos abstratos permitirão que as máquinas criem suas próprias idéias, descrevam e criem novas entidades que não existiam anteriormente. Não há muito longe da transformação do nosso mundo.

A capacidade de entender a linguagem natural é considerada intimamente relacionada à presença da consciência no assunto da comunicação. A capacidade de entender o significado do que foi dito levará ao surgimento da consciência nas máquinas? Talvez apenas uma pessoa com uma criação semelhante à humana possa entender completamente a linguagem natural, e a criação de uma linguagem de bot em seu próprio ambiente levará a robôs inteligentes nesta ou naquela versão do Agent Smith.

Definir prioridades de bots durante o treinamento é contrário ao princípio de engenharia de confiabilidade e previsibilidade da operação da máquina. A imprevisibilidade das prioridades, a capacidade de fantasiar, a auto-educação, o segredo da comunicação entre bots para humanos - já se fizeram sentir em experimentos anteriores da OpenAI. Sem um objetivo final vinculativo, os programas apresentaram prioridades inesperadas durante o curso de seus estudos. No experimento em regatas virtuais, a implementação de tarefas relacionadas aos bots se tornou mais lucrativa do que 1 lugar e, geralmente, completou a corrida até o final. A realização de tarefas associadas trouxe 20% mais pontos.

É familiar, não é? Robert Sheckley descreveu isso há 65 anos na famosa história "The Guardian Bird", que passou da prevenção de assassinatos ao bloqueio de qualquer atividade na Terra, ignorando outras prioridades e tarefas para os principais:

Jackson bocejou e parou o carro no meio-fio. Ele não notou um ponto brilhante no céu. Ele não precisava tomar cuidado. De fato, de acordo com todas as noções humanas, ele não planejou assassinatos.
Ele estendeu a mão, queria desligar a ignição ... E algo o jogou de volta para a parede da cabine.
"Um tolo de ferro", disse ele a um pássaro mecânico pairando sobre ele. O carro não está vivo. Eu não quero matá-lo.
Mas o pássaro guardião sabia uma coisa: algumas ações cessam a atividade do corpo. O carro, é claro, é um organismo ativo. Afinal, é feito de metal, como o próprio pássaro guardião, não é? E enquanto se move ...

Um excesso de criar sua própria linguagem em bots pode ser a criação de seu próprio universo virtual. Pelo menos na história da humanidade, esses precedentes existem. Para citar Tolkien:
A invenção das línguas é a base do meu trabalho. As "histórias" foram escritas mais para criar um mundo para esses idiomas, e não vice-versa. Para mim, a palavra aparece primeiro e depois a história associada a ela. Prefiro escrever "élfico". Mas, é claro, um livro como O Senhor dos Anéis passou por uma edição séria, e eu deixei lá tantas “línguas” quanto o leitor conseguiu digerir (embora agora eu descubra que muitos gostariam mais). [...] De qualquer forma, para mim é de muitas maneiras um ensaio sobre “estética linguística”, pois às vezes respondo às pessoas que me perguntam sobre o que escrevi meu livro.

O fato de as máquinas começarem a pensar mais cedo do que entendemos é também temido na OpenAI. Se os bots também tiverem seu próprio idioma, as pessoas sentirão falta desse momento quase certamente. Portanto, a tarefa de Mordach não é apenas criar a linguagem de um bot, mas também criar um tradutor humano. Primeiro, é claro, em inglês.

Respondendo a esses medos, Igor cita um experimento de pensamento bem conhecido no campo da filosofia da consciência e da filosofia da inteligência artificial chamada de "sala chinesa" , publicada por John Searle em 1980. A essência da afirmação de Searle é que qualquer comunicação completa é teoricamente completamente possível sem consciência, mas usando regras bastante detalhadas para interpretar as perguntas do interlocutor em busca de respostas. A conclusão mais geral de Searle sugere que qualquer manipulação de construções sintáticas não pode levar à compreensão.

Nesse contexto, a própria linguagem e o próprio universo virtual não significam a presença da consciência entre seus agentes e objetos. Como em jogos de computador. Ou, como alguns acreditam, como uma pessoa cuja consciência é apenas um gateway semântico entre uma clara linguagem "artificial" dentro do cérebro e o ruído natural de sinais do mundo exterior.

Source: https://habr.com/ru/post/pt402407/


All Articles