A solução para o problema de entender o contexto da inteligência artificial. Parte 1



Compreender a linguagem natural é uma tarefa completa da IA . Um aspecto desse entendimento é entender o contexto. Neste artigo, explicarei quais tipos de contexto nossa mente deixa de lado, como funciona com um tipo de contexto e como recriamos esse processo em nossa tecnologia de inteligência artificial.

O troféu não cabe na mala marrom porque é muito [pequeno / grande].
O que é muito [pequeno / grande]?
Respostas: A mala / o troféu.
O desafio do esquema de Winograd

O artigo anterior descreveu nossa abordagem ao desenvolvimento da IA ​​e o que já fizemos até agora. Deixe-me lembrá-lo de que criamos a IA copiando diretamente as estruturas e processos da psique humana.

Dois tipos de contexto


A partir dos comentários do artigo anterior, vimos que o termo “contexto” é usado para descrever situações muito diferentes. Consideramos esse termo, dividindo-o em dois tipos.

O primeiro tipo de contexto é quando se trata de entender os conceitos expressos nesta frase. São situações de escolher um dos significados dos homônimos, escolher um sinônimo, escolher uma das nuances do significado, etc. Por exemplo: “Os olhos dela estavam lacrimejantes quando ela cortava cebolas para uma salada” e “O tiro com arco moderno é dividido em várias direções”. Uma pessoa "on the fly" entende quando se trata de cebolas, plantas e quando se trata de cebolas - uma variedade de armas.

O segundo tipo de contexto é quando, para entender, é necessário destacar uma determinada categoria, geralmente não representada no próprio texto ou não particularmente destacada. É essa categoria que nos permite formular uma certa “ideia”, generalizando a expressão do que está sendo dito.

Por exemplo, se no livro de Lev Tolstoy você se deparar com a frase "Ele imprimiu uma carta ...", para entender corretamente o texto, use a categoria "século 19" e concluir que não se trata de uma impressora. Esse tipo de contexto implica que, para entender e interpretar o texto, não apenas o texto inteiro, mas também os dados associados a ele possam ser analisados.

A resolução de problemas associados a diferentes tipos de contextos é atendida por processos mentais completamente diferentes. Repetimos a mesma divisão em nosso desenvolvimento de IA. Na solução dos problemas do primeiro tipo, um método é usado com base nos recursos de armazenamento de conhecimento. Na solução de problemas do segundo tipo, um algoritmo mais complexo, baseado na experiência, é implementado (no caso da inteligência artificial, estamos falando de algoritmos que compensam a falta de experiência humana real no sistema) e sugerindo uma quantidade maior de computação.

A psique humana geralmente tenta primeiro aplicar o primeiro método, porque requer muito menos recursos de computação. Se a solução não parece adequada, a psique usa a segunda. Além disso, quanto maior a inteligência, mais frequentemente o segundo método é usado e maior o número de contextos possíveis levados em consideração. As crianças, devido à complexidade e intensidade dos recursos do segundo método, assim como os adultos que não estão acostumados ao trabalho mental, preferem o primeiro.

Vamos descrever como nossa tecnologia de IA funciona com o primeiro tipo de contexto. Como trabalhamos com o segundo, mais complexo, será descrito no próximo artigo.

Mais longa é aquela trança que tem menos laços


Para ilustrar, tomemos uma situação de diálogo:

"Estou andando pela avenida e vi uma foice. Gostaria de saber qual trança é a mais longa?

Uma solução criada em redes neurais, devido às limitações impostas pelo próprio método, provavelmente não será capaz de responder adequadamente. Mesmo que muitos textos sejam carregados na Assembléia Nacional para procurar uma resposta, então, com base na probabilidade, a figura "5,6 metros" soará.

Deixe-me lembrá-lo de que desenvolvemos nossa tecnologia de IA copiando sequencialmente a psique e seus processos. A rede semântica que usamos para armazenar conhecimento reflete as peculiaridades do armazenamento humano e do processamento de informações. Portanto, dentro da estrutura de nossa abordagem, o problema é resolvido de maneira bastante simples.

Em uma solução correspondente aos sete anos de idade, o algoritmo acessa a rede semântica e encontra o vértice localizado no nó ao qual pertencem as palavras ouvidas anteriormente. No exemplo acima, é necessário escolher um dos homônimos corretamente: uma trança (penteado) e uma trança (faixa de terra conectada à costa) trança (ferramenta). Para isso, analisa-se qual nó da rede semântica foi discutido anteriormente. I.e. O procedimento mais simples para calcular a distância mínima aos conceitos usados ​​no texto anterior é realizado. Em nossa rede, a distância é uma função do número de conexões (em proporção direta) e sua probabilidade (inversamente).

A distância da “trança (faixa de terra)” ao “aterro” será duas ordens de grandeza menor do que da “trança (penteado)” a qualquer um desses conceitos. A IA dará a resposta "110 km".

Note-se que esse problema também é resolvido da segunda maneira, com a separação da categoria, por exemplo, "o rio Volga, próximo ao qual nosso interlocutor".

Movers vêem as malas de maneira diferente


Vejamos um exemplo do esquema Vinohrad no início do artigo:

“O troféu não cabe na mala marrom porque é muito pequena. O que é pequeno demais? "

A conexão entre "não cabe" e a combinação de "muito pequeno" - "mala" é uma ordem de magnitude mais provável do que entre "não cabe" e "muito pequeno" - "troféu". AI dará a resposta "mala".

A presença de uma alta probabilidade de tal relacionamento, que assume uma ordem de magnitude menor na cadeia "não se encaixa" - "muito pequena" - "mala", é devida à experiência humana. Como a maioria das pessoas, muitas vezes me deparei com uma situação em que algo não se encaixa em uma mala, pois é muito pequena. Portanto, eu tenho essa conexão. As mesmas conexões são formadas no processo de aprendizagem da IA ​​(descreveremos mais detalhadamente sobre a formação de vários tipos de conexões na psique em um dos seguintes artigos sobre nossa rede semântica).

"O troféu não cabe na mala marrom porque é muito grande. O que é muito grande? "

A conexão entre "não cabe" e a combinação de "muito grande" - "troféu" é muito mais provável do que entre "não cabe" e "muito grande" - "mala". AI dará a resposta "troféu".

Observo um recurso - nos movedores, que geralmente encontram uma situação em que é necessário colocar uma mala muito grande, a psique usa o segundo método para entender o contexto. Porque para eles, o link “muito grande” - “mala” é mais relevante. Ao mesmo tempo, outro sistema funciona para turistas - junto com o aumento da experiência de situações em que é difícil colocar uma mala em algum lugar, aumenta a impossibilidade de construção “você não pode colocar algo na mala porque a mala é muito grande”.

Para uma solução correspondente a 12 anos de idade, a fórmula é um pouco mais complicada. Além disso, a abordagem formada por essa idade também é implementada em um adulto - após 12 anos, essa parte da rede de algoritmos não se torna mais complicada.

De fato, a facilidade de decisão é determinada pelas especificidades de nossa viagem. Todas as situações relacionadas à comunicação, todas as linguísticas, são formadas com a participação das estruturas da psique humana. Na verdade, todas as especificidades no campo da linguagem são determinadas por essas estruturas. É verdade que há um processo inverso, quando a linguagem determina a estrutura. Há concussão mútua. Não é de surpreender que, com a ajuda dessas estruturas (mentais), os problemas que surjam sejam resolvidos da maneira mais fácil. A porca deve ser desaparafusada com uma chave inglesa, elas são criadas uma para a outra. Nem uma colher.

Observo que, além de grandes vantagens, nossa abordagem para o desenvolvimento da IA ​​apresenta algumas dificuldades. A arquitetura computacional não corresponde à base fisiológica e periodicamente resolvemos problemas técnicos para a exibição qualitativa dos processos e estruturas da psique em formato digital. Além disso, devido às suposições e ajustes existentes, alguns dos recursos são gastos para garantir a identidade da rede semântica e dos algoritmos de IA para as estruturas e algoritmos da psique real.

O próximo artigo será sobre o segundo tipo de contexto e, infelizmente, será muito mais pesado. Não podemos ficar sem imersão profunda em processos psicológicos ao descrever algoritmos para trabalhar com o segundo tipo de contexto em nossa tecnologia.

Source: https://habr.com/ru/post/pt399111/


All Articles