Sobre as barreiras ao uso de sistemas de sinais na inteligência artificial

Por que precisamos de sistemas de sinalização


O sistema de signos atua como portador de pensamentos, idéias, emoções, experiências, sensações, organização da memória - os produtos dos processos mentais, procedendo, de acordo com as idéias da ciência moderna, no cérebro humano e nos animais superiores. Um sistema de sinalização é um meio de indicar esses produtos. Parece que, no momento, a única maneira de transmitir informações sobre os resultados do pensamento, memória, emoções, sensações e imaginação é codificar essas informações usando um sistema de sinais. Não podemos (ainda?) Trocar diretamente pensamentos, emoções, sensações sem recorrer a um ou outro sistema de signos. Precisamos de sistemas de sinalização para compartilhar os resultados de tais processos. Os sistemas de signos são companheiros dos processos indicados e, talvez, haja um feedback no qual os processos mentais evoluam sob a influência dos sistemas de signos e se desenvolvam juntos.

Aparentemente, um pensamento nunca pode ser expresso com precisão e sem ambiguidade apenas por meio de um sistema de signos, isto é, codificação é uma aproximação, um determinado modelo. Sempre há a oportunidade de esclarecer algo indicado por um sinal. Não é à toa que a expressão “palavras selecionadas” existe - uma tentativa de expressar um pensamento com a ajuda de sinais. A expressão absolutamente precisa e inequívoca do pensamento através das palavras, muito provavelmente, não existe. Para expressar pensamentos, idéias científicas, um cientista escreve não uma palavra ou sentença, mas toda uma série de artigos, cada um dos quais descreve cada vez mais com precisão o que ele queria descrever, expresso em seu trabalho. A resposta para a pergunta é se o sinal do pensamento, a emoção é idêntico, bastante negativo.

Por exemplo, considere a sensação de vermelho. Se os agentes de comunicação souberem o que é a cor vermelha, tiverem uma experiência sensorial apropriada, poderão usar qualquer sistema de sinal adequado para transmitir informações sobre essa experiência sensorial: diga a palavra "vermelho" ou desenhe um círculo vermelho em um pedaço de papel e mostre esse sinal um ao outro. Se não houver essa experiência, é impossível transmitir informações sobre “vermelhidão” - é impossível falar sobre vermelho para alguém que não sabe o que é vermelho. Você pode tentar explicar que a cor vermelha é ondas eletromagnéticas com um comprimento de onda de cerca de 700 nanômetros, mas a sensação de "vermelhidão" de tais informações não aparecerá, o conhecimento de qual é a cor vermelha continuará indisponível, porque não trocamos experiência sensorial diretamente - trocamos sinais indicando, inclusive, desencadeando uma experiência sensorial semelhante com outros agentes de comunicação. I.e. o sinal é um "invólucro" do produto do processo mental, mas não o produto em si.

Barreira da compreensão


Daí o problema da barreira da compreensão. As modernas tecnologias de IA resolvem com êxito problemas relacionados ao estudo de sistemas de sinais. Os sucessos da IA ​​no reconhecimento de padrões (sinais) são óbvios: fala escrita (OCR), fala oral (Alice, Siri), música (Shazam), imagens; na modelagem de linguagens naturais: a alocação de partes do discurso, membros da sentença e nomes próprios, tradução automática. Ao mesmo tempo, todos esses são exemplos de estudo e trabalho com sistemas de sinais, nada mais. Em geral, no estudo dos sistemas de signos, a humanidade está em constante evolução. O surgimento e desenvolvimento da escrita, ciência, cultura, arte, esportes - tudo isso está intimamente relacionado à invenção, uso, estudo e desenvolvimento de sistemas de signos.

As capacidades de computação que usam operações com sinais também estão aumentando - começando com o ábaco babilônico, inventado em 3000 aC, e Pascalina Blaise Pascal com o aritmômetro Leibniz no século XVII, para a moderna tecnologia de computação. E se o progresso é óbvio no estudo e no trabalho com sistemas de sinais, dificuldades intransponíveis ainda são observadas na modelagem de processos mentais.

Nos seres humanos (animais?), O sinal é automaticamente vinculado ao produto do pensamento, da emoção etc., porque é evolucionário e projetado para codificar o último. A AI não possui esses produtos, portanto, caracteres reconhecidos não estão vinculados a nada, não codificam nada, mas permanecem como se por si só, permanecem simplesmente caracteres "vazios" sem indicar absolutamente nada, ou seja, não carrega carga significativa ou sentida; não há entendimento do sinal reconhecido. Portanto, uma pessoa que experimentou medo sabe o que é e pode tentar denunciá-lo, ou seja, transmitir e armazenar informações sobre suas experiências sensoriais, usando qualquer sistema de sinais. Por exemplo, ele pode:

  • desenhe uma imagem na parede da caverna;
  • escrever um ensaio em linguagem natural;
  • compor um poema;
  • crie uma peça de música;
  • coloque um sinal no emoticon de bate-papo;
  • finalmente, não faça nada (sinal em branco).

A IA não sabe o que é medo, portanto, não pode corresponder a nenhum sinal com medo. E ele também não é capaz de sentir nenhum sinal reconhecido como medo. Um piloto automático controlado por IA, correndo em um obstáculo na estrada, não entende nada, não sente nada, não pensa, não fica chateado, não fica contente, não tem medo, não tem medo, não haverá reflexão. Assim, para a IA, qualquer sinal refere-se a um produto inexistente de processos mentais que não existem nele.

Barreira de reconhecimento


Outra barreira segue a partir disso - a barreira à qualidade do reconhecimento de caracteres. Qualidade é entendida como fidelidade, correção, precisão do reconhecimento de um sinal em relação ao padrão. A qualidade é limitada por uma barreira à compreensão. A IA não pode avaliar a qualidade da imagem reconhecida, porque não há feedback do pensamento e de outros processos mentais para corrigir erros de reconhecimento. Na frase "ama yla amu", uma pessoa que fala russo provavelmente poderá restaurar palavras-sinal distorcidas.

Por exemplo, tal restauração de significado é possível: “mãe lavou a moldura”, porque a sequência desses caracteres codifica um provérbio cômico familiar, codificado por um conjunto de exatamente essas palavras: "mãe lavou a moldura". Uma pessoa foi capaz de recuperar palavras de sinal reconhecidas incorretamente: "ama" -> "mãe", "yla" -> "sabão", "amu" -> "moldura". Para AI, todas as três palavras em uma frase estão ausentes no dicionário do idioma russo. Pensar, “ajustar-se” a qualquer significado compreensível e bem conhecido não é, porque na memória da IA, de fato, não há significados armazenados. Ao mesmo tempo, se uma pessoa não tiver pensamentos familiares codificados por palavras semelhantes, as palavras "ama yla amu" não serão vinculadas a nenhum pensamento, simplesmente porque elas não existem, ou seja, processos de pensamento e codificação estão interconectados e trabalham constantemente em conjunto. Parece que isso é determinado evolutivamente - qualquer sinal encontrado deve ser decodificado, "estragado", "ajustado a" algum significado conhecido, ou seja, Existe uma necessidade automática de entender um sinal, reconhecê-lo, vinculá-lo a algo familiar e compreensível. É necessário entender que benefício e que dano é causado pelo que foi codificado por esse sinal. Um homem sorri para mim - bem, um cachorro late para mim - mal. Se você não sabe o que é bom e o que é ruim, nem sorrir nem latir faz sentido. A IA não sabe o que é bom e o que é ruim para ele.

Em uma tentativa malsucedida de corresponder o sinal ao significado, uma pessoa pode ter outras idéias sobre esta proposta, que pode expressar, por exemplo, com estas palavras: "Eu não entendo o que é, vamos melhorar a partir daqui", "o que poderia significar, interessante? "," que tipo de lixo está escrito aqui? "," talvez fosse para "mãe lavou a moldura", não tenho certeza, mas é melhor responder a essa pergunta do teste ", etc. I.e. de qualquer forma, algum tipo de conclusão sobre os sinais percebidos será feito. Uma opção de rastreamento falso também é possível. Por exemplo, se a fonte do texto for uma ferramenta eletrônica, onde as regras de ortografia geralmente são negligenciadas, as palavras "ama" e "amu" podem ser escritas no original com uma letra maiúscula - "Ama" e "Amu", ou seja, ser nomes próprios. Entender esse conjunto de caracteres não seria mais conectado ao provérbio "mãe lavou a moldura". Pode-se fantasiar e propor esta versão da reflexão - “Ama era Amu” - uma certa Ama, uma mulher, era representante de uma certa tribo Amu. A partir daqui, pode surgir o seguinte pensamento: Ama é um nome de uma língua estrangeira, porque meu conhecimento me diz que na língua russa não há nome para Ama, e eu não ouvi falar da tribo Amu. Assim, o processo de pensamento gira cada vez mais até chegar a uma conclusão. Por si só, a correção ou falsidade da conclusão não é importante, o principal é que a conclusão seja feita. A conclusão pode ser verdadeira e falsa, uma pessoa pode estar certa ou errada em suas suposições. I.e. sinais incorretos, imprecisos, errôneos e falsos podem levar a conclusões falsas. Isso se baseia em jogos divertidos e intelectuais, quando, com base em informações incompletas ou contraditórias, propõe-se restaurar o significado original. Acabamos de jogar esse jogo acima - o que estava previsto na mensagem "ama yla amu": "mãe lavou a moldura" ou "Ama was Amu"?

Veja também jogo de telefone mimado. O reconhecimento de imagem também está aqui - o efeito "parecia, imaginado". O reconhecimento de som também está aqui - o efeito foi "ouvido". Um bom exemplo de artefato auditivo é o reconhecimento de palavras em idiomas tonais, como o chinês. A palavra “shi”, quando pronunciada em um tom ascendente (denotado por shi2), significa o número “dez” e, em um tom descendente (denotado por shi4), o verbo-conectivo “be”. O pronome "I" em chinês é pronunciado "wo" em um tom descendente-ascendente (indicado por wo3). Então a frase "wo3 shi4 ..." para uma pessoa que fala chinês, pode indicar o início da frase "eu sou ...", "eu sou ..." ou simplesmente "eu ...". Ao mesmo tempo, a frase “wo3 shi2 ...” parece sem sentido, porque leva a uma trilha falsa - o ouvinte constrói o pensamento "tenho dez ...", o que é inútil de acordo com a gramática da língua chinesa. Mas, como o pensamento está tentando dar sentido aos sinais, ele tentará comparar as interpretações mais possíveis de "wo3 shi2 ..." - "Tenho dez ..." para obter o resultado esperado. Por exemplo, o interlocutor pode pensar em si mesmo ou perguntar novamente: "você provavelmente queria dizer wo3 shi4 em vez de wo3 shi2?"

I.e. será feita uma tentativa de restaurar sinais distorcidos, a fim de obter, no final, algum significado adequado do ponto de vista do ouvinte. A IA é incapaz disso, porque ele não tem ponto de vista. Os produtos de outros órgãos sensoriais têm artefatos de reconhecimento semelhantes.

Mais uma vez, na IA, os personagens não podem ser vinculados a nada, daí as barreiras à compreensão e à qualidade do reconhecimento dos personagens. Para a IA, um elefante em um apartamento comum da cidade, que acabou lá por algum motivo, devido à operação do algoritmo de reconhecimento de imagem, é uma situação normal. Para uma pessoa - um absurdo, porque o senso comum nos diz que, mesmo que um elefante, mesmo que fosse um bebê elefante, pudesse caber no apartamento, não está claro como ele chegou lá - a porta do apartamento é muito estreita para ele entrar, a capacidade de elevação do elevador não corresponde à massa do elefante e a outras restrições do mundo real. Conseqüentemente, o elefante na sala da figura é uma ilustração para um conto de fadas, uma montagem de fotos ou, em geral, um erro de reconhecimento de padrões, ou seja, Pareceu-me que a imagem mostra um elefante - uma conclusão é tirada. A IA não possui um pensamento tão crítico, não consegue entender o significado transmitido por esses sinais que poderia reconhecer, não pode corrigir o erro de reconhecimento, não pode tirar conclusões.

O estudo dos sistemas de sinais - um beco sem saída?


O estudo dos sistemas de sinais não permite o estudo do pensamento e de outros processos mentais que ocorrem diretamente no cérebro. Isso significa que estudar sistemas de signos é inútil? Não, não é. Os sistemas de signos são um meio de codificar e transmitir nossos pensamentos; portanto, na verdade, não temos escolha a não ser estudar o primeiro. Simplesmente não há outras maneiras nas humanidades - linguística, psicologia, sociologia e outras relacionadas.

O único trabalho que podemos fazer para aprender a entender melhor nossos pensamentos é estudar os sistemas de sinais. O estudo dos sistemas de signos não responde às questões da estrutura e propriedades do pensamento - essas questões permanecem em aberto até o momento. Os signos são indicadores de pensamentos, talvez até gatilhos de pensamentos, mas não os pensamentos em si, o que significa que estudamos apenas indicadores de entidades, mas não as próprias entidades. Estudando sistemas de sinais, estudamos as propriedades de sistemas de sinais, mas não as propriedades daquelas entidades para as quais esses sistemas de sinais são usados ​​para codificar.

Por exemplo, estudando o vocabulário e a sintaxe do idioma russo, estudamos o sistema de sinais do idioma russo, mas não os pensamentos em si, que são expressos usando o idioma russo. Admitimos que agora nem está claro qual é a estrutura, quais são as propriedades dos pensamentos e não os sinais. A única coisa óbvia é que o pensamento pode ser expresso com um certo grau de precisão, aproximação com a ajuda de qualquer sistema de signos. Por exemplo, um pensamento expresso em russo com as palavras "tristeza" e "triste" pode ser expresso com a ajuda de tais sistemas de sinais:

  • Língua russa: frases "estou triste", "estão tristes", etc;
  • Inglês: a frase "me sinto triste", "eles parecem tristes", etc;
  • uma obra de arte na qual os tons frios prevalecerão;
  • uma peça musical onde as teclas menores prevalecerão;
  • Dança “triste” com movimentos suaves “tristes”;
  • uma fotografia do rosto triste de uma pessoa ou animal;
  • smiley :-( na cultura moderna da comunicação eletrônica.

A precisão da transmissão desse pensamento pelos sistemas de sinais acima é diferente. A capacidade dos sistemas de signos de transmitir pensamentos corresponde às necessidades da transferência de pensamentos da melhor maneira possível, levando em consideração as capacidades de um organismo vivo: órgãos sensoriais, coloração, meios de transmitir danças, feromônios, etc. É por isso que nas linguagens naturais existem tantas ambiguidades, incertezas e redundância - tudo isso serve apenas a um propósito - codificar e transmitir com mais precisão pensamentos e emoções, etc., mesmo que isso exija a introdução de redundância e outras sub-ótimas em termos da quantidade de informações e tempo de transmissão. As pessoas refinam constantemente as informações recebidas, tentam ter certeza de que entendem corretamente os sinais reconhecidos, encontram o significado nelas: perguntam as frases, releiam os textos, ouvem a música, procuram novos significados nos personagens anteriormente reconhecidos.

O cara leu na Internet que a garota alisa os cabelos - o que significa que ela gostava dele. Isso é estúpido? Talvez, mas essa seja a nossa natureza - comparar sinais com significados. Pensar, buscar soluções, sentir, reconhecer sinais e corresponder aos seus significados, estabelecer metas - os processos vivos - mentais não param ao longo da vida. A IA não se importa com as informações de entrada e saída, porque não há nada com o que comparar, nada a que vincular.

Os sistemas de signos são imperfeitos, mas são a única coisa que a evolução nos deu para a troca de produtos de processos psíquicos. Quem sabe, talvez a natureza já tenha tentado outros modos de transmissão, mas eles não tiveram sucesso e, no final, foram os sistemas de signos que se enraizaram.

Source: https://habr.com/ru/post/pt432508/


All Articles