
Qual é a principal dificuldade em formalizar uma linguagem natural? O fato é que estamos acostumados a formalizá-lo com a ajuda da linguagem, o que leva ao mal infinito. A linguagem é em si um meio de formalização, que a humanidade tem usado há muito tempo e sem sucesso.
Tomamos a primeira definição que aparece:
Movimento independente do vôo de um objeto em um meio gasoso ou vácuo.Tem seis termos, que por sua vez requerem definição:
- independente
- comovente
- objeto
- gasoso
- Quarta-feira
- o vácuo.
Cada um dos termos possui suas próprias definições, através das quais obtemos novas definições que exigem uma nova definição etc. No final, verifica-se que todos os termos usados recebem as definições anteriores, ou seja, temos um ciclo. O que não é o assunto dos nossos sonhos, é claro. Uma das transações precisa ser interrompida, mas ... Quando parar? o que escolher para o critério de parada? - estas são as malditas perguntas.
Lembre-se do motivo pelo qual geralmente precisamos de um idioma. Refletir corretamente a realidade que nos cerca no processo de comunicação. A realidade circundante, a propósito, consiste em objetos físicos. Não somos capazes de perceber mais nada: objetos físicos - é isso que é inicialmente percebido pelo homem.
A partir disso, podemos concluir que a interrupção no processo de emissão de definições é necessária em termos que denotam objetos físicos. O princípio é este: o que vemos, informamos sobre isso.
Uma armadilha lógica está à espera aqui: para entender o que estamos tentando comunicar, é necessário definir o termo.
Suponha que alguém, apontando um dedo, exclama espantado:
- Lebre!Uma “lebre” requer conhecimento ou definição do sujeito - nos encontramos na mesma posição não-viável. Mas a posição não-viável desaparecerá se você pegar algo elementar - por exemplo, grite:
Algo branco!O que é branco? Não é um objeto, é claro, mas sua característica é a cor. Um termo que não requer uma definição: branco é branco. O número de cores disponíveis para o olho humano é limitado - portanto, o número de termos que não requerem definição também é limitado.
Acredita-se que uma pessoa tenha cinco sentidos (às vezes chamados de mais, mas isso não é importante):
- visão
- tocar
- sentido do olfato
- audição
- de bom gosto.
O resultado do funcionamento de cada um dos órgãos é uma certa sensação, cujos valores não requerem definições, pois correspondem aos elementos indetectáveis da realidade circundante.
A questão é: que elementos da realidade circundante podem ser caracterizados como um conjunto simples de cinco sensações? Objetos elementares! A idéia é decompor um objeto complexo - da mesma "lebre" em componentes elementares, cada um dos quais é caracterizado por sensações. Recolocando os componentes, obtemos a “lebre” na coleção: um objeto que possui uma definição verbal formal e, mais importante, concluída.
Vamos ver como isso é possível.
Aqui está um objeto físico. Observe que para observar (mais precisamente, sentir, porque um objeto pode ser percebido não apenas visualmente, mas também com a ajuda de outros sentidos), um objeto exclusivamente específico, ou seja, um objeto individualizado está disponível. Quando vejo uma lebre, esta é uma lebre muito específica - esta, e nenhuma lebre.
Por via de regra, a individualização de um objeto ocorre por meio de sua nomeação, mas, como no caso de uma lebre, está longe de ser sempre (apenas se houver necessidade). Assim, dependendo da situação, o termo "lebre" pode significar:
- uma lebre em particular
- nome da classe à qual qualquer lebre pertence.
Essas nuances devem ser distinguidas - suponha que, por meio de abreviações de “individ” (para designação, recebemos a primeira letra) e “classe” (para designação, recebemos a última letra, porque “c” entre colchetes está associado ao símbolo de direitos autorais):
Lebre (i).Análogo textual: lebre - nome pessoal;
Lebre (s).Análogo textual: lebre - o nome da classe;
Se uma lebre tivesse um nome único, isso se tornaria mais óbvio:
Stepashka (i)."Stepashka" não pode ser o nome de uma classe, mas requer uma indicação de pertencer a uma classe específica. Você chama alguém assim ?! Temos que indicar pertencer à classe. Usamos o símbolo "∈" para isso:
Stepashka (i) re lebre (s).Agora está determinado que Stepashka é uma das lebres, mas não está determinado o que são as lebres. Como mencionado anteriormente, a "lebre" deve ser decomposta em suas partes componentes, cada uma das quais deve receber características que correspondam às sensações percebidas pela pessoa.
Isso é muito difícil, principalmente devido à tridimensionalidade das partes componentes do objeto, portanto, isso só pode ser feito condicionalmente. Mas, em princípio, pode.
Suponha que uma lebre seja composta por uma cabeça, tronco, pernas e cauda e que os objetos listados sejam elementares (na verdade não, é claro). Então, usando o símbolo "⊂" para denotar a ocorrência de um componente em um todo material, obtemos:
cabeça (s) && tronco (s) && 4 * pata (s) && cauda (s) ⊂ lebre (s).Análogo textual: cabeça e tronco e 4 pernas e cauda formam uma lebre.
Como os objetos devem ser elementares, para eles, você pode especificar as características de cada uma das sensações. Devido ao efeito combinado das sensações sobre uma pessoa, podem ser necessárias definições no espaço e no tempo.
Temos um conjunto aproximado de características:
• cor
• formulário
Cheiro
Gosto
• superfície (resultado do toque),
Som
• localização (coordenada espacial),
• movimento (como a diferença entre dois locais),
• ponto no tempo
• duração (como a diferença entre dois pontos no tempo),
• velocidade (como quociente entre movimento e duração).
O conjunto, como eu disse, é aproximado: apenas as características correspondentes às sensações são incondicionais, o restante é discutido. Por exemplo, é claro que uma pessoa não percebe o tempo como tal: ele pode ser determinado pelos símbolos no dispositivo ou pela posição do sol no céu, mas não diretamente pela sensação. Da mesma forma, o local não está definido absolutamente, mas em relação a outros objetos.
Agora vou tentar caracterizar a "cabeça":
- forma: redondo
- superfície: dura.
Outras características não estão definidas.
Ou seja, a cabeça, se a considerarmos condicionalmente como um objeto elementar, é algo redondo e sólido. Condicionalmente, é claro, exclusivamente condicionalmente. Afinal, a linguagem como meio de formalização fornece resultados aproximados: como, por exemplo, descrever verbalmente um ponto de forma geométrica complexa? De jeito nenhum: você simplesmente não pode descrever. Portanto, no exemplo condicional, a cabeça é aproximadamente redonda e aproximadamente sólida - e um ponto nisso.
Se você concordar, escreveremos entre colchetes:
cabeça (s) {formato: redondo; superfície: dura}.Ou seja, o objeto especificado possui as características especificadas.
Obviamente, é claro, as cabeças podem ser não apenas redondas, mas também diferentes: por exemplo, Vovochka, de uma anedota barbada do período soviético, tem uma cabeça quadrada. Nada nos impede de introduzir operandos lógicos em nosso sistema de notação, em particular o operando "ou":
cabeça (s) {forma: quadrado redondo II; superfície: dura}.Mas a cabeça da lebre é redonda, não quadrada, como a de Vova! Bem, para o inferno com os dois, apresentamos a implicação:
cabeça (s) {formato: redondo} se cabeça (s) re lebre (s).Em vez de uma lebre, foi possível indicar uma lebre específica Stepashka, definindo assim suas características individuais:
cabeça (s) {formato: redondo} se cabeça (s) ⊂ Stepashka (i).
Os termos usados nas características (“redondo”, “quadrado”, “sólido” etc.) são indetectáveis: nós os sentimos diretamente, portanto, nenhuma definição verbal é necessária.
Vou designar esse tipo de palavras com o símbolo "a" - de "atributo", assim:
rodada (a).Chamo a atenção para o fato de que objetos e classes individuais são substantivos (são entidades!), Enquanto características são adjetivos (por isso são características!). Do ponto de vista da correspondência de tipos para partes do discurso, tudo é completamente legal.
O adjetivo “round” é uma característica indetectável, mas, por exemplo, o adjetivo “lebre”, que não corresponde a nenhuma das sensações que uma pessoa possui, não se encaixa no atributo.
Obviamente, a definição de "lebre" deve ser através da "lebre", que eu já fiz (decompondo a "lebre" em suas partes componentes). Ou seja, o termo "lebre" apareceu pela primeira vez e, a partir daí, o adjetivo "lebre" foi formado, significando: relacionado a uma lebre, semelhante a uma lebre.
Temos um novo tipo, indicado pelo símbolo "d" - de "dependência". As indicações de tipo não são, obviamente, suficientes - é necessária uma referência ao termo pai. Introduzimos uma nova designação, usando o símbolo "=>" para indicar o relacionamento:
lebre (d) => lebre (s).Agora, o termo "lebre" é definido - através do substantivo pai "lebre".
Definimos o adjetivo dependente através do substantivo pai. Acontece o contrário: quando um substantivo dependente é formado a partir do adjetivo parental. Por exemplo, "quadrado" é um adjetivo que denota a forma de um objeto. À luz do exposto, fica claro que o "quadrado" veio do "quadrado", mas não o "quadrado" do "quadrado".
quadrado (d) => quadrado (a).Assim, em cada grupo de termos cognatos existe um termo pai do qual todos os outros se originam.
Agora eu consegui derivar todos os termos do original indetectável? Ainda não - resta um grupo terminológico significativo, ainda não coberto: os conceitos que podem ser deduzidos por meio de fórmulas.
Pegue um verbo - por exemplo, "mover": ainda não encontramos verbos. O que é uma "mudança"? Não uso uma definição acadêmica, mas que, do meu ponto de vista, reflita a essência do assunto:
"Mover" é quando um objeto altera sua localização sob a influência de outro objeto.A fórmula é a seguinte:
X (i) 1 # movimento (f) X (i) 3 {movimento: diferente de zero (a)}.Corro para dar as explicações necessárias.
A fórmula consiste em três partes que denotam sujeito, ação e objeto:
- X (i) 1 é o assunto. "X" refere-se a qualquer entidade individual, sob o número de série 1.
- # movef é uma ação. "F" é uma fórmula, de "fórmula". Uma treliça indica uma palavra definível (neste exemplo, isso é supérfluo, mas pode ser necessária ao apontar para um assunto ou objeto específico).
- X (i) 3 é um objeto. O resto é idêntico ao assunto. Os colchetes indicam a característica que foi alterada como resultado do impacto do assunto.
As regras são flexíveis: novos conceitos são facilmente construídos de acordo com eles. A estrutura geral não preenchida é utilizada (sujeito - ação - objeto):
X (i) 1 X (f) 2 X (i) 3.Os elementos necessários são substituídos por termos específicos, as características são indicadas, o elemento que está sendo identificado é marcado com uma grade e, se necessário, operandos lógicos são usados.
Vamos praticar um pouco, por exemplo, com advérbios, que também podem ser expressos em termos de fórmula.
Vamos considerar o advérbio "com cuidado" - do meu ponto de vista, o pai no grupo de palavras cognatas ("cuidado", "cuidado", "cuidado", "proteção"). A palavra denota uma característica, mas não um objeto, mas uma ação. Vou te dar uma definição condicionalmente primitiva:
"Cuidado" é quando alguém move uma coisa devagar.As coisas são definidas, "devagar" - depende de "devagar", que é uma característica dos objetos em velocidade.
lento (d) => lento (a).E o termo "mover" já foi processado. Assim, há tudo o que é necessário para definir o termo "cuidadosamente":
X (i) 1 movimento (f) {# com cuidado (f)} X (i) 3 {velocidade: lento (a)}.Aqui, "cuidadosamente" é definido através de "movimento" e "lentamente" e, como qualquer outro dialeto, refere-se à ação.
De acordo com essas regras, é possível determinar novos conceitos de fórmula a partir de conceitos previamente obtidos e assim por diante, incluindo o uso de implicações e possivelmente outros métodos lógicos. Quanto mais complexo o conceito abstrato, mais complexa e mais profunda é a estrutura da fórmula resultante. Podemos obter uma definição formal de qualquer termo, e o quanto ele está correto depende de nós.
Naturalmente, a linguagem proposta pode ser expandida - mais do que possibilidades suficientes. Por exemplo, a notação de sinônimos implora:
hipopótamo (s) = hipopótamo (s).Não fala sobre outras partes do discurso: aquelas que são usadas para colorir emocionalmente sentenças (interjeições) ou várias necessidades técnicas (sindicatos).
Sim, você nunca sabe o que mais! No entanto, a direção do pensamento é importante, enquanto a sintaxe dessa linguagem é uma questão puramente secundária e aplicada.
Eu resumo.
Temos os seguintes tipos de palavras:
- i - objetos individuais: determinados por pertencer à classe, são substantivos;
- c - classes: determinadas pela decomposição em componentes, ao nível das classes elementares. Classes elementares são definidas por características. Ambos são substantivos;
- a - características dos objetos e classes. Eles são adjetivos;
- d são termos dependentes. Formado a partir do termo pai. Pode ser qualquer parte do discurso;
- f - conceitos de fórmula. Eles são substantivos, verbos ou adjetivos.
E a seguinte sequência de formação de palavras:
- No nível inferior estão as características dos objetos elementares, e através deles - classes: vermelho, sólido, redondo, etc.
- A combinação de características originais permite atribuir um nome a um objeto elementar: por exemplo, todos os objetos redondos e vermelhos que crescem nas árvores podem ser chamados de maçãs. Como resultado, obtemos um termo adequado para designar uma classe (maçãs como um todo) e um objeto individual (é precisamente essa maçã).
- A presença de objetos individuais permite atribuir-lhes nomes exclusivos (Stepashka hare).
- Os termos iniciais são formados arbitrariamente, se necessário (esse animal poderia ser chamado de lebre ou coelho, nada teria mudado disso).
- Os dependentes são formados nos termos iniciais, como regra, que são outras partes do discurso.
- Com base nos termos que foram definidos, as fórmulas podem ser compiladas para definir os seguintes termos, com condições lógicas complexas.
Provavelmente, os leitores já têm uma pergunta, por que tudo isso é necessário?
Encontrei este problema esculpindo um chatbot. Os testadores que conseguimos atrair eram apenas algumas pessoas! - comportou-se, do meu ponto de vista, igualmente insano: fizeram perguntas, querendo obter respostas para elas. Ingênuo! Era como se eles não soubessem que, antes de fazer perguntas, você deve inserir informações no banco de dados. Mas, mesmo com a superação bem-sucedida desse obstáculo, tornou-se muito problemático, diante da invariância da fala humana, prever a forma da questão.
Não custa nada inserir texto no banco de dados:
"Os pássaros estão voando."Em seguida, a resposta para a pergunta pode ser obtida. É difícil esperar por uma resposta para uma pergunta mais complicada, que é essencialmente uma variação da primeira:
"Cacatua batendo asas?"Para fazer isso, você precisa conhecer os muitos relacionamentos entre as palavras, a saber:
- as cacatuas pertencem à classe dos pássaros;
- "Voar" e "voar" são palavras de raiz;
- você pode voar com as asas;
- asas estão acenando.
Os dois primeiros pontos podem, em princípio, ser baixados para o chatbot a partir de dicionários (embora, como eu estava convencido com uma tristeza inevitável em minha alma, você não encontre dicionários durante o dia com fogo). E perceber os dois últimos pontos simplesmente não está em lugar algum. Em nossas cabeças, as informações estão na forma prescrita pelo médico, mas você não pode tirá-las de lá. Enquanto dicionários com o conteúdo exigido estão ausentes por definição: o miserável, que ocasionalmente se depara, oferece formulações verbais, enquanto são exigidas formalidades estritas.
Por isso, fiz uma pergunta a mim mesmo: como formalizar a fala para que, com base em termos indefiníveis, dê definições aos outros, para que seja possível compilar um Dicionário completo de relações lexicais. Se for bem-sucedido, o chatbot será capaz de responder à pergunta se a cacatua bate as asas em voo.
Apontar o caminho é a única coisa possível para mim no estágio atual da vida. No entanto, não tenho certeza de que as considerações expressas aqui sejam completamente originais: tentativas de formalizar a fala durante o desenvolvimento da IA ocorreram e certamente mais de uma vez. No entanto, o truque da minha proposta não é apenas preencher a base com frases em linguagem natural ou artificial (o preenchimento significativo da base não se aplica ao tópico em discussão), mas definir quaisquer termos subsequentes a partir de um número limitado de conceitos indefinidos. Não sei nada sobre tentativas de implementar essa ideia.
Na verdade, é tudo.
[piada]
Não me diga, o Prêmio Nobel é emitido por cheque, transferência bancária ou dinheiro?
[piada]