
Quelle est la principale difficulté à formaliser un langage naturel? Le fait est que nous sommes habitués à le formaliser à l'aide du langage, ce qui conduit au mal infini. La langue est en soi un moyen de formalisation, que l'humanité a longtemps utilisé sans succès.
Nous prenons la première définition qui se présente:
Vol - mouvement indépendant d'un objet dans un milieu gazeux ou sous vide.Il comporte six termes, qui doivent à leur tour être définis:
- indépendant
- en mouvement
- objet
- gazeux
- Mercredi
- le vide.
Chacun des termes a ses propres définitions, grâce auxquelles nous obtenons de nouvelles définitions qui nécessitent une nouvelle définition, etc. En fin de compte, il s'avère que tous les termes utilisés reçoivent les définitions plus tôt, c'est-à-dire que nous avons un cycle. Ce qui n'est pas l'objet de nos rêves, bien sûr. L'une des transactions doit être arrêtée, mais ... Quand arrêter? que choisir pour le critère d'arrêt? - ce sont les maudites questions.
Rappelez-vous pourquoi nous avons généralement besoin d'une langue. Pour refléter correctement la réalité qui nous entoure dans le processus de communication. Soit dit en passant, la réalité environnante est constituée d'objets physiques. Nous ne pouvons rien percevoir d'autre: des objets physiques - c'est ce qui est initialement perçu par l'homme.
On peut en conclure que l'arrêt dans le processus d'émission de définitions est nécessaire en termes de dénomination d'objets physiques. Le principe est le suivant: ce que nous voyons, nous en informons.
Un piège logique nous attend également: pour comprendre ce que nous essayons de communiquer, il faut définir le terme.
Supposons que quelqu'un, pointant un doigt, s'exclame avec étonnement:
- Lièvre!Un «lièvre» nécessite une connaissance du sujet ou une définition - nous nous trouvons dans la même position peu enviable. Mais la position peu enviable disparaîtra si vous prenez quelque chose d'élémentaire - par exemple, criez:
- Quelque chose de blanc!Qu'est-ce que le blanc? Pas un objet, bien sûr, mais sa caractéristique est la couleur. Un terme qui ne nécessite pas de définition: blanc c'est blanc. Le nombre de couleurs disponibles pour l'œil humain est limité - en conséquence, le nombre de termes qui ne nécessitent pas de définition est également limité.
On pense qu'une personne a cinq sens (parfois appelés plus, mais ce n'est pas important):
- vision
- toucher
- l'odorat
- audition
- de bon goût.
Le résultat du fonctionnement de chacun des organes est une certaine sensation, dont les significations ne nécessitent pas de définitions, car elles correspondent aux éléments indétectables de la réalité environnante.
La question est de savoir quels éléments de la réalité environnante peuvent être caractérisés comme un simple ensemble de cinq sensations? Objets élémentaires! L'idée est de décomposer un objet complexe - du même "lièvre" en composants élémentaires, chacun étant caractérisé par des sensations. En remettant les composants, nous obtenons le «lièvre» dans la collection: un objet qui a une définition verbale formelle et, surtout, complète.
Voyons comment cela est possible.
Voici un objet physique. Veuillez noter que pour observer (plus précisément, pour sentir, car un objet peut être perçu non seulement visuellement, mais aussi à l'aide d'autres sens), seul un objet spécifique, c'est-à-dire un objet individualisé est disponible. Quand je vois un lièvre, c'est un lièvre très spécifique - celui-ci, pas n'importe lequel des lièvres.
En règle générale, l'individualisation d'un objet se fait par sa dénomination, mais, comme dans le cas d'un lièvre, il est loin d'être toujours (seulement s'il en a besoin). Ainsi, selon la situation, le terme «lièvre» peut signifier:
- un lièvre particulier
- nom de la classe à laquelle appartient tout lièvre.
Ces nuances doivent être distinguées - supposons qu'au moyen d'abréviations de «individu» (pour la désignation, nous prenons la première lettre) et «classe» (pour la désignation, nous prenons la dernière lettre, car «c» entre parenthèses est associé au signe du droit d'auteur):
Lièvre (i).Analogue textuel: lièvre - nom personnel;
Lièvre (s).Analogue textuel: lièvre - le nom de la classe;
Si un lièvre avait un nom unique, cela deviendrait plus évident:
Stepashka (i)."Stepashka" ne peut pas être le nom d'une classe, mais il nécessite une indication d'appartenance à une classe particulière. Appelez-vous quelqu'un ainsi?! Nous devons indiquer l'appartenance à la classe. Pour cela, nous utilisons le symbole "∈":
Stepashka (i) ∈ lièvre (s).Maintenant, il est déterminé que Stepashka est l'un des lièvres, mais il n'est pas déterminé ce que sont les lièvres. Comme mentionné précédemment, le "lièvre" doit être décomposé en ses composants, dont chacun doit avoir des caractéristiques qui correspondent aux perceptions de la personne.
Ceci est très difficile, principalement en raison de la tridimensionnalité des parties constitutives de l'objet, donc cela ne peut être fait que de manière conditionnelle. Mais en principe, c'est possible.
Supposons qu'un lièvre se compose d'une tête, d'un tronc, de pattes et d'une queue, et que les objets énumérés soient élémentaires (en fait pas, bien sûr). Ensuite, en utilisant le symbole "⊂" pour désigner l'occurrence d'un composant dans un tout matériel, on obtient:
tête (s) && torse (s) && 4 * patte (s) && queue (s) ⊂ lièvre (s).Analogue textuel: la tête et le torse et 4 pattes et la queue constituent un lièvre.
Puisque les objets sont censés être élémentaires, vous pouvez spécifier pour eux les caractéristiques de chacune des sensations. En raison de l'effet combiné des sensations sur une personne, des définitions dans l'espace et le temps peuvent être nécessaires.
Nous obtenons un ensemble approximatif de caractéristiques:
• couleur
• forme
• odeur
• goût
• surface (résultat du toucher),
• son
• emplacement (coordonnées spatiales),
• mouvement (comme la différence entre deux endroits),
• point dans le temps
• durée (comme la différence entre deux points dans le temps),
• vitesse (comme le quotient entre le mouvement et la durée).
L'ensemble, comme je l'ai dit, est approximatif: seules les caractéristiques correspondant aux sensations sont inconditionnelles, le reste est discuté. Par exemple, il est clair qu'une personne ne perçoit pas le temps comme tel: il peut être déterminé par les symboles sur le gadget ou par la position du soleil dans le ciel, mais pas directement par la sensation. De même, l'emplacement n'est pas défini de manière absolue, mais par rapport à d'autres objets.
Je vais maintenant essayer de caractériser la "tête":
- forme: ronde
- surface: dure.
D'autres caractéristiques ne sont pas définies.
Autrement dit, la tête, si nous la considérons conditionnellement comme un objet élémentaire, est quelque chose de rond et de solide. Conditionnellement, bien sûr, exclusivement conditionnellement. Après tout, le langage comme moyen de formalisation donne des résultats approximatifs: comment, par exemple, décrire verbalement un point de forme géométrique complexe? Pas du tout: vous ne pouvez tout simplement pas décrire. Par conséquent, dans l'exemple conditionnel, la tête est approximativement ronde et approximativement solide - et un point à ce sujet.
Si vous êtes d'accord, nous l'écrirons entre crochets:
tête (s) {forme: ronde; surface: dure}.Autrement dit, l'objet spécifié a les caractéristiques spécifiées.
Bien sûr, bien sûr, les têtes peuvent être non seulement rondes, mais aussi différentes: par exemple, Vovochka d'une anecdote barbu de la période soviétique a une tête carrée. Rien ne nous empêche d'introduire des opérandes logiques dans notre système de notation, en particulier l'opérande «ou»:
tête (s) {forme: rond II carré; surface: dure}.Mais la tête du lièvre est ronde, pas carrée, comme celle de Vova! Eh bien, au diable avec les deux, nous introduisons l'implication:
tête (s) {forme: ronde} si tête (s) ⊂ lièvre (s).Au lieu d'un lièvre, il était possible d'indiquer un lièvre spécifique Stepashka, définissant ainsi ses caractéristiques individuelles:
tête (s) {forme: ronde} si tête (s) ⊂ Stepashka (i).
Les termes utilisés dans les caractéristiques («rond», «carré», «solide», etc.) sont indétectables: nous les ressentons directement, donc aucune définition verbale n'est requise.
Je vais désigner ce type de mots avec le symbole "a" - de "attribut", comme ceci:
tour (a).J'attire votre attention sur le fait que les objets et classes individuels sont des noms (ce sont des entités!), Alors que les caractéristiques sont des adjectifs (pour cela ce sont des caractéristiques!). Du point de vue de la correspondance des types aux parties du discours, tout est parfaitement légal.
L'adjectif «rond» est une caractéristique indétectable, mais, disons, l'adjectif «lièvre», ne correspondant à aucune des sensations d'une personne, ne correspond pas à l'attribut.
De toute évidence, la définition du "lièvre" devrait se faire par le "lièvre", ce que j'ai déjà fait (en décomposant le "lièvre" en ses composants). C'est-à-dire que le terme «lièvre» est apparu pour la première fois, puis l'adjectif «lièvre» a été formé à partir de lui, signifiant: se rapportant à un lièvre, semblable à un lièvre.
Nous obtenons un nouveau type, désigné par le symbole "d" - de "dépendance". Les indications de type ne sont bien sûr pas suffisantes - une référence au terme parent est nécessaire. Nous introduisons une nouvelle désignation, en utilisant le symbole "=>" pour indiquer la relation:
lièvre (d) => lièvre (s).Le terme "lièvre" est maintenant défini - à travers le nom parent "lièvre".
Nous avons défini l'adjectif dépendant à travers le nom parent. Cela se produit dans l'autre sens: lorsqu'un nom dépendant est formé à partir de l'adjectif parent. Par exemple, «carré» est un adjectif désignant la forme d'un objet. À la lumière de ce qui précède, il devient clair que le "carré" provenait du "carré", mais pas le "carré" du "carré".
carré (d) => carré (a).Ainsi, dans chaque groupe de termes apparentés, il existe un terme parent dont tous les autres sont issus.
Maintenant, j'ai réussi à dériver tous les termes de l'original indétectable? Toujours pas - il reste un groupe terminologique important, non encore couvert: ces concepts qui peuvent être déduits au moyen de formules.
Prenons un verbe - par exemple, «déplacer»: nous n'avons pas encore rencontré de verbes. Qu'est-ce qu'un "déménagement"? Je n'utilise pas une définition académique, mais une définition qui, de mon point de vue, reflète l'essence de la question:
«Déplacer», c'est quand un objet change d'emplacement sous l'influence d'un autre objet.La formule est la suivante:
X (i) 1 # move (f) X (i) 3 {move: différent de zéro (a)}.Je m'empresse de donner les explications nécessaires.
La formule se compose de trois parties dénotant le sujet, l'action et l'objet:
- X (i) 1 est le sujet. "X" fait référence à toute entité individuelle, sous le numéro de série 1.
- # movef est une action. "F" est une formule, de "formule". Un treillis désigne un mot définissable (dans cet exemple, cela est superflu, mais pourrait être requis pour pointer vers un sujet ou un objet spécifique).
- X (i) 3 est un objet. Le reste est identique au sujet. Les accolades indiquent la caractéristique qui a changé en raison de l'impact du sujet.
Les règles sont flexibles: de nouveaux concepts sont facilement construits en fonction d'eux. La structure générale non remplie est prise (sujet - action - objet):
X (i) 1 X (f) 2 X (i) 3.Les éléments nécessaires sont remplacés par des termes spécifiques, les caractéristiques sont indiquées, l'élément identifié est marqué d'une grille et, si nécessaire, des opérandes logiques sont utilisés.
Pratiquons un peu, par exemple avec des adverbes, qui peuvent aussi s'exprimer en termes de formule.
Prenons l'adverbe «prudemment» - de mon point de vue, le parent dans le groupe de mots apparentés («attention», «attention», «attention», «protection»). Le mot désigne une caractéristique, mais pas un objet, mais une action. Je vais vous donner une définition conditionnellement primitive:
«Attention», c'est quand quelqu'un bouge lentement.Les choses sont définies, «lentes» - dépendantes de «lentes», qui est une caractéristique des objets en vitesse.
lent (d) => lent (a).Et le terme "déménagement" a déjà été traité. Ainsi, il y a tout ce qu'il faut pour définir le terme «soigneusement»:
X (i) 1 mouvement (f) {# soigneusement (f)} X (i) 3 {vitesse: lente (a)}.Ici, «soigneusement» est défini par «bouger» et «lentement» et, comme tout autre dialecte, se réfère à l'action.
Selon de telles règles, il est possible de déterminer de nouveaux concepts de formule à partir de ceux obtenus précédemment, et ainsi de suite, y compris en utilisant des implications et éventuellement d'autres méthodes logiques. Plus le concept abstrait est complexe, plus la structure de la formule résultante est complexe et profonde. Nous pouvons obtenir une définition formelle de tout terme, et combien il se révèle correct dépend de nous.
Naturellement, le langage proposé peut être étendu - plus que suffisamment de possibilités. Par exemple, la notation des synonymes demande:
hippopotame (s) = hippopotame (s).Il ne parle pas d'autres parties du discours: celles qui sont utilisées pour la coloration émotionnelle des phrases (interjections) ou divers besoins techniques (unions).
Oui, on ne sait jamais quoi d'autre! Cependant, la direction de la pensée est importante, tandis que la syntaxe d'un tel langage est une question purement secondaire et appliquée.
Je résume.
Nous avons les types de mots suivants:
- i - objets individuels: déterminés par l'appartenance à la classe, sont des noms;
- c - classes: déterminées par la décomposition en composants, au niveau des classes élémentaires. Les classes élémentaires sont définies par des caractéristiques. Les deux sont des noms;
- a - caractéristiques des objets et des classes. Ce sont des adjectifs;
- d sont des termes dépendants. Formé du terme parent. Peut être n'importe quelle partie du discours;
- f - concepts de formule. Ce sont des noms, des verbes ou des adjectifs.
Et la séquence de formation de mots suivante:
- Au niveau inférieur se trouvent les caractéristiques des objets élémentaires, et à travers eux - les classes: rouge, solide, rond, etc.
- La combinaison de caractéristiques originales permet d'attribuer un nom à un objet élémentaire: par exemple, tous les objets ronds et rouges poussant sur les arbres peuvent être appelés pommes. On obtient ainsi un terme propre à désigner à la fois une classe (les pommes dans leur ensemble) et un objet individuel (c'est précisément cette pomme).
- La présence d'objets individuels vous permet de leur attribuer des noms uniques (lièvre Stepashka).
- Les termes initiaux sont formés arbitrairement, si nécessaire (cette bête pourrait être appelée un lièvre, ou elle pourrait être appelée un lapin, rien n'aurait changé depuis).
- Les personnes dépendantes sont formées sur les termes initiaux, en règle générale, qui sont d'autres parties du discours.
- Sur la base des termes qui ont été définis, des formules peuvent être compilées pour définir les termes suivants, avec des conditions logiques complexes.
Les lecteurs ont probablement déjà une question, pourquoi tout cela est-il nécessaire?
J'ai rencontré ce problème en sculptant un chatbot. Les testeurs que nous avons réussi à attirer n'étaient que quelques personnes! - se sont comportés, de mon point de vue, tout aussi fous: ils ont posé des questions, voulant y trouver des réponses. Naïf! C'était comme s'ils ne savaient pas qu'avant de poser des questions, vous devez saisir des informations dans la base de données. Mais même avec le franchissement réussi de cet obstacle, il s'est avéré très problématique, compte tenu de l'invariance de la parole humaine, de prévoir la forme de la question.
Il ne coûte rien de saisir du texte dans la base de données:
"Les oiseaux volent."Ensuite, la réponse à la question peut être obtenue. Il est difficile d'attendre une réponse à une question plus compliquée, qui est essentiellement une variation de la première:
"Est-ce que le cacatoès bat des ailes?"Pour ce faire, vous devez connaître les nombreuses relations entre les mots, à savoir:
- les cacatoès appartiennent à la classe des oiseaux;
- «Fly» et «flight» sont des mots racines;
- vous pouvez voler avec les ailes;
- les ailes s'agitent.
Les deux premiers points peuvent, en principe, être téléchargés sur le chatbot à partir de dictionnaires (bien que, comme j'étais convaincu d'une tristesse inévitable dans mon âme, vous ne trouverez pas de dictionnaires pendant la journée avec le feu). Et pour réaliser les deux derniers points est tout simplement nulle part. Dans nos têtes, les informations se présentent sous la forme prescrite par le médecin, mais vous ne pouvez pas les retirer. Tandis que les dictionnaires avec le contenu requis sont absents par définition: les misérables, qui se rencontrent parfois, proposent des formulations verbales, tandis que des formelles strictes sont nécessaires.
Je me suis donc posé une question: comment formaliser le discours pour que, sur la base de termes indéfinissables, donner des définitions aux autres, afin qu'il devienne possible de compiler un Dictionnaire complet des relations lexicales. En cas de succès, le chatbot pourra répondre à la question de savoir si le cacatoès bat des ailes en vol.
Montrer la voie est la seule chose qui me soit possible au stade actuel de la vie. Cependant, je ne suis pas sûr que les considérations exprimées ici soient complètement originales: des tentatives de formalisation de la parole lors du développement de l'IA ont eu lieu, et certainement plus d'une fois. Cependant, l'astuce de ma proposition n'est pas seulement de remplir la base avec des phrases en langage naturel ou artificiel (le remplissage significatif de la base ne s'applique pas au sujet en discussion), mais de définir tout terme ultérieur à partir d'un nombre limité de concepts non définis. Je ne sais rien des tentatives de mise en œuvre de cette idée.
En fait, c'est tout.
[blague]
Ne me dites pas, le prix Nobel est délivré par chèque, virement bancaire ou espèces?
[/ blague]