Formalisierung der Sprache. Einige Überlegungen



Was ist die Hauptschwierigkeit bei der Formalisierung einer natürlichen Sprache? Tatsache ist, dass wir es gewohnt sind, es mit Hilfe der Sprache zu formalisieren, was zur bösen Unendlichkeit führt. Sprache ist an sich ein Mittel der Formalisierung, das die Menschheit lange und erfolglos benutzt hat.

Wir nehmen die erste Definition, die sich ergibt:
Flugunabhängige Bewegung eines Objekts in einem gasförmigen Medium oder Vakuum.

Es hat sechs Begriffe, die wiederum definiert werden müssen:

  • unabhängig
  • bewegen
  • Objekt
  • gasförmig
  • Mittwoch
  • das Vakuum.

Jeder der Begriffe hat seine eigenen Definitionen, durch die wir neue Definitionen erhalten, die eine neue Definition erfordern usw. Am Ende stellt sich heraus, dass alle verwendeten Begriffe früher definiert wurden, dh wir haben einen Zyklus. Was ist natürlich nicht das Thema unserer Träume? Eine der Transaktionen muss gestoppt werden, aber ... Wann soll gestoppt werden? Was ist für das Stoppkriterium zu wählen? - Das sind die verdammten Fragen.

Denken Sie daran, warum wir im Allgemeinen eine Sprache brauchen. Die uns umgebende Realität im Kommunikationsprozess richtig widerspiegeln. Die umgebende Realität besteht übrigens aus physischen Objekten. Wir können nichts anderes wahrnehmen: physische Objekte - das wird zunächst vom Menschen wahrgenommen.

Daraus können wir schließen, dass es notwendig ist, bei der Ausgabe von Definitionen anzuhalten, um physische Objekte zu bezeichnen. Das Prinzip ist folgendes: Was wir sehen, informieren wir darüber.
Hier wartet eine logische Falle: Um zu verstehen, was wir zu kommunizieren versuchen, muss der Begriff definiert werden.

Angenommen, jemand, der mit dem Finger zeigt, ruft erstaunt aus:
- Hase!

Ein „Hase“ erfordert entweder Fachwissen oder Definition - wir befinden uns in derselben nicht beneidenswerten Position. Aber die nicht beneidenswerte Position verschwindet, wenn Sie etwas Elementares nehmen - zum Beispiel schreien:
- Etwas Weißes!

Was ist weiß? Natürlich kein Objekt, aber seine Eigenschaft ist Farbe. Ein Begriff, für den keine Definition erforderlich ist: Weiß ist Weiß. Die Anzahl der Farben, die dem menschlichen Auge zur Verfügung stehen, ist begrenzt - dementsprechend ist auch die Anzahl der Begriffe, für die keine Definition erforderlich ist, begrenzt.

Es wird angenommen, dass eine Person fünf Sinne hat (manchmal mehr genannt, aber das ist nicht wichtig):

  • Vision
  • berühren
  • Geruchssinn
  • Anhörung
  • geschmackvoll.

Das Ergebnis der Funktion jedes der Organe ist eine bestimmte Empfindung, deren Werte keiner Definition bedürfen, da sie den nicht nachweisbaren Elementen der umgebenden Realität entsprechen.

Die Frage ist, welche Elemente der umgebenden Realität als einfache Menge von fünf Empfindungen charakterisiert werden können. Elementare Objekte! Die Idee ist, ein komplexes Objekt - desselben "Hasen" - in elementare Komponenten zu zerlegen, von denen jede durch Empfindungen gekennzeichnet ist. Wenn wir die Komponenten zurücksetzen, erhalten wir den „Hasen“ in der Sammlung: ein Objekt, das eine formale und vor allem vollständige verbale Definition hat.

Mal sehen, wie das möglich ist.

Hier ist ein physisches Objekt. Bitte beachten Sie, dass zum Beobachten (genauer zum Fühlen, da ein Objekt nicht nur visuell, sondern auch mit Hilfe anderer Sinne wahrgenommen werden kann) ein ausschließlich spezifisches, dh ein individualisiertes Objekt zur Verfügung steht. Wenn ich einen Hasen sehe, ist dies ein sehr spezifischer Hase - dieser und überhaupt kein Hase.

Die Individualisierung eines Objekts erfolgt in der Regel durch seine Benennung, ist aber wie bei einem Hasen alles andere als immer (nur dann, wenn Bedarf besteht). So kann der Begriff „Hase“ je nach Situation bedeuten:

  1. ein besonderer Hase
  2. Name der Klasse, zu der ein Hase gehört.

Diese Nuancen müssen unterschieden werden - nehmen wir an, dass durch Abkürzungen von "Individ" (für die Bezeichnung nehmen wir den ersten Buchstaben) und "Klasse" (für die Bezeichnung nehmen wir den letzten Buchstaben, weil "c" in Klammern mit dem Copyright-Zeichen verbunden ist):

Hase (i).
Textanalog: Hase - persönlicher Name;

Hase (n).
Textanalog: Hase - der Name der Klasse;

Wenn ein Hase einen eindeutigen Namen hätte, würde dies offensichtlicher werden:
Stepashka (i).

"Stepashka" kann nicht der Name einer Klasse sein, erfordert jedoch einen Hinweis auf die Zugehörigkeit zu einer bestimmten Klasse. Nennst du jemanden so ?! Wir müssen angeben, zur Klasse zu gehören. Wir verwenden dafür das Symbol "∈":
Stepashka (i) ∈ Hase (n).

Jetzt wird festgestellt, dass Stepashka einer der Hasen ist, aber es ist nicht festgelegt, was die Hasen sind. Wie bereits erwähnt, muss der "Hase" in seine Bestandteile zerlegt werden, denen jeweils Eigenschaften zugewiesen werden müssen, die den von der Person wahrgenommenen Empfindungen entsprechen.

Dies ist sehr schwierig, hauptsächlich aufgrund der Dreidimensionalität der Bestandteile des Objekts, daher kann es nur bedingt durchgeführt werden. Aber im Prinzip kann es.

Angenommen, ein Hase besteht aus Kopf, Rumpf, Beinen und Schwanz und die aufgelisteten Objekte sind elementar (eigentlich natürlich nicht). Wenn wir dann das Symbol "⊂" verwenden, um das Auftreten einer Komponente in einem materiellen Ganzen zu bezeichnen, erhalten wir:
Kopf (e) && Stamm (e) && 4 * Pfote (n) && Schwanz (e) ⊂ Hase (n).
Textanalog: Kopf und Rumpf sowie 4 Beine und Schwanz bilden einen Hasen.

Da die Objekte elementar sein sollen, können Sie für sie die Eigenschaften für jede der Empfindungen angeben. Aufgrund der kombinierten Wirkung von Empfindungen auf eine Person können Definitionen in Raum und Zeit erforderlich sein.

Wir erhalten einen ungefähren Satz von Merkmalen:

• Farbe
• Formular
• riechen
• schmecken
• Oberfläche (Ergebnis der Berührung),
• Ton
• Ort (räumliche Koordinate),
• Bewegung (als Unterschied zwischen zwei Orten),
• Zeitpunkt
• Dauer (als Differenz zwischen zwei Zeitpunkten),
• Geschwindigkeit (als Quotient zwischen Bewegung und Dauer).

Die Menge ist, wie gesagt, ungefähr: Nur Eigenschaften, die Empfindungen entsprechen, sind bedingungslos, der Rest wird diskutiert. Zum Beispiel ist klar, dass eine Person die Zeit nicht als solche wahrnimmt: Sie kann durch die Symbole auf dem Gerät oder durch den Sonnenstand am Himmel bestimmt werden, aber nicht direkt durch die Empfindung. Ebenso ist der Ort nicht absolut festgelegt, sondern relativ zu anderen Objekten.

Jetzt werde ich versuchen, den "Kopf" zu charakterisieren:

  • Form: rund
  • Oberfläche: hart.

Andere Merkmale sind nicht definiert.

Das heißt, der Kopf ist, wenn wir ihn bedingt als elementares Objekt betrachten, etwas Rundes und Festes. Bedingt natürlich ausschließlich bedingt. Sprache als Mittel zur Formalisierung liefert schließlich ungefähre Ergebnisse: Wie kann man beispielsweise einen Punkt komplexer geometrischer Form verbal beschreiben? Auf keinen Fall: Sie können es einfach nicht beschreiben. Daher ist der Kopf im bedingten Beispiel ungefähr rund und ungefähr fest - und ein Punkt darauf.

Wenn Sie damit einverstanden sind, schreiben wir es in geschweifte Klammern:
Kopf (e) {Form: rund; Oberfläche: hart}.

Das heißt, das angegebene Objekt hat die angegebenen Eigenschaften.

Natürlich können die Köpfe nicht nur rund sein, sondern auch anders: Zum Beispiel hat Vovochka aus einer bärtigen Anekdote der Sowjetzeit einen quadratischen Kopf. Nichts hindert uns daran, logische Operanden in unser Notationssystem einzuführen, insbesondere den Operanden „oder“:
Kopf (e) {Form: rundes II-Quadrat; Oberfläche: hart}.

Aber der Kopf des Hasen ist rund und nicht quadratisch wie der von Vova! Zum Teufel mit beiden führen wir die Implikation ein:
Kopf (e) {Form: rund} wenn Kopf (e) ⊂ Hase (n).

Anstelle eines Hasen konnte ein bestimmter Hase Stepashka angegeben werden, wodurch seine individuellen Merkmale festgelegt wurden:
Kopf (e) {Form: rund}, wenn Kopf (e) ⊂ Stepashka (i).


Die in den Merkmalen verwendeten Begriffe („rund“, „quadratisch“, „fest“ usw.) sind nicht nachweisbar: Wir fühlen sie direkt, daher ist keine verbale Definition erforderlich.

Ich werde diese Art von Wörtern mit dem Symbol "a" bezeichnen - von "Attribut", wie folgt:
Runde (a).

Ich mache Sie darauf aufmerksam, dass einzelne Objekte und Klassen Substantive sind (dies sind Entitäten!), Während Merkmale Adjektive sind (dafür sind sie Merkmale!). Unter dem Gesichtspunkt der Korrespondenz von Typen mit Wortarten ist alles völlig legal.

Das Adjektiv „rund“ ist ein nicht nachweisbares Merkmal, aber beispielsweise passt das Adjektiv „Hase“, das keiner der Empfindungen einer Person entspricht, nicht zum Attribut.

Offensichtlich sollte die Definition von "Hase" durch den "Hasen" erfolgen, was ich bereits getan habe (indem ich den "Hasen" in seine Bestandteile zerlegte). Das heißt, der Begriff „Hase“ tauchte zuerst auf, und dann wurde daraus das Adjektiv „Hase“ gebildet, was bedeutet: sich auf einen Hasen beziehen, ähnlich einem Hasen.

Wir erhalten einen neuen Typ, der mit dem Symbol "d" bezeichnet wird - aus "Abhängigkeit". Typangaben reichen natürlich nicht aus - ein Verweis auf den Elternbegriff ist notwendig. Wir führen eine neue Bezeichnung ein, die das Symbol "=>" verwendet, um die Beziehung anzuzeigen:
Hase (d) => Hase (n).

Nun wird der Begriff "Hase" definiert - durch das übergeordnete Substantiv "Hase".

Wir haben das abhängige Adjektiv durch das übergeordnete Substantiv definiert. Es passiert umgekehrt: Wenn aus dem übergeordneten Adjektiv ein abhängiges Substantiv gebildet wird. Zum Beispiel ist "Quadrat" ein Adjektiv, das die Form eines Objekts bezeichnet. In Anbetracht des Vorstehenden wird klar, dass das „Quadrat“ vom „Quadrat“ kam, nicht aber das „Quadrat“ vom „Quadrat“.
Quadrat (d) => Quadrat (a).

Somit gibt es in jeder Gruppe verwandter Begriffe einen übergeordneten Begriff, von dem alle anderen stammen.

Jetzt habe ich es geschafft, alle Begriffe aus dem ursprünglichen nicht nachweisbaren abzuleiten? Immer noch nicht - es bleibt eine bedeutende terminologische Gruppe, die noch nicht abgedeckt ist: jene Konzepte, die mittels Formeln abgeleitet werden können.

Nehmen Sie ein Verb - zum Beispiel "bewegen": Wir haben noch keine Verben gefunden. Was ist ein "Zug"? Ich verwende keine akademische Definition, sondern eine, die aus meiner Sicht das Wesentliche der Sache widerspiegelt:
"Verschieben" ist, wenn ein Objekt seine Position unter dem Einfluss eines anderen Objekts ändert.

Die Formel lautet wie folgt:
X (i) 1 # move (f) X (i) 3 {move: ungleich Null (a)}.

Ich beeile mich, die notwendigen Erklärungen zu geben.

Die Formel besteht aus drei Teilen, die das Subjekt, die Aktion und das Objekt bezeichnen:

  • X (i) 1 ist das Thema. "X" bezieht sich auf eine einzelne Entität unter der Seriennummer 1.
  • # movef ist eine Aktion. "F" ist eine Formel aus "Formel". Ein Gitter bezeichnet ein definierbares Wort (in diesem Beispiel ist dies überflüssig, kann jedoch erforderlich sein, wenn auf ein bestimmtes Subjekt oder Objekt gezeigt wird).
  • X (i) 3 ist ein Objekt. Der Rest ist identisch mit dem Thema. Geschweifte Klammern geben die Eigenschaft an, die sich infolge des Aufpralls des Motivs geändert hat.

Die Regeln sind flexibel: Neue Konzepte lassen sich leicht entsprechend konstruieren. Die allgemeine ungefüllte Struktur wird genommen (Subjekt - Aktion - Objekt):
X (i) 1 X (f) 2 X (i) 3.

Die erforderlichen Elemente werden durch bestimmte Begriffe ersetzt, Merkmale werden angezeigt, das zu identifizierende Element wird mit einem Raster markiert und bei Bedarf werden logische Operanden verwendet.

Lassen Sie uns ein wenig üben, zum Beispiel mit Adverbien, die auch in Formeln ausgedrückt werden können.

Nehmen Sie das Adverb „vorsichtig“ - aus meiner Sicht gehört der Elternteil zur Gruppe der verwandten Wörter („Vorsicht“, „vorsichtig“, „vorsichtig“, „schützen“). Das Wort bezeichnet ein Merkmal, aber kein Objekt, sondern eine Handlung. Ich gebe Ihnen eine bedingt primitive Definition:
"Vorsichtig" ist, wenn jemand etwas langsam bewegt.

Dinge werden definiert, "langsam" - abhängig von "langsam", was ein Merkmal von Objekten in der Geschwindigkeit ist.
langsam (d) => langsam (a).

Und der Begriff "Umzug" wurde bereits verarbeitet. Es gibt also alles Notwendige, um den Begriff „sorgfältig“ zu definieren:
X (i) 1 Bewegung (f) {# vorsichtig (f)} X (i) 3 {Geschwindigkeit: langsam (a)}.

Hier wird „sorgfältig“ durch „bewegen“ und „langsam“ definiert und bezieht sich wie jeder andere Dialekt auf Handlung.

Nach solchen Regeln ist es möglich, neue formelhafte Konzepte aus zuvor erhaltenen usw. zu bestimmen, einschließlich der Verwendung von Implikationen und möglicherweise anderer logischer Methoden. Je komplexer das abstrakte Konzept ist, desto komplexer und tiefer ist die Struktur der resultierenden Formel. Wir können eine formale Definition jedes Begriffs erhalten, und wie sich herausstellt, dass er korrekt ist, hängt von uns ab.

Natürlich kann die vorgeschlagene Sprache erweitert werden - mehr als genug Möglichkeiten. Zum Beispiel bittet die Notation von Synonymen:

Nilpferd (e) = Nilpferd (e).

Es geht nicht um andere Teile der Sprache: jene, die zur emotionalen Färbung von Sätzen (Interjektionen) oder verschiedenen technischen Bedürfnissen (Gewerkschaften) verwendet werden.

Ja, du weißt nie was noch! Die Richtung des Denkens ist jedoch wichtig, während die Syntax einer solchen Sprache eine rein sekundäre und angewandte Frage ist.

Ich fasse zusammen.

Wir haben die folgenden Arten von Wörtern:

  • i - einzelne Objekte: bestimmt durch Zugehörigkeit zur Klasse, sind Substantive;
  • c - Klassen: bestimmt durch die Zerlegung in Komponenten auf die Ebene der Elementarklassen. Grundklassen werden durch Merkmale definiert. Beide sind Substantive;
  • a - Eigenschaften von Objekten und Klassen. Sie sind Adjektive;
  • d sind abhängige Begriffe. Aus dem übergeordneten Begriff gebildet. Kann ein beliebiger Teil der Rede sein;
  • f - Formelkonzepte. Sie sind Substantive oder Verben oder Adjektive.

Und die folgende Wortbildungssequenz:

  1. Auf der unteren Ebene befinden sich die Merkmale elementarer Objekte und durch sie - Klassen: rot, fest, rund usw.
  2. Die Kombination der ursprünglichen Merkmale ermöglicht es, einem Elementarobjekt einen Namen zuzuweisen: Beispielsweise können alle runden und roten Objekte, die auf Bäumen wachsen, als Äpfel bezeichnet werden. Als Ergebnis erhalten wir einen Begriff, der geeignet ist, sowohl eine Klasse (Äpfel als Ganzes) als auch ein einzelnes Objekt (genau dies ist dieser Apfel) zu bezeichnen.
  3. Durch das Vorhandensein einzelner Objekte können Sie ihnen eindeutige Namen zuweisen (Stepashka-Hase).
  4. Die Anfangsbegriffe werden bei Bedarf willkürlich gebildet (dieses Tier könnte als Hase oder als Kaninchen bezeichnet werden, daran hätte sich nichts geändert).
  5. Abhängige werden in der Regel von den Anfangsbegriffen gebildet, die andere Teile der Sprache sind.
  6. Basierend auf den definierten Begriffen können Formeln zusammengestellt werden, um die folgenden Begriffe mit komplexen logischen Bedingungen zu definieren.

Wahrscheinlich haben die Leser bereits eine Frage, warum das alles notwendig ist.

Ich bin auf dieses Problem gestoßen, einen Chatbot zu formen. Die Tester, die wir gewinnen konnten, waren nur ein paar Leute! - benahm sich aus meiner Sicht ebenso verrückt: Sie stellten Fragen und wollten Antworten darauf bekommen. Naiv! Es war, als ob sie nicht wüssten, dass Sie Informationen in die Datenbank eingeben sollten, bevor Sie Fragen stellen. Aber selbst mit der erfolgreichen Überwindung dieses Hindernisses erwies es sich angesichts der Invarianz der menschlichen Sprache als sehr problematisch, die Form der Frage vorauszusehen.

Die Eingabe von Text in die Datenbank kostet nichts:
"Die Vögel fliegen."

Dann kann die Antwort auf die Frage erhalten werden. Es ist schwierig, auf eine Antwort auf eine kompliziertere Frage zu warten, die im Wesentlichen eine Variation der ersten ist:
"Schlagen Kakadus mit den Flügeln?"

Um dies zu tun, müssen Sie die vielen Beziehungen zwischen Wörtern kennen, nämlich:

  • Kakadus gehören zur Klasse der Vögel;
  • "Fliegen" und "Fliegen" sind Wurzelwörter;
  • du kannst mit den Flügeln fliegen;
  • Flügel winken.

Die ersten beiden Punkte können im Prinzip aus Wörterbüchern in den Chatbot heruntergeladen werden (obwohl Sie, da ich von unausweichlicher Traurigkeit in meiner Seele überzeugt war, tagsüber keine Wörterbücher mit Feuer finden). Und die letzten beiden Punkte zu realisieren ist einfach nirgendwo. In unseren Köpfen haben die Informationen die Form, die der Arzt verschrieben hat, aber Sie können sie dort nicht herausholen. Während Wörterbücher mit dem erforderlichen Inhalt per Definition fehlen: Das Elende, das gelegentlich vorkommt, bietet verbale Formulierungen, während strenge formale Formulierungen erforderlich sind.

Also stellte ich mir die Frage: Wie kann man Sprache so formalisieren, dass sie auf der Grundlage undefinierbarer Begriffe anderen Definitionen gibt, damit ein vollständiges Wörterbuch der lexikalischen Beziehungen erstellt werden kann? Bei Erfolg kann der Chatbot die Frage beantworten, ob der Kakadu im Flug mit den Flügeln schlägt.

Den Weg zu weisen, ist das einzige, was mir in der gegenwärtigen Lebensphase möglich ist. Ich bin mir jedoch nicht sicher, ob die hier geäußerten Überlegungen völlig originell sind: Es gab Versuche, die Sprache während der Entwicklung der KI zu formalisieren, und zwar mehr als einmal. Das Merkmal meines Vorschlags besteht jedoch nicht nur darin, die Basis mit Phrasen in natürlicher oder künstlicher Sprache auszufüllen (eine sinnvolle Füllung der Basis gilt nicht für das behandelte Thema), sondern darin, nachfolgende Begriffe aus einer begrenzten Anzahl undefinierter Konzepte zu definieren. Ich weiß nichts über Versuche, diese Idee umzusetzen.

Eigentlich ist das alles.

[Witz]
Sagen Sie mir nicht, der Nobelpreis wird per Scheck, Überweisung oder Bargeld ausgestellt?
[/ Witz]

Source: https://habr.com/ru/post/de448936/


All Articles