Formalisasi pidato. Beberapa pertimbangan



Apa kesulitan utama dalam memformalkan bahasa alami? Faktanya adalah bahwa kita terbiasa memformalkannya dengan bantuan bahasa, yang mengarah pada kejahatan tanpa batas. Bahasa itu sendiri merupakan sarana formalisasi, yang telah lama dan tidak berhasil digunakan umat manusia.

Kami mengambil definisi pertama yang muncul:
Penerbangan - pergerakan independen suatu objek dalam medium gas atau ruang hampa udara.

Ini memiliki enam istilah, yang pada gilirannya memerlukan definisi:

  • mandiri
  • bergerak
  • objek
  • berbentuk gas
  • Rabu
  • ruang hampa.

Setiap istilah memiliki definisi sendiri, di mana kami memperoleh definisi baru yang memerlukan definisi baru, dll. Pada akhirnya, ternyata semua istilah yang digunakan diberi definisi tadi, yaitu kita mendapat siklus. Apa yang bukan subjek impian kita, tentu saja. Salah satu transaksi perlu dihentikan, tapi ... Kapan harus berhenti? apa yang harus dipilih untuk kriteria berhenti? - ini adalah pertanyaan terkutuk.

Ingat mengapa kita umumnya membutuhkan bahasa. Untuk mencerminkan dengan tepat kenyataan di sekitar kita dalam proses komunikasi. Kenyataan di sekitarnya, omong-omong, terdiri dari benda-benda fisik. Kita tidak dapat memahami hal lain: benda-benda fisik - inilah yang pada awalnya dirasakan oleh manusia.

Dari sini kita dapat menyimpulkan bahwa berhenti dalam proses mengeluarkan definisi diperlukan dalam hal yang menunjukkan objek fisik. Prinsipnya adalah ini: apa yang kita lihat, kami informasikan tentang itu.
Jebakan logis ada dalam menunggu di sini: untuk memahami apa yang kami coba komunikasikan, perlu untuk mendefinisikan istilah tersebut.

Misalkan seseorang, mengacungkan jari, berseru dengan takjub:
- Kelinci!

"Kelinci" membutuhkan pengetahuan subjek atau definisi - kita mendapati diri kita dalam posisi yang tidak menyenangkan. Tetapi posisi yang tidak menyenangkan akan hilang jika Anda mengambil sesuatu yang elementer - misalnya, berteriak:
- Sesuatu yang putih!

Apa itu putih? Bukan objek, tentu saja, tetapi karakteristiknya adalah warna. Istilah yang tidak memerlukan definisi: putih itu putih. Jumlah warna yang tersedia bagi mata manusia terbatas - karenanya, jumlah istilah yang tidak memerlukan definisi juga terbatas.

Diyakini bahwa seseorang memiliki lima indera (kadang-kadang disebut lebih banyak, tetapi ini tidak penting):

  • visi
  • sentuh
  • indera penciuman
  • mendengar
  • gurih.

Hasil dari fungsi masing-masing organ adalah sensasi tertentu, nilai-nilai yang tidak memerlukan definisi, karena mereka sesuai dengan elemen yang tidak terdeteksi dari realitas sekitarnya.

Pertanyaannya adalah, elemen-elemen apa dari realitas di sekelilingnya yang dapat dikarakteristikkan sebagai serangkaian sensasi yang sederhana? Benda dasar! Idenya adalah untuk menguraikan objek yang kompleks - dari "kelinci" yang sama menjadi komponen-komponen dasar, yang masing-masing dicirikan oleh sensasi. Menempatkan komponen kembali, kita mendapatkan "kelinci" dalam koleksi: objek yang memiliki formal dan, yang paling penting, melengkapi definisi verbal.

Mari kita lihat bagaimana ini mungkin.

Ini adalah objek fisik. Harap perhatikan bahwa untuk mengamati (lebih tepatnya, merasakan, karena suatu objek dapat dirasakan tidak hanya secara visual, tetapi juga dengan bantuan indera lain), suatu objek khusus yang khusus, yaitu, objek individual tersedia. Ketika saya melihat seekor kelinci, ini adalah kelinci yang sangat spesifik - yang ini, dan bukan kelinci sama sekali.

Sebagai aturan, individualisasi suatu objek terjadi melalui penamaannya, tetapi, seperti pada kasus kelinci, ia jauh dari selalu (hanya jika ada kebutuhan untuknya). Jadi, tergantung pada situasinya, istilah "kelinci" dapat berarti:

  1. kelinci tertentu
  2. nama kelas yang dimiliki kelinci mana pun.

Nuansa ini harus dibedakan - misalkan dengan singkatan dari "individu" (untuk penunjukan kita mengambil huruf pertama) dan "kelas" (untuk penunjukan kita mengambil huruf terakhir, karena "c" dalam tanda kurung dikaitkan dengan tanda hak cipta):

Hare (i).
Analog tekstual: kelinci - nama pribadi;

Hare (s)
Analog tekstual: kelinci - nama kelas;

Jika kelinci memiliki nama yang unik, itu akan menjadi lebih jelas:
Stepashka (i).

"Stepashka" tidak boleh menjadi nama kelas, tetapi itu memerlukan indikasi milik kelas tertentu. Apakah Anda memanggil siapa pun begitu ?! Kami harus menunjukkan milik kelas. Kami menggunakan simbol "∈" untuk ini:
Stepashka (i) ∈ hare (s).

Sekarang ditentukan bahwa Stepashka adalah salah satu dari hares, tetapi tidak ditentukan apa yang hares. Seperti disebutkan sebelumnya, "kelinci" harus diuraikan menjadi bagian-bagian komponennya, yang masing-masing harus diberi karakteristik yang sesuai dengan sensasi yang dirasakan oleh orang tersebut.

Ini sangat sulit, terutama karena tiga dimensi dari bagian-bagian komponen objek, oleh karena itu hanya dapat dilakukan secara kondisional. Tetapi pada prinsipnya itu bisa.

Misalkan kelinci terdiri dari kepala, belalai, kaki dan ekor, dan bahwa benda-benda yang terdaftar adalah unsur dasar (sebenarnya tidak, tentu saja). Kemudian, menggunakan simbol "⊂" untuk menunjukkan terjadinya komponen dalam keseluruhan materi, kita memperoleh:
kepala && trunk && 4 * kaki && ekor ⊂ kelinci
Analog tekstual: kepala, dan dada, dan 4 kaki, dan ekor menjadi kelinci.

Karena benda-benda itu seharusnya elementer, bagi mereka Anda dapat menentukan karakteristik untuk masing-masing sensasi. Karena efek gabungan sensasi pada seseorang, definisi dalam ruang dan waktu mungkin diperlukan.

Kami mendapatkan sekumpulan karakteristik perkiraan:

• warna
• formulir
• bau
• rasa
• permukaan (hasil sentuhan),
• suara
• lokasi (koordinat spasial),
• pergerakan (sebagai perbedaan antara dua lokasi),
• titik waktu
• durasi (sebagai perbedaan antara dua titik waktu),
• kecepatan (sebagai hasil bagi antara gerakan dan durasi).

Set, seperti yang saya katakan, merupakan perkiraan: hanya karakteristik yang sesuai dengan sensasi yang tidak bersyarat, sisanya dibahas. Sebagai contoh, jelas bahwa seseorang tidak melihat waktu seperti itu: itu dapat ditentukan oleh simbol pada gadget atau oleh posisi matahari di langit, tetapi tidak secara langsung oleh sensasi. Demikian pula, lokasi tidak diatur secara absolut, tetapi relatif terhadap objek lain.

Sekarang saya akan mencoba untuk mencirikan "kepala":

  • bentuk: bulat
  • permukaan: keras.

Karakteristik lain tidak didefinisikan.

Artinya, kepala, jika kita anggap kondisional sebagai objek elementer, adalah sesuatu yang bulat dan padat. Kondisional, tentu saja, eksklusif kondisional. Bagaimanapun, bahasa sebagai sarana formalisasi memberikan hasil perkiraan: bagaimana, misalnya, untuk menggambarkan secara verbal titik bentuk geometris yang kompleks? Tidak mungkin: Anda tidak bisa menjelaskannya. Oleh karena itu, dalam contoh kondisional, kepala kira-kira bundar dan sekitar padat - dan satu titik pada ini.

Jika Anda setuju, kami akan menulisnya dalam kurung keriting:
kepala {bentuk: bulat; permukaan: keras}.

Artinya, objek yang ditentukan memiliki karakteristik yang ditentukan.

Tentu saja, tentu saja, kepala tidak hanya bulat, tetapi juga berbeda: misalnya, Vovochka dari anekdot berjanggut periode Soviet memiliki kepala persegi. Tidak ada yang menghalangi kami untuk memperkenalkan operan logis ke dalam sistem notasi kami, khususnya operan "atau":
kepala {bentuk: round II square; permukaan: keras}.

Tapi kepala kelinci itu bulat, bukan persegi, seperti Vova! Yah, persetan dengan mereka berdua, kami memperkenalkan implikasinya:
head {bentuk: round} jika head (s) ⊂ hare (s).

Alih-alih seekor kelinci, itu mungkin untuk menunjukkan Stepashka kelinci tertentu, dengan demikian menetapkan karakteristik individualnya:
head {s: round} jika head (s) ⊂ Stepashka (i).


Istilah yang digunakan dalam karakteristik ("bulat", "kuadrat", "padat", dll.) Tidak dapat terdeteksi: kita merasakannya secara langsung, oleh karena itu tidak diperlukan definisi verbal.

Saya akan menunjuk jenis kata ini dengan simbol "a" - dari "atribut", seperti ini:
bulat (a).

Saya menarik perhatian Anda pada fakta bahwa objek individu dan kelas adalah kata benda (ini adalah entitas!), Sementara karakteristik adalah kata sifat (untuk itu mereka adalah karakteristik!). Dari sudut pandang korespondensi jenis ke bagian pidato, semuanya benar-benar legal.

Kata sifat “bulat” adalah karakteristik yang tidak terdeteksi, tetapi, katakanlah, kata sifat “kelinci”, tidak cocok dengan sensasi apa pun yang dimiliki seseorang, tidak cocok dengan atribut.

Jelas, definisi "kelinci" harus melalui "kelinci", yang telah saya lakukan (dengan menguraikan "kelinci" menjadi bagian-bagian komponennya). Artinya, istilah "kelinci" pertama kali muncul, dan kemudian kata sifat "kelinci" terbentuk, artinya: berkaitan dengan kelinci, mirip dengan kelinci.

Kami mendapatkan tipe baru, dilambangkan dengan simbol "d" - dari "dependence". Indikasi jenis, tentu saja, tidak cukup - referensi ke istilah induk diperlukan. Kami memperkenalkan penunjukan baru, menggunakan simbol "=>" untuk menunjukkan hubungan:
hare (d) => hare (s).

Sekarang istilah "kelinci" didefinisikan - melalui kata benda induk "kelinci".

Kami mendefinisikan kata sifat dependen melalui nomina induk. Ini terjadi sebaliknya: ketika kata benda dependen dibentuk dari kata sifat induk. Misalnya, "persegi" adalah kata sifat yang menunjukkan bentuk suatu objek. Dalam terang di atas, menjadi jelas bahwa "kotak" berasal dari "kotak", tetapi bukan "kotak" dari "kotak".
kuadrat (d) => kuadrat (a).

Jadi, dalam setiap kelompok istilah serumpun ada istilah induk dari mana semua yang lain berasal.

Sekarang saya berhasil mendapatkan semua persyaratan dari yang asli tidak terdeteksi? Masih belum - masih ada kelompok terminologis yang signifikan, belum tercakup: konsep-konsep yang dapat disimpulkan dengan rumus-rumus.

Ambil kata kerja - misalnya, "bergerak": kami belum menemukan kata kerja. Apa itu "langkah"? Saya tidak menggunakan definisi akademis, tetapi yang, dari sudut pandang saya, mencerminkan esensi masalah ini:
"Pindahkan" adalah ketika suatu objek mengubah lokasinya di bawah pengaruh objek lain.

Rumusnya adalah sebagai berikut:
X (i) 1 # pindah (f) X (i) 3 {move: nonzero (a)}.

Saya segera memberikan penjelasan yang diperlukan.

Rumus ini terdiri dari tiga bagian yang menunjukkan subjek, tindakan, dan objek:

  • X (i) 1 adalah subjeknya. "X" mengacu pada setiap entitas individu, di bawah nomor seri 1.
  • # movef adalah sebuah tindakan. "F" adalah formula, dari "formula". Sebuah kisi menunjukkan kata yang dapat didefinisikan (dalam contoh ini, ini berlebihan, tetapi bisa diperlukan saat menunjuk ke subjek atau objek tertentu).
  • X (i) 3 adalah objek. Sisanya identik dengan subjek. Kurung keriting menunjukkan karakteristik yang telah berubah sebagai akibat dari dampak subjek.

Aturannya fleksibel: konsep baru mudah dibangun sesuai dengannya. Struktur umum yang tidak terisi diambil (subjek - aksi - objek):
X (i) 1 X (f) 2 X (i) 3.

Elemen-elemen yang diperlukan digantikan oleh istilah-istilah tertentu, karakteristik ditunjukkan, elemen yang diidentifikasi ditandai dengan kisi, dan jika perlu, operan logis digunakan.

Mari kita berlatih sedikit, misalnya dengan kata keterangan, yang juga dapat dinyatakan dalam istilah rumus.

Mari kita ambil kata keterangan "hati-hati" - dari sudut pandang saya, orang tua dalam kelompok kata serumpun ("kehati-hatian", "hati-hati", "hati-hati", "lindungi"). Kata itu menunjukkan suatu karakteristik, tetapi bukan suatu objek, tetapi suatu tindakan. Saya akan memberi Anda definisi primitif bersyarat:
"Hati-hati" adalah ketika seseorang menggerakkan sesuatu dengan lambat.

Hal-hal didefinisikan, "lambat" - tergantung pada "lambat", yang merupakan karakteristik dari objek dalam kecepatan.
lambat (d) => lambat (a).

Dan istilah "pindah" sudah diproses. Dengan demikian, ada segala yang diperlukan untuk mendefinisikan istilah "hati-hati":
X (i) 1 gerakkan (f) {# dengan hati-hati (f)} X (i) 3 {kecepatan: lambat (a)}.

Di sini, "hati-hati" didefinisikan melalui "bergerak" dan "perlahan" dan, seperti dialek lainnya, mengacu pada tindakan.

Menurut aturan tersebut, adalah mungkin untuk menentukan konsep formula baru dari yang diperoleh sebelumnya, dan seterusnya, termasuk menggunakan implikasi, dan mungkin metode logis lainnya. Semakin kompleks konsep abstrak, semakin kompleks dan lebih dalam struktur formula yang dihasilkan. Kita bisa mendapatkan definisi formal tentang istilah apa pun, dan seberapa besar hasilnya ternyata benar tergantung pada kita.

Secara alami, bahasa yang diusulkan dapat diperluas - lebih dari cukup kemungkinan. Misalnya, notasi sinonim memohon:

hippopotamus (s) = hippo (s).

Itu tidak berbicara tentang bagian lain dari pidato: yang digunakan untuk pewarnaan emosional dari kalimat (interjeksi) atau berbagai kebutuhan teknis (serikat pekerja).

Ya, Anda tidak pernah tahu apa lagi! Namun, arah pemikiran itu penting, sementara sintaksis bahasa semacam itu adalah pertanyaan yang semata-mata sekunder dan diterapkan.

Saya meringkas.

Kami memiliki jenis kata berikut:

  • i - objek individual: ditentukan berdasarkan kelas, merupakan kata benda;
  • c - kelas: ditentukan oleh dekomposisi menjadi komponen, ke tingkat kelas dasar. Kelas dasar ditentukan oleh karakteristik. Keduanya adalah kata benda;
  • a - karakteristik objek dan kelas. Mereka adalah kata sifat;
  • d adalah istilah dependen. Dibentuk dari istilah induk. Mungkin merupakan bagian dari pidato;
  • konsep f-formula. Mereka adalah kata benda, atau kata kerja, atau kata sifat.

Dan urutan pembentukan kata berikut:

  1. Pada level yang lebih rendah adalah karakteristik objek elementer, dan melaluinya - kelas: merah, solid, bulat, dll.
  2. Kombinasi karakteristik asli memungkinkan untuk menetapkan nama ke objek dasar: misalnya, semua benda bulat dan merah yang tumbuh di pohon dapat disebut apel. Sebagai hasilnya, kami memperoleh istilah yang cocok untuk menunjuk kelas (apel sebagai keseluruhan) dan objek individual (inilah tepatnya apel ini).
  3. Kehadiran objek individu memungkinkan Anda untuk menetapkan mereka nama-nama unik (kelinci Stepashka).
  4. Istilah awal dibentuk secara sewenang-wenang, jika perlu (binatang ini bisa disebut kelinci, atau bisa disebut kelinci, tidak ada yang akan berubah dari ini).
  5. Yang tergantung dibentuk pada ketentuan awal, sebagai aturan, yang merupakan bagian lain dari pembicaraan.
  6. Berdasarkan istilah yang telah didefinisikan, rumus dapat dikompilasi untuk mendefinisikan istilah berikut, dengan kondisi logis yang kompleks.

Mungkin, pembaca sudah memiliki pertanyaan, mengapa semua ini perlu?

Saya mengalami masalah ini dalam memahat chatbot. Para penguji yang berhasil kami tarik hanyalah beberapa orang! - Berperilaku, dari sudut pandang saya, sama-sama gila: mereka mengajukan pertanyaan, ingin mendapatkan jawaban kepada mereka. Naif! Seolah-olah mereka tidak tahu bahwa sebelum mengajukan pertanyaan, Anda harus memasukkan informasi ke dalam basis data. Tetapi bahkan dengan berhasil mengatasi kendala ini, ternyata menjadi sangat problematis, mengingat tidak adanya pembicaraan manusia, untuk meramalkan bentuk pertanyaan.

Tidak ada biaya untuk memasukkan teks ke dalam basis data:
"Burung-burung itu terbang."

Maka jawaban atas pertanyaan bisa didapat. Sulit untuk menunggu jawaban atas pertanyaan yang lebih rumit, yang pada dasarnya merupakan variasi dari yang pertama:
"Apakah kakatua mengepakkan sayap?"

Untuk melakukan ini, Anda perlu mengetahui banyak hubungan antar kata, yaitu:

  • kakatua termasuk dalam kelas burung;
  • “Terbang” dan “terbang” adalah kata-kata dasar;
  • Anda bisa terbang dengan sayap;
  • sayap melambai.

Dua poin pertama dapat, pada prinsipnya, diunduh ke chatbot dari kamus (meskipun, ketika saya diyakinkan dengan kesedihan yang tak terhindarkan dalam jiwa saya, Anda tidak akan menemukan kamus di siang hari dengan api). Dan untuk menyadari dua poin terakhir sama sekali tidak ada. Di kepala kami, informasi tersebut dalam bentuk yang ditentukan oleh dokter, tetapi Anda tidak bisa mengeluarkannya dari sana. Sementara kamus dengan konten yang diperlukan tidak ada dalam definisi: yang celaka, yang kadang-kadang muncul, menawarkan formulasi verbal, sedangkan yang formal sangat diperlukan.

Jadi saya bertanya pada diri sendiri: bagaimana memformalkan pidato sehingga, atas dasar istilah yang tidak dapat ditentukan, memberikan definisi kepada orang lain, sehingga menjadi mungkin untuk menyusun Kamus lengkap hubungan leksikal. Jika berhasil, chatbot akan dapat menjawab pertanyaan apakah kakatua mengepakkan sayapnya saat terbang.

Menunjuk jalan adalah satu-satunya hal yang mungkin bagi saya pada tahap kehidupan saat ini. Namun, saya tidak yakin bahwa pertimbangan yang diungkapkan di sini benar-benar asli: upaya untuk memformalkan pidato selama pengembangan AI terjadi, dan tentu saja lebih dari sekali. Namun, trik proposal saya tidak hanya mengisi basis dengan frasa dalam bahasa alami atau buatan (pengisian bermakna basis tidak berlaku untuk topik yang sedang dibahas), tetapi dalam mendefinisikan istilah berikutnya dari sejumlah konsep yang tidak ditentukan. Saya tidak tahu apa-apa tentang upaya untuk mengimplementasikan ide ini.

Sebenarnya itu saja.

[lelucon]
Jangan bilang, Hadiah Nobel diberikan melalui cek, transfer bank atau uang tunai?
[/ lelucon]

Source: https://habr.com/ru/post/id448936/


All Articles