Pembuatan AI menggunakan metode glock cuzdra. Pengembaraan Intelektual

Saya ingin menulis program berbicara. Saya benar-benar ingin, mati-matian.

Tentu saja, saya jauh dari programmer profesional, dan saya juga bukan ahli bahasa, tetapi ada pemikiran sistemik dan rasa bahasa. Selain itu, saya sudah lama tertarik dengan topik AI, saya bahkan beberapa kali putus-putus saat itu. Mengapa tidak menerapkan pengetahuan dalam kode program? Yah, aku sudah berusaha sejauh mungkin.

Temui Vanya Wajar.


Di bawah ini adalah deskripsi dari masalah yang muncul di depan saya di jalan berbatu ini, dan bagaimana mengatasinya.

Saya akan membuat reservasi segera tentang hasilnya: tujuannya bukan kode program, tetapi perumusan prinsip-prinsip pemikiran buatan , berfungsi BUKAN berdasarkan realitas fisik, seperti organisme biologis, tetapi berdasarkan SYNTACISIS. Penggemar tes Turing, jaringan saraf dan pembelajaran mesin tidak perlu khawatir.

Perhatian, materinya tebal.

Bak air dingin


Untuk menghindari harapan yang tidak berdasar dengan snapshot berbahaya berikutnya dalam komentar, saya akan segera menunjukkan Vanya yang Wajar dalam bentuk yang tidak dapat ditampilkan. Jadi, saya mengunggah awal Emelya dan mencoba bertanya - seperti di kelas sastra di sekolah dasar.

Teks asli:

Suatu hari ada seorang tua. Dia memiliki tiga putra: dua pintar, yang ketiga - bodoh Emelya. Saudara-saudara itu bekerja, dan Emelya berbaring di atas kompor sepanjang hari, dia tidak ingin tahu apa-apa.
Setelah saudara-saudara pergi ke pasar, dan para wanita, menantu perempuan, mari kita kirim dia:
- Turun, Emelya, untuk air.
Dan dia memberi tahu mereka dari kompor:
- Keengganan ...
- Turun, Emelya, kalau tidak saudara-saudara akan kembali dari pasar, mereka tidak akan membawakanmu hadiah.
- Baiklah kalau begitu.
Emelya menangis dari kompor, bersepatu, berpakaian, mengambil ember dan kapak dan pergi ke sungai. Dia memotong es, mengambil ember dan mengaturnya, dan dia melihat ke dalam lubang. Dan Emel melihat tombak di lubang es.

Dialog:


Namun, teks dapat diadaptasi - jadi katakanlah:

Orang tua itu memiliki tiga putra. Putra pertama pintar. Putra kedua pintar. Putra ketiga adalah orang bodoh. Emelya adalah putra ketiga lelaki tua itu. Emelya baik.
Putra tertua bekerja sepanjang hari, dan Emelya berbaring di atas kompor.
Suatu kali saudara-saudara berangkat ke pasar. Menantu perempuan memberi tahu Emele:
- Ambil air.
Emelya menjawab dari kompor:
- Aku tidak akan pergi mengambil air.
Menantu perempuan mengatakan:
- Saudara hadiah tidak akan membawamu.
- Baiklah kalau begitu.
Emelya turun dari kompor, bersepatu, berpakaian, mengambil ember dan kapak. Kemudian Emelya pergi ke sungai.
Emelya memotong es dan mengambil ember. Dan Emel melihat tombak di lubang es. Pike adalah seekor ikan. Emelya menangkap tombak.

Setelah adaptasi, berjalan dengan baik:


Semua sama, dalam teks-teks sastra itu sangat membingungkan. Terlepas dari segalanya, Vanya benar-benar berpikir , tidak seperti banyak saudara laki-lakinya, terutama dibuat berdasarkan jaringan saraf, yang hanya berpura-pura masuk akal, tetapi pada kenyataannya mereka tidak lebih dari boneka plastik. Jika Anda ingin tahu mengapa, baca terus.

Saya menyampaikan deskripsi pengembaraan intelektual secara langsung.

Latar belakang teoritis


Saya beralasan sebagai berikut.

Apa masalah utama AI? Fakta bahwa komputer tidak dapat memahami arti kata-kata, masing-masing, menjadi "masuk akal." Selain itu, diyakini bahwa orang itu masuk akal, karena mereka memahami kata-kata yang diucapkan oleh lawan bicaranya.

Faktanya, bukan hal yang orang-orang tidak cerdas. Kata itu sendiri berarti tidak lebih dari huruf yang membuatnya (pada kenyataannya, garis melengkung) atau suara (getaran udara). Sense muncul hanya sebagai hubungan antara bunyi-bunyi huruf sebagai unsur-unsur ucapan artikulasi, karena asosiasi yang stabil, termasuk karena koneksi dengan dunia persepsi visual. Sebagai contoh, lawan bicara menunjuk ke subjek dan berkata: "Ini adalah pohon." Dan Anda mengerti bahwa item ini disebut pohon.

Chatbot (dimana kami setuju untuk memahami AI yang berurusan secara eksklusif dengan percakapan) tidak dapat menunjuk ke subjek dan berkata: "Ini adalah pohon", karena tidak adanya mata chatbot, yaitu, kamera video. Dimungkinkan untuk menjelaskan hanya dengan kata-kata, tetapi bagaimana Anda menjelaskan, jika dia tidak mengerti ucapan manusia ?!

Untungnya, hubungan antara unsur-unsur ucapan didefinisikan, dan cukup sulit: sintaks bertanggung jawab atas mereka. Akibatnya, teks apa pun yang dikonstruksikan sesuai dengan hukum sintaksis mengandung beberapa makna yang ditetapkan dalam sintaksis. Sepupu "glock" yang sangat terkenal, yang terkenal dan tak tertandingi dalam visibilitas - yang, ternyata, telah lama terikat pada penelitian komputer.

Dari memoar seorang kawan tentang 70-an yang jauh:

Gloka Kuzdra
Pada Juli 2012, seorang ahli datang ke Konsep saya dan berkata, "Glokaya Kuzdra." Saya mengerti. Itu adalah tanda keterlibatan dalam bidang semantik yang dulunya umum ....
"Cuzdra shteko budlanula bokra dan kudlachat kokrenok yang berkilauan."
Pada tahun 70-an, mereka terlibat dalam kecerdasan buatan di Pusat Komputasi Akademi Ilmu Pengetahuan Uni Soviet, di IPU Akademi Ilmu Pengetahuan Uni Soviet, dan beberapa lembaga lainnya. Termasuk ada arahan yang bergerak dalam terjemahan mesin. Masalahnya belum terpecahkan selama bertahun-tahun, ambiguitas semantik tidak memungkinkan untuk menerjemahkan makna tanpa konteks. Tidak jelas bagaimana memformalkan konteks dalam program komputer. Maka, D. A. Pospelov / mungkin / membagikan contoh yang menggambarkan sulitnya terjemahan ini. Dia mengambil frasa, yang terdiri dari kata-kata yang tidak berarti, tetapi pada saat yang sama, dalam struktur kalimat dan bunyi kata-kata, itu menciptakan asosiasi identik yang benar-benar jelas untuk orang yang sama sekali berbeda. Efek pemahaman ini tidak dapat dicapai oleh mesin. Memang, Gloky Kuzdra - semacam kambing jahat - dia, tentu saja, sangat kuat menendang seekor kambing dan melakukan sesuatu yang keterlaluan untuk seorang anak ... Seminar terjemahan mesin juga diadakan di IPU, dan saya melihat daftar isi di papan tulis: “Gloky Kuzdra. Seminar akan diadakan pukul 14.00 di kamar 425. "

Bantuan Penulis frasa ini adalah ahli bahasa terkenal, akademisi Lev Vladimirovich Shcherba. Akar kata-kata yang tercakup di dalamnya diciptakan secara artifisial, sufiks dan akhiran memungkinkan Anda untuk menentukan bagian mana dari kata-kata yang dimiliki kata-kata ini dan memperoleh makna dari frasa tersebut. Dalam buku L. V. Uspensky, "The Word on Words," makna umumnya diberikan: "Sesuatu dari jenis kelamin perempuan melakukan sesuatu pada beberapa jenis kelamin laki-laki sekaligus, dan kemudian mulai melakukan sesuatu yang panjang, bertahap dengan anaknya. ".
Sumber kuchkarov.livejournal.com/13035.html

Atas dasar "glock cuzdra", dialog yang lengkap dapat dibangun.

- Siapa budlan bokra?
- Kuzdra.
- Siapa yang memukul dadanya?
- Juga sepupu.
Seperti apa dia?
- Glock.
- Bagaimana kamu budlanul bokara?
- Shteko.

AI seperti itu, yang sepenuhnya bebas untuk berkomunikasi dengan dirinya sendiri, tidak akan dapat memahami arti dari kata-kata yang digunakannya: ia tidak akan menyadari apa itu "shtek", atau siapa yang "bokr", atau bagaimana mungkin untuk menyodok. Tetapi apakah benar-benar karena alasan ini dapat dianggap bahwa AI tidak masuk akal, dan seseorang, makhluk biologis yang sempurna, "memahami" semantik dari ekspresinya sendiri, sepenuhnya berpikir, tidak seperti AI? Kelengkapan ...

Orang tidak melihat benda, tetapi mengamati panorama titik-titik berwarna - pada kenyataannya, kacau. Objek terbentuk bukan di dunia luar, tetapi di otak manusia, dengan menghubungkan titik-titik berwarna bersama-sama, menjadi agregat terpisah. Ini berarti bahwa kita ada di dunia khayalan tertentu, yang dalam arti tertentu adalah apa yang telah kita bangun.

Saya membaca bahwa beberapa suku primitif tidak melihat pesawat di langit - tidak terlihat, itu saja. Saya juga membaca bahwa orang-orang India tidak melihat kapal-kapal Columbus mendekati pantai, karena ... mereka tidak memperhatikan. Dan mereka memperhatikan setelah mereka dijelaskan bagaimana cara melihatnya - yaitu, bagaimana menghubungkan piksel warna ke objek tertentu. Saya percaya kisah pseudo-geografis ini: paradoks visual semacam itu tampaknya masuk akal bagi saya.

Seseorang tidak memiliki alasan untuk percaya bahwa pemikirannya terstruktur dalam beberapa cara khusus, oleh karena itu prinsip "sepupu kesalahan" adalah satu-satunya cara untuk membuat seseorang rasional, baik itu obrolan bot atau seseorang . Anda dapat menggunakan berbagai alat, tetapi konsepnya tidak bersyarat. Saya pikir begitu sebelum mulai bekerja dan tidak berubah pikiran pada akhirnya.

Perpustakaan


Setelah mengatur tugas, saya mulai mencari di google tentang perpustakaan yang cocok untuk C #.

Kemudian kekecewaan pertama menunggu saya: tidak ada yang cocok, dalam hal apa pun gratis, ditemukan. Semua jenis modul yang sudah jadi untuk implementasi chat bots tidak diperlukan, saya tertarik bekerja dengan bentuk kata. Tampaknya lebih mudah:

a) menentukan fitur morfologis bentuk kata,
b) mengembalikan bentuk kata dengan fitur morfologis yang diperlukan?

Leksikon terbatas, jumlah tanda juga. Dan masalahnya sangat berguna, setiap hari ... Itu tidak ada di sana!

Tidak menemukan apa-apa, dalam amarah saya mencoba mengkodekan faktor penentu karakter morfologis sendiri. Entah bagaimana saya tidak langsung bertanya. Mengenai hal ini pengembaraan intelektual saya akan berakhir dengan sangat baik, di pelabuhan keberangkatan, jika diulang, lebih teliti, google tidak mengungkapkan beberapa perpustakaan gratis, yang akhirnya saya gunakan. Seperti biasa, terima kasih kepada para penggemar.

Perpustakaan pertama adalah Solarix . Banyak hal memungkinkan, tetapi karena kompetensi saya yang rendah dan kekurangan finansial (perpustakaan hanya sebagian gratis), saya menggunakan parser gratis tanpa syarat yang mem-parsing teks dan menulis hasilnya ke file.

Contoh parser Solarix
<?xml version='1.0' encoding='utf-8' ?>
<parsing>
<sentence paragraph_id='-1'>
<text>   .</text>
<tokens>
<token>
<word></word>
<position>0</position>
<lemma></lemma>
<part_of_speech></part_of_speech>
<tags>:|:|:|:|:|:</tags>
</token>
<token>
<word></word>
<position>1</position>
<lemma></lemma>
<part_of_speech></part_of_speech>
<tags>:|:|:|:|:0|:|:|:|:|:|:0</tags>
</token>
<token>
<word></word>
<position>2</position>
<lemma></lemma>
<part_of_speech></part_of_speech>
<tags>:|:0|:|:|:</tags>
</token>
<token>
<word></word>
<position>3</position>
<lemma></lemma>
<part_of_speech></part_of_speech>
<tags>:|:|:|:|:|:</tags>
</token>
<token>
<word>.</word>
<position>4</position>
<lemma>.</lemma>
<part_of_speech></part_of_speech>
<tags></tags>
</token>
</tokens>
</sentence>
</parsing>


LingvoNET, . , .

, .

, . : . , .


, .

Solarix – , . , , .

:

1. ,
, .
.
« » – , , , : .

2. ,
.
, , .

3. , , .
, , .
.

4. ( , - , ..)
, – .

5. « ». «», . « », .

– – , … , ?

– :


, , – :

  • , ,
  • (, ).

, , . , : ( ).

– –


, , ? : .

:
.
, ?

, :

1. ( ) – , .
2. ( ) – , .
3. – .

. : – – , .

:
.
:
.

, .


, .

:
.
:
.
, ( , – ), .

«» «» – , , , , . , : , «» .

: .
.
.
.

, , :
.

, :

1. . , .
.
:
[Noun] . : - .

2. . , .
.
:
[verb] . : [] .

3. . .
.
« [noun]» , -: .

4. . .
:
.
:
.

5. : .
.
:
. .
.


( ) – : , , , , , , – , Solarix. , . : , , ( ) ..

(, : ), . , , . «5 », : « 3 7 »: , .

, , :

• – ,
• – ( ),
• – ,
• – ( ),
• – ,
• – .


, ( ). – .

: .

, .
, .

:
. .
. .


. , .

, , .
.

:
. .

, .
.

.

, , , , , .

:
.
, ? , , , , … ? , !
[Noun] . . : - . .

, : – , – . : , , .

– .
, . , ? , , . , , .

, ( . ).



. !

, , , , .

, , :

• (, , ),
• ,
• ( ),
• ( : ),
• ,
• ,
• ,
• .


, . , ?

, . , «», «», « », « » ..

, «».
, .
, : «».

, – .
, .
, , , , . , , ?
, .
- , – , – , . , ? , , , – , .

- : – , – . ( : - ).


. , , .


, , , :


, , ? , , : . :
.
.
.

, , - .

, .

, :

• ( ),
• , ,
• ( , ),
• (. ),
• ( , , , ),
• ( ),
• ( , , «», , ),
• ( «», «»).

.


, ? . .

:
— , ?
— .
— ?
— .


, :
— ?
— .
— ?
— .

– – .

– , , .


:

1. ( ).
2. (, ).
3. ( ).
4. ( ).
5. .

, … , .


. – ? - ? ? -?

.


– , , , - - .


– , , .


-? , , , .

– , . - « », , - ( ) .


.

.

, , . , - « ». , , :
.
.
.
.

..

, . , , . – .

!
:
!
!

«», – «». .


:

1. .
2. .
3. .

– . , : , , .
- ? -, .


.

, – , .
.

, «», :
.

, - :
– .

, , :
.

?.. ??? , , :
.
-, .

: - .


, .

– , «» «».


, «» «» .
?
?
?


. – , , , – . :
: ?
: ?
: ? ?
: ?
: ?
: ?
: ?
: ?
.

.

, , . – .



, , :

  1. , , , . .
  2. , . , , . , .

-, «», «», « », – .

, , . , .

, :
?
«» «» , «» – . , , .

( , ) , .

:
?
«» – , . , .


, , .


, , , .


, , :


: , .

: .


– .


, - :
?

:
? ?
, : , , .

, .


, .

, .

, ?
:
? ?

, . , .


, , . , :
40 .
?
45 .
40 45, ? , , ? , ? , . , , , ?

, , : , ( ) – , – .

:

  1. – , .
  2. .
  3. , , .
  4. , ( , , )).

, .

, ? , . 1 40 , 5 , 31 45 . ?!


, , , , . , .

, -:
.
.
.
.
.
.
.

..

- .

– .


, :
.
.
.
.
.

, , , .
.
.
.
.
.


, . :
.
. , -, , .


, .

( , ) , :
1. .
2. .
3. .

– . , . - , , – .

– , . , .

, «» ( ). , .

:


:


, , , …


( , ) . , – , - «». , , .

:

  1. . , .
  2. . , - , . , .

, , .

.
-, – , .


, , .
«» «». , , ?


. «» « »? , – . . ( ), – -, .

– . : , (, , , ) , .


, – : . : , « – », . .

, , , .


– (, , , ). , ( ).


, . . , - , , , , , .


, , . , .

, , .


, - , … , : « – ». , ? «» . ( ) , , . (- ) , «» (, ) , , .

, , . ?! .


, (- ).

, . , . , . , .
, :
, .
, !
, , , , !

. : – – .

? , . , , , ..


, :

) , , , ,
) , , , .

, , , , .

, – .

, :
.
.

, , .

, .


, , , , , , . :
?
, :
?

, , . , , .
, :


– . - , -. – .

:


, !

, , .
. .
, , , , - , . , ?!

, , !


, .

, - : « ( ) ! !»
! , , .

, . - , , : , , . , - ( , ) . - .

, , : – - . : .

, .

, , :
?
? , : . , :
.
, : .

, – , . , – . , – , – .

. , , , :
— ?
— .


, , . ( ), – ().
.
.

:
- .
.


, .

:
?
« ?» , «» – . :
, ?
, – .

, , . ?

, :
— ?

, .
, :
15 30 .
. , , – ! – :
15 30 28 34 .
.

, , ?! , , …

, . , – .


, , , – , – . - ! : - , . , - SQL-.

, 3 ( ) – 3 . -, -, .
- , .

:
?
«» – «», «» – «», 3 :
.
.
.


, , . , :
.

, : SQL-. , , …

, , SQL-, .

-, :
?
?
?


-, – . «?» , , , .

? SQL-, , .

. , ?!

:
.
:
?
:
?
, , , :
?
?

.

, , , -! SQL-: , .

, . , , : , . , . , : – ; – ( «» ). , « », .

, , . : . , n , . :
.
, -, . ( , , ) .

. … , .


:

1. Solarix.
2. , .
3. .
4. .
5. , ().
6. ( ).
7. ( LingvoNET).
8. .
9. .


, . :

1. -, . , , . , , , .

2. -, ( ) . , ? , ? , , , . – .

, , , …

1) .
:
« ».
« », – .
. , , – . , , .

2) .
, , - . , , . -, , , , , , , . ( ) , , , , , «» . , , …

.

, . , – , « »?!

32- Microsoft Office Windows. 64- Windows Microsoft Access Database Engine 2010 (32-).

.

, . , – , , , . , , , . , .

, . : , , – . , , – .

, . ( ), – . , :
– . , .
– . . .

:
– . – , .
– . . .

: , «», «». , - . : , , , , … !

, , - , , : , . .

.
.
.
– .
.
.
.
, .
..

, , , , — .

:
, – .

– ( , . – . , .. , – ).
– .

. , :



:
.
: .


, , .

, .

, , - - .


. : , . , , , , , – .

Source: https://habr.com/ru/post/id420197/


All Articles