Komputer menulis prosa, tetapi masih kalah dengan orang. Mengapa



Dua tahun lalu, dalam kontes sastra Jepang, saya hampir memenangkan sebuah cerita yang ditulis oleh kecerdasan buatan. Itu disebut "Hari komputer menulis novel." Meskipun ini kedengarannya seperti perwujudan konyol dari lelucon “cara terbaik untuk menghasilkan satu juta adalah dengan menulis buku, bagaimana membuat satu juta,” ceritanya berlanjut hingga selesai, melewati sekitar satu setengah ribu teks yang ditulis oleh orang-orang. Namun terobosan itu tidak terjadi. Teks fiksi masih ditulis oleh orang-orang, teks non-fiksi - kebanyakan juga.

Beberapa bulan yang lalu, Meanotek mencoba membuat asisten AI untuk menulis dan menulis cerita bersamanya dalam kolaborasi. Spoiler - dia tidak berhasil. Pencipta proyek memberi tahu kami apa gagasan itu dan bagaimana penerapannya. Dan kami mencoba mencari tahu mengapa penyair keluar dari mobil lebih baik daripada penulis prosa.

Saya mengerti bahwa Anda tidak mengerti, bahwa kami tidak mengerti apa-apa


Pada musim panas tahun ini, Yayasan Sistema mengadakan kontes cerita pendek fiksi ilmiah "The Future Time". Para peserta ditanya topik - "Keabadian", dan pemenangnya dijanjikan jackpot solid setengah juta rubel. Ribuan cerita dikirim ke panitia, di antaranya ada yang ditulis menggunakan kecerdasan buatan.


AI bekerja paling baik dalam genre pendek - puisi, kutipan bijak, motivator, dan meme. Tetapi tidak selalu semuanya berjalan seperti yang dimaksudkan. Misalnya, InspiroBot , membuat poster motivasi, memasukkan kata-kata ke dalam hal-hal aneh dan terkadang menyeramkan.

Kisah itu disebut "Katak membentangkan sayapnya . " Ini adalah kisah tentang gadis insinyur Fotino, pemilik seperangkat sifat yang sopan dari para pahlawan cyberpunk noir: kecanduan narkoba, masa lalu yang keliru, penyimpangan mental, kecenderungan bunuh diri, dan refleksi yang tak berkesudahan tentang sifat ilusi dunia. Di antara perjalanan halusinasi, Fotino berusaha memperbaiki AI yang menjalankan kota.
Ini adalah kisah yang ditulis tidak sepenuhnya oleh AI, tetapi hanya dengan partisipasinya. Eksperimennya adalah program khusus tidak digunakan untuk membuat teks, tetapi beberapa blok kode disatukan, yang awalnya dimaksudkan untuk menyelesaikan masalah lain.

Sistem ini menggunakan perpustakaan dari desainnya sendiri, yang, pada gilirannya, menggunakan Pytorch. Dialog disusun oleh chatbot yang dikembangkan sebelumnya, untuk judul dan deskripsi - jaringan berulang yang sangat besar, dilatih tentang teks yang diunduh dari lib.ru.

  • Denis Tarasov ( Durham ), CEO Meanotek.

Aspek yang paling penting dari penulisan - ide dan alur - masih diambil oleh manusia. Menurut Denis, mereka mencoba membuat alat yang hanya membantu penulis, dan tidak berhasil untuknya.
Dialog dengan AI sepenuhnya dihasilkan oleh sistem dan dibiarkan dalam bentuk di mana mereka diterima. Dialog antar karakter sebagian dihasilkan dan kekasaran dihaluskan di sana. Replay yang dihapus dari frasa seperti "Saya mengerti Anda tidak mengerti, bahwa kami tidak mengerti apa-apa." Meskipun sebagian dari ekspresi tersebut tetap ada. Subpos juga semua dihasilkan. Kami mencoba memperbaiki ejaan dan tata bahasa, tetapi ada kemungkinan bahwa lebih banyak kesalahan ditambahkan daripada diperbaiki.

  • Denis Tarasov ( Durham ), CEO Meanotek.

Dalam teks akhir, sulit untuk menentukan jumlah mesin dan teks manusia. Menurut Denis, ada paragraf di mana satu kalimat disusun oleh seseorang, dan yang kedua - sebuah algoritma. “Serangkaian episode tidak akan ada dalam cerita tanpa judul AI dan“ seed ”. Secara umum, gaya fragmen AI memengaruhi gaya penulisan orang. ”

Karya itu mengingatkan, jika orang menyebutnya demikian, suatu perluasan kesadaran tertentu. Setelah menulis kalimat atau paragraf, seseorang beralih tidak hanya pada imajinasinya, tetapi juga terlihat bahwa berdasarkan kata-katanya, sebuah komputer telah dihasilkan. "Pria itu mencoba beradaptasi dengan apa yang dihasilkan, dan, jika mungkin, memasukkan semuanya ke dalam plot yang bermakna," kata Denis.



Namun, kesuksesan rekan Jepang gagal. Kisah itu bahkan tidak masuk daftar panjang. Anggota juri Nikolai V. Kononov menulis tentang "Frog" seperti ini:
Tangan editor terlalu mencolok - dan secara umum, tangan manusia. Pengembang bot, bekerja sama dengan algoritma, menulis sebuah cerita yang tidak mungkin menyebabkan penolakan di antara pembaca fiksi. Dalam hal ini, percobaan itu berhasil.

"Apa yang kebanyakan orang sukai saat ini belum tentu merupakan cerita yang berkualitas," kata Denis. "Kualitas teks masih bisa diperketat, tetapi masalah utama adalah kurangnya plot. Ternyata masing-masing bagian teks mungkin mengandung makna, tetapi mereka tidak memiliki awal dan akhir, tidak memiliki gagasan umum. Hanya saja ada sesuatu yang terjadi, seseorang melakukan sesuatu, berbicara, dan itu tidak berakhir dengan apa pun. "

Tetapi Anda tidak dapat memahami bahwa Anda akan memecahkan masalah yang akan memungkinkan Anda untuk menemukan sesuatu


Ketika kata "Robot" pertama kali diciptakan, kata itu sudah digunakan dalam konteks pertanyaan filosofis "Apakah adil untuk menganggap orang buatan sebagai manusia." Ini adalah permainan oleh Karel apek RUR Kata apa pun juga merupakan pemikiran, dan makna, dan konteks di baliknya. Dengan cara yang baik, penulis pertama-tama menemukan ide dan makna, dan kemudian memilih surat untuk mereka.

Namun, kata-kata itu sendiri tidak lebih dari percekcokan tinta atau piksel pada latar belakang putih.



Masalah besar dengan teks mesin adalah prosesnya sebaliknya. Sistem memilih set kecil kata-kata tertentu dari set yang lebih besar, dan seseorang - membaca - mencoba untuk menemukan artinya di dalamnya, dan beralih ke set ini sampai makna dalam pendapatnya ditemukan.
Sejauh ini, komputer telah belajar menulis puisi dengan cukup baik. Ini bisa dilihat di situs botpoet.com , di mana ada tes yang jelas menunjukkan bahwa sulit untuk membedakan seorang penyair "manusia" dari komputer. Namun dalam banyak ayat koneksi logis dipikirkan oleh pembaca. Dalam prosa (terutama di plot), biasanya lebih jelas, dan komputer masih melakukan hal yang buruk dengan ini. Jaringan saraf sering dilatih tentang berbagai karya oleh satu atau penulis lain, tetapi mereka hanya dapat menghasilkan teks yang serupa, yaitu, mereka meniru gaya, tetapi tidak membuat cerita baru.

  • Alexander Piperski ( apiperski ), ahli bahasa.


Karyawan Yandex menciptakan jaringan saraf, yang dilatih dengan berbagai puisi Rusia, dan kemudian memberi makan teks-teks Pertahanan Sipil dan mengeluarkan puisi dengan gaya Yegor Letov. Mereka juga merekam album musik "404" dan menyebut grup "Neural Defense"

Bagaimana plot disusun secara formal adalah topik penelitian yang sudah berlangsung lama. Sebelum masa kejayaan TI, para peneliti secara manual memilah-milah ribuan teks untuk mencari pola umum. Salah satu contoh paling terkenal adalah buku Joseph Campbell, A Hero with a Thousand Faces. Ini adalah upaya untuk menyimpulkan struktur umum, urutan situasi, yang kurang lebih serupa dalam mitos kebanyakan orang. Vladimir Propp bekerja pada tugas yang sama. Dalam buku "The Morphology of a Fairy Tale", ia mencoba menggambarkan komponen umum cerita rakyat.

Menurut pengetahuan ini, orang diajarkan orang untuk membuat cerita. Studi tentang bentuk plot jatuh ke dalam buku-buku tentang penulisan dan penulisan skenario, di mana mereka berubah menjadi instruksi khusus. Misalnya, penulis skenario Blake Snyder dalam buku "Save the Cat" menggambarkan struktur yang jelas dari film yang bagus menurut pendapatnya, di mana ia mendistribusikan fungsi plot yang diperlukan hingga ke tempat dalam waktu dan jumlah halaman.

Tetapi instruksi untuk orang belum berubah menjadi instruksi untuk mobil.
Lebih sulit untuk memahami struktur plot teks dan plot twists, karena untuk awalnya akan lebih baik untuk menyetujui bagaimana kami menyajikannya secara formal dan kemudian sudah berpikir bagaimana cara mengekstraknya dari teks. Instruksi dari buku teks untuk penulis mungkin dapat dimasukkan ke dalam mobil dalam bentuk aturan dengan beberapa variabel yang diisi secara acak (misalnya, sehingga memilih kota tindakan dari daftar ibu kota Eropa), tetapi ini hampir tidak membawa kita lebih dekat untuk membuat cerita asli. Saya pikir sejauh ini dimungkinkan untuk mengajarkan komputer untuk menganalisis apakah teks baru tertentu lebih dekat dengan teks lama yang sukses atau tidak, dan memberikan rekomendasi kepada penulis, tetapi tidak lebih.

  • Alexander Piperski ( apiperski ), ahli bahasa.

"Untuk saat ini, AI tidak dapat mengevaluasi kualitas cerita, karena pada prinsipnya kriteria kualitas tidak jelas," kata Denis Tarasov. Tetapi jika sangat kasar untuk menyamakan kualitas dan kesuksesan, maka AI dapat melakukan pekerjaan itu.

Tahun lalu, Bestseller Code keluar, di mana penulis skenario Jodi Archer dan Matthew Jokers mencoba menggambarkan kesamaan antara buku-buku sukses. Mereka memasukkan teks-teks buku ke sistem komputer yang dibangun di atas pembelajaran mesin (yang, bagaimanapun, tidak dijelaskan), membandingkannya dengan kesuksesan komersial dan pola-pola bernama yang dapat berkontribusi pada kesuksesan ini - tema, latar, karakteristik para pahlawan dan urutan dalam mengubah keadaan mereka. .
Tidak sulit untuk mendapatkan topik: untuk ini, ada algoritma untuk mengekstraksi kata kunci yang membangun kamus frekuensi dan melihat kata-kata mana yang lebih sering ditemukan daripada rata-rata dalam bahasa. Benar, untuk mempelajari cara mengonversi kata kunci menjadi topik, kita masih harus mencoba: misalnya, jika kita tahu bahwa kata "ciuman", "tender", "malam" dan "lilac" ditemukan dalam teks dengan frekuensi tinggi yang luar biasa, sebuah algoritma yang akan mengurangi kata-kata ini dengan tema "cinta." Atau Anda dapat membagi teks menjadi beberapa kelas berdasarkan topik ("cinta", "petualangan") dan kemudian menyelesaikan masalah pengelompokan teks baru - seperti yang dilakukan, misalnya, dalam agregator berita, di mana Anda perlu memahami apakah teks itu merujuk pada ekonomi, politik, dll. n. Secara umum, tugas ini tampaknya cukup dapat dipecahkan.

Karakteristik para pahlawan juga dianalisis dengan baik. Humaniora Digital melakukan banyak hal ini, yang sering beralih ke penelitian literatur digital. Misalnya, klasik dari area ini, Franco Moretti, secara otomatis dibangun, dan kemudian menganalisis jaringan koneksi antara karakter Hamlet . Pada materi Rusia, misalnya, kelompok Frank Fischer di Sekolah Tinggi Ekonomi, yang menyusun korps drama Rusia RusDraCor, membahas hal ini .

  • Alexander Piperski ( apiperski ), ahli bahasa.


Membuat generator cerita seperti itu bukanlah masalah ilmiah yang besar. Di Internet ada generator cerita tentang prinsip ini dan bahkan generator cerita di mana Anda dapat memilih parameter dan mendapatkan teks dengan kualitas yang berbeda. Ini semua tugas yang harus diselesaikan, hanya perlu menghabiskan waktu dan usaha.

Pertama, urutan acara tingkat atas akan dihasilkan, dan kemudian setiap acara akan dibuka hingga mencapai tingkat kalimat dan huruf. Atau, secara umum, Anda dapat "menulis ulang" cerita populer, mengubah detail di sana dan sekarang cerita populer yang baru sudah siap.

  • Denis Tarasov ( Durham ), CEO Meanotek.

Apakah Anda perlu melakukan apa yang tidak Anda ketahui?


Pertanyaan lain adalah apakah ini masuk akal. Ketika orang mencoba untuk mengotomatisasi dan membuat robot produksi berat, tujuannya jelas - di banyak industri, kemampuan fisik orang telah lama mencapai puncaknya. Tidak ada masalah secara tertulis - masalah-masalah itu jauh dari keparahan fisik persalinan.

Sebaliknya, pembaca lebih sering mengeluh tentang segala upaya untuk mengotomatiskan penulisan, untuk membawanya ke pola dan pola umum. Menonton, misalnya, film, orang lebih cenderung kecewa jika setiap kali pada menit yang ditentukan terjadi twist twist yang sudah diketahui sebelumnya. Dalam film komersial yang mahal, ini terjadi lebih sering, tetapi sepertinya kita tidak menyebutnya sebagai terobosan luar biasa dalam seni dramatis.


Menurut pendapat saya, sistem seperti itu dalam literatur akan sangat merugikan, karena akan menyebarkan berbagai sampah sastra, mengoptimalkannya untuk permintaan pembaca. Sampah seperti itu diproduksi dengan sempurna tanpa generator, dan dengan generator tidak akan ada nafas sama sekali. Untuk menulis cerita yang bagus, Anda perlu memahami kompleksitas hubungan manusia, memahami biologi, fisika, dan banyak lagi, pada tingkat yang baik - dan tidak hanya dapat menambahkan rantai kata-kata yang menyebabkan respons emosional yang diberikan oleh pembaca.

Masalah ini tidak diselesaikan oleh algoritma sederhana apa pun. Kita membutuhkan tingkat kecerdasan dan pengetahuan seseorang, dan orang yang luar biasa. AI harus dapat membangun model dunia itu sendiri dan kemampuan untuk memprediksi hasil dari berbagai peristiwa, dan ini adalah masalah yang tidak terpecahkan sekarang, dan sains baru saja mulai mendekati itu.

Oleh karena itu, arah kami dalam percobaan adalah upaya untuk menggabungkan AI dan manusia.

  • Denis Tarasov ( Durham ), CEO Meanotek.

Di satu sisi, otomasi dapat merusak literatur. Di sisi lain, jika AI hanya menjadi perluasan imajinasi, jika ia menyediakan sesuatu yang tidak akan pernah diciptakan oleh penulis sendiri, maka komputer dapat benar-benar menjadi jalan keluar dari krisis kreatif, pribadi dan global.

Source: https://habr.com/ru/post/id430116/


All Articles