Google mengajarkan AI untuk menulis artikel bergaya Wikipedia



Google telah lama bekerja di bidang kecerdasan buatan . Semua ini diperlukan untuk perusahaan baik untuk kebutuhan pribadi (meningkatkan pekerjaan berbagai layanan) dan untuk memberikan peluang baru kepada pelanggannya. Sekarang Google telah mengumumkan fungsi baru untuk AI-nya, yang diajarkan untuk "membaca" berbagai teks dan membentuk berdasarkan hasil artikel baca dalam gaya Wikipedia.

AI mengambil bahan dari Internet, dan menganalisisnya, setelah itu menciptakan sesuatu seperti resume. Berdasarkan hasil pekerjaan mereka, karyawan perusahaan menulis artikel yang menunjukkan banyak poin teknis. Ide utama artikel ini - analisis membaca adalah tugas yang sangat sulit untuk mesin. Perusahaan lain mencoba menyelesaikan tugas serupa sebelum Google, tetapi mereka tidak berhasil - sebagian besar proyek serupa gagal.

Tetapi ada yang berhasil. Sebagai contoh, Salesforce dapat melatih jaringan sarafnya untuk mengumpulkan informasi dan menganalisisnya sesuai dengan algoritma yang diberikan. Ini mirip dengan yang dilakukan Google, hasilnya juga tersedia sebagai artikel. Hasilnya bisa disebut memuaskan - jaringan saraf diatasi dengan tugas umum, tetapi teks yang dihasilkan oleh komputer tidak terlalu baik. Kalimatnya, sebagian besar, sederhana dan pendek.

Juga sulit bagi komputer untuk mempertahankan struktur semantik konten, yang dapat diatasi seseorang tanpa kesulitan. Adapun Google, perusahaan ini melakukan sedikit lebih baik. Tawaran yang diberikan komputer lebih panjang dari pada SalesForce dan terlihat lebih alami. Sejauh ini, mesin hanya dapat bekerja dengan teks bahasa Inggris. Di bawah ini adalah contoh dengan dua catatan berbeda. Di sebelah kiri adalah yang ditulis oleh manusia. Di sebelah kanan adalah materi "diketik", informasi yang dicari jaringan saraf pada sumber daya yang berbeda.



Teks yang ditulis komputer agak sulit dibaca karena, misalnya, kurangnya huruf kapital di awal kalimat baru. Selain itu, sebagian besar proposal agak berat. Namun, secara umum, teks ini dibaca dengan baik. Dalam kasus khusus ini, versi final tidak menyertakan semua informasi penting dari sumber, sehingga contoh itu sendiri tidak dapat dianggap sangat indikatif. Namun demikian, jelas bahwa jaringan saraf benar-benar mampu banyak - saat ini adalah pilihan terbaik untuk apa yang dapat dihasilkan komputer setelah menganalisis teks asli.

Sistem mencari informasi tentang topik yang diberikan di situs yang berbeda dan menghasilkan daftar sepuluh halaman paling relevan yang berisi data yang diperlukan. Hasilnya adalah artikel lengkap dengan tautan - dengan format yang sama dengan Wikipedia. Omong-omong, sistem yang dibuat oleh Google adalah belajar mandiri, sehingga setiap halaman yang dibaca dan dibuat membantu komputer untuk meningkat.

Ngomong-ngomong, komputer sengaja memotong kalimat panjang untuk membuatnya lebih seperti gaya yang diadopsi untuk artikel-artikel di ensiklopedia elektronik Wikipedia. Dengan demikian, komputer tidak menulis semuanya sendiri - ia hanya membentuk kalimatnya sendiri, mengurangi yang awal, dari mana beberapa kata dapat dibuang, tanpa merusak makna dari bahan yang dibaca.

Prosesnya tidak bisa disebut terlalu cepat, tetapi hasilnya cukup dapat diterima. Menurut para ahli yang membentuk algoritma, dalam keseluruhan proyek ini "bottleneck" adalah alokasi masing-masing fragmen teks untuk membentuk artikel baru. Semua pekerjaan ini tidak dilakukan terlalu cepat, sehingga algoritma memiliki ruang untuk tumbuh dan berkembang. Perwakilan perusahaan mengatakan bahwa sekarang perangkat lunak dan perangkat keras untuk pekerjaan seperti itu tidak terlalu sempurna, sehingga perusahaan berencana untuk meningkatkan teknologinya lebih lanjut.

Kelemahan utama dari sistem saat ini adalah bahwa komputer mengambil halaman dengan informasi untuk menulis artikel tentang topik berdasarkan popularitasnya (kunjungan, waktu membaca, dll.). Dan jika informasi yang diposting di salah satu halaman tidak terlalu akurat, maka ringkasan yang dibuat komputer juga akan mengandung kesalahan dan ketidakakuratan. Namun demikian, perusahaan berharap bahwa dalam waktu dekat ini akan dapat menunjukkan proses pembuatan teks yang lebih maju.

Source: https://habr.com/ru/post/id410287/


All Articles