Pembelajaran mesin menghadapi masalah matematika yang belum terselesaikan

Salut, orang Khabrovit! Untuk mengantisipasi peluncuran utas baru pada kursus lanjutan dan dasar "Matematika untuk Ilmu Data" kami ingin membagikan terjemahan yang agak menarik kepada Anda. Tidak akan ada praktik dalam artikel ini, tetapi materi ini menarik untuk pengembangan dan diskusi umum.





Sekelompok peneliti menghadapi masalah matematika terbuka yang terkait dengan serangkaian paradoks logis yang ditemukan oleh ahli matematika terkenal Austria Kurt Gödel pada 1930-an.

Matematikawan yang bekerja pada masalah pembelajaran mesin membuktikan bahwa kemungkinan "belajar", yaitu apakah algoritma dapat mengekstraksi pola dari data yang terbatas, terkait erat dengan paradoks yang dikenal sebagai hipotesis kontinum. Gödel mengatakan bahwa menggunakan kemampuan standar bahasa matematika, hipotesis tidak dapat dikonfirmasi atau disangkal. Temuan penelitian terbaru tentang topik ini diterbitkan di Nature Machine Intelligence pada 7 Januari .

"Itu adalah kejutan bagi kami," kata Amir Yehudaev dari Technion, Institut Teknologi Israel di Haif, yang ikut menulis penelitian ini. Dia mengatakan bahwa di samping sejumlah masalah teknis, yang juga dikenal sebagai "tidak dapat dipecahkan," dia tidak berharap fenomena ini terjadi dalam tugas pembelajaran mesin yang tampaknya sederhana.

John Tucker, spesialis ilmu komputer di Swansea University, Inggris, mengatakan pekerjaan ini adalah "hasil nyata di ujung pengetahuan kita," dengan implikasi mendasar bagi matematika dan pembelajaran mesin.

Tidak semua perangkat sama.


Para peneliti sering menentukan kemampuan belajar dalam hal apakah suatu algoritma dapat menggeneralisasi pengetahuannya. Algoritme memberikan jawaban "ya" atau "tidak", misalnya, untuk pertanyaan "Apakah ada kucing di dalam gambar?" Untuk sejumlah objek, dan kemudian harus membuat perkiraan untuk objek baru yang sebelumnya tidak diketahui.

Yehudaev dan rekan-rekannya memperoleh hasil dengan memeriksa hubungan antara belajar dan "memeras," yang mencakup menemukan cara untuk memetakan karakteristik dari kumpulan data yang besar ke kumpulan yang lebih kecil. Para penulis menemukan bahwa kemampuan informasi untuk dikompresi secara efektif mengurangi pertanyaan tentang teori himpunan - himpunan matematika objek, seperti himpunan dalam diagram Venn. Secara khusus, ini berlaku untuk set berbagai ukuran yang mengandung sejumlah besar objek.

Georg Cantor, pendiri teori himpunan, pada tahun 1870-an membuktikan bahwa tidak semua himpunan tak terbatas sama: misalnya himpunan bilangan bulat "kurang" dari himpunan semua bilangan real, juga dikenal sebagai kontinum. (Karena bilangan real mencakup bilangan irasional, rasional, dan bilangan bulat.) Cantor juga menyarankan bahwa tidak ada set ukuran menengah, yaitu, lebih besar dari himpunan bilangan bulat, tetapi lebih kecil dari kontinum. Tetapi ia tidak dapat membuktikan hipotesis kontinum ini, seperti banyak ahli matematika dan ahli logika - pengikutnya.

Upaya mereka sia-sia. Pada 1940, Godel melakukan penelitian (yang diselesaikan hanya pada 1960-an oleh ahli matematika Amerika Paul Cohen), di mana, dengan menggunakan aksioma, ia membuktikan bahwa hipotesis kontinum dapat benar atau salah.

Karya Gödel dan Cohen tentang hipotesis kontinum mengakui bahwa ada alam semesta matematika paralel yang memenuhi hukum-hukum matematika standar: satu di mana hipotesis kontinum menjadi aksioma yang diterima secara umum, yaitu dinyatakan benar, dan yang kedua di mana ia juga dinyatakan salah.

Belajar tungkai


Dalam karya terbaru mereka, Yehudaev dan rekan-rekannya mendefinisikan pembelajaran sebagai kemampuan untuk membuat prediksi untuk kumpulan data yang relatif besar dengan mengambil sampel sejumlah kecil titik data. Koneksi dengan masalah Cantor adalah bahwa ada banyak cara untuk memilih set yang lebih kecil, tetapi ukuran infinity ini tidak diketahui.

Selanjutnya, penulis menunjukkan bahwa jika hipotesis kontinum benar, maka sampel kecil cukup untuk ekstrapolasi. Tetapi jika itu salah, maka tidak mungkin ada sampel terbatas yang cukup. Dengan demikian, mereka percaya bahwa masalah belajar sebenarnya setara dengan hipotesis kontinum. Akibatnya, masalah belajar juga dalam keadaan ketidakpastian, yang hanya bisa diselesaikan dengan memilih alam semesta aksiomatik.

”Hasil penelitian ini juga membantu membangun pemahaman belajar yang lebih luas,” kata Yehudaev. "Hubungan antara kompresi dan generalisasi ini sangat mendasar dalam memahami proses pembelajaran."

"Para peneliti telah menemukan sejumlah masalah yang" tidak dapat larut "," kata Peter O'Hearn, seorang spesialis ilmu komputer di University College London. Secara khusus, menurut hasil karya Godel, Alan Turing, salah satu pendiri teori algoritma, menemukan kelas pertanyaan yang tidak dijamin program komputer untuk dijawab untuk sejumlah langkah apa pun.

"Namun, ketidakmampuan yang diperoleh dalam studi terbaru sangat langka dan jauh lebih mengejutkan," tambah O'Hearn: itu menunjukkan bahwa Godel menemukan ketidaklengkapan internal dari segala jenis bahasa matematika. Hasil yang diperoleh cenderung penting bagi teori pembelajaran mesin, tetapi ini tidak mungkin memiliki dampak praktis yang besar.

Tulis di komentar apa pendapat Anda tentang materi ini, dan kami mengundang Anda ke webinar gratis , di mana kami akan berbicara tentang metode analisis regresi dalam Ilmu Data .

Source: https://habr.com/ru/post/id484238/


All Articles