Kemajuan dan sensasi dalam penelitian ai

Masalah terbesar dengan AI bukanlah bahwa itu bodoh tetapi kurangnya definisi untuk kecerdasan dan karenanya kurangnya ukuran untuk itu [1a] [1b] .


Tes Turing bukan ukuran yang baik karena gorila Koko tidak akan lulus meskipun dia bisa menyelesaikan lebih banyak masalah daripada banyak manusia cacat [2] .


Sangat mungkin bahwa orang-orang di masa depan mungkin bertanya-tanya mengapa orang-orang pada tahun 2019 berpikir bahwa seorang agen yang dilatih untuk memainkan permainan tetap dalam lingkungan yang disimulasikan seperti Go memiliki kecerdasan [3a] [3b] [3c] [ 3c] [3d] [3e ] [3f] [3g] [3h] .


Intelijen lebih tentang menerapkan / mentransfer pengetahuan lama ke tugas-tugas baru (bermain Quake Arena dengan cukup baik tanpa pelatihan setelah menguasai Doom) daripada mengompresi pengalaman agen menjadi heuristik untuk memprediksi skor game dan menentukan tindakan agen dalam kondisi permainan tertentu untuk memaksimalkan skor akhir ( bermain Quake Arena cukup baik setelah jutaan pertandingan setelah menguasai Doom) [4] .


Kecerdasan manusia adalah tentang kemampuan untuk beradaptasi dengan dunia fisik / sosial, dan bermain Go adalah adaptasi khusus yang dilakukan oleh kecerdasan manusia, dan mengembangkan algoritma untuk belajar bermain Go adalah yang lebih berkinerja, dan mengembangkan teori matematika tentang Go mungkin bahkan lebih banyak pemain.


Lebih masuk akal untuk membandingkan AI dengan manusia bukan dengan efektivitas dan efisiensi produk akhir adaptasi (dalam permainan yang dimainkan antara AI dan manusia) tetapi dengan efektivitas dan efisiensi proses adaptasi (dalam permainan yang dimainkan antara agen yang mempelajari mesin dan agen kode manusia setelah latihan terbatas) [5] .


Dota 2, StarCraft 2, Civilization 5 dan mungkin bahkan GTA 5 mungkin diselesaikan dalam waktu yang tidak terlalu lama tetapi kemampuan untuk memainkan game baru di level manusia tanpa pelatihan sebelumnya akan jauh lebih signifikan.


Masalah terbesar kedua dengan AI adalah kurangnya ketahanan dalam situasi panjang yang belum pernah terjadi sebelumnya (termasuk yang kritis dalam perawatan kesehatan [6a] , kendaraan self-driving, keuangan) yang saat ini tidak dapat ditangani dengan akurasi bahkan mendekati dapat diterima [6b ] [6c] [6d] [6e] [6f] .


Model kompleks mengeksploitasi setiap pola yang menghubungkan input ke variabel output tetapi beberapa pola mungkin tidak berlaku untuk kasus yang tidak tercakup oleh data pelatihan [bagian "kemajuan"] [7a] [7b] [7c] . > 99% dari aplikasi perawatan kesehatan menggunakan model sederhana seperti regresi logistik (pengetahuan domain diubah menjadi kode untuk menghitung statistik sebagai fitur) untuk menghindari korelasi palsu dan mendapatkan lebih banyak kekuatan pada outlier [8a] [8b] .


Untuk agen dalam lingkungan yang disimulasikan seperti Go atau Quake, model lingkungan yang sebenarnya diketahui atau tersedia sehingga agen dapat menghasilkan data pelatihan dalam jumlah berapa pun untuk mempelajari cara bertindak secara optimal dalam situasi apa pun. Menemukan korelasi dalam data itu tidak cerdas - untuk masalah dunia nyata menemukan model yang benar adalah kunci [9a] [9b] [9c] [9d] [9e] .


Untuk suatu organisme, dunia nyata bukanlah permainan tetap dengan lingkungan dan aturan yang diketahui seperti Go atau Quake, tetapi permainan dengan lingkungan dan aturan yang sebagian besar tidak dikenal dan selalu berubah [10] . Itu harus beradaptasi dengan perubahan lingkungan dan aturan yang tidak terduga termasuk perubahan yang disebabkan oleh musuh. Itu harus mampu otonomi luas bukan hanya otomatisasi yang diperlukan untuk memainkan beberapa permainan tetap.


Mungkin menjadi mustahil untuk memiliki kendaraan yang bisa mengemudi sendiri dan robot humanoid yang beroperasi bersama manusia tanpa melatih mereka untuk memperoleh kemampuan beradaptasi tingkat manusia dengan dunia nyata. Mungkin menjadi mustahil untuk memiliki asisten pribadi yang menggantikan manusia dalam aspek-aspek kunci dari kehidupan mereka tanpa melatih mereka untuk mendapatkan kemampuan beradaptasi tingkat manusia dengan dunia sosial [11a] [11b] [11c] .


pengetahuan vs kecerdasan


Pengetahuan adalah beberapa informasi, seperti data dari pengamatan atau percobaan, dikompresi dan diwakili dalam beberapa bentuk yang dapat dihitung, seperti teks dalam bahasa alami, teori matematika dalam bahasa semi-formal, program dalam bahasa formal, bobot jaringan saraf tiruan atau sinapsis otak .


Pengetahuan adalah tentang alat (teori, program, proses fisik) untuk menyelesaikan masalah. Intelegensi adalah tentang menerapkan (mentransfer) dan menciptakan (belajar) pengetahuan [12] . Ada pengetahuan bagaimana memecahkan masalah (program untuk komputer, buku teks untuk manusia), dan kemudian ada proses menerapkan pengetahuan (menjalankan program dengan komputer, menyimpulkan dan melaksanakan instruksi oleh manusia), dan kemudian ada proses menciptakan pengetahuan (inferensi induktif / belajar dari pengamatan dan eksperimen, penalaran deduktif dari teori yang disimpulkan dan model yang dipelajari - baik oleh komputer atau manusia).


Alpha (Go) Zero jauh lebih dekat dengan pengetahuan bagaimana memecahkan kelas masalah tertentu daripada agen cerdas yang mampu menerapkan dan menciptakan pengetahuan. Ini adalah algoritma pencarian seperti IBM Deep Blue dengan heuristik yang tidak dikodekan tetapi disetel selama sesi permainan. Itu tidak bisa menerapkan pengetahuan yang dipelajari untuk masalah lain - bahkan bermain di papan Go yang lebih kecil. Itu tidak dapat membuat pengetahuan abstrak bermanfaat bagi manusia - bahkan wawasan sederhana tentang taktik Go. Meskipun mungkin membangkitkan wawasan yang berguna pada manusia jika bermain dengan taktik yang tidak biasa.


TD-Gammon dari tahun 1992 dianggap oleh banyak orang sebagai terobosan terbesar dalam AI [13a] [13b] . TD-Gammon menggunakan algoritma TD (λ) dengan pembaruan on-kebijakan online. Penulis TD-Gammon menggunakan variasinya untuk mempelajari strategi taruhan IBM Watson [13c] . Alpha (Go) Zero juga kira-kira merupakan variasi dari TD (λ) [13d] . TD-Gammon menggunakan jaringan saraf yang dilatih oleh pembelajaran Perbedaan Temporal dengan nilai target yang dihitung menggunakan pencarian pohon dengan kedalaman tidak lebih dari tiga dan menggunakan hasil permainan yang dimainkan sampai akhir sebagai perkiraan nilai daun. Alpha (Go) Zero menggunakan jaringan saraf dalam yang dilatih oleh pembelajaran Perbedaan Temporal dengan nilai target yang dihitung menggunakan Pencarian Pohon Monte-Carlo dengan kedalaman yang jauh lebih besar dan menggunakan perkiraan nilai daun dan tindakan kebijakan yang dihitung oleh jaringan tanpa bermain game sampai akhir.


Perbedaan kualitatif antara Backgammon dan Go sebagai masalah dan antara TD-Gammon dan Alpha (Go) Zero sebagai solusi (skala jaringan saraf dan jumlah game yang dimainkan menjadi perbedaan utama) tidak hampir sebesar perbedaan kualitatif antara game informasi sempurna seperti Go dan permainan informasi yang tidak sempurna seperti Poker (AlphaZero tidak berlaku untuk Poker, DeepStack tidak berlaku untuk Go dan Chess).


IBM Watson, sistem penjawab pertanyaan paling canggih pada tahun 2011, bukanlah agen yang cerdas. Ini adalah pengetahuan yang direpresentasikan sebagai ribuan baris logika yang dikodekan secara manual untuk mencari dan memanipulasi urutan kata-kata serta menghasilkan hipotesis dan mengumpulkan bukti, ditambah beberapa ratus parameter yang disetel dengan regresi linier untuk menimbang berbagai potongan pengetahuan untuk setiap jenis pertanyaan yang didukung dan jawab [14a] [14b] [14c] . Ini tidak jauh berbeda secara konseptual dari mesin basis data yang menggunakan statistik data dan nilai ambang hardcoded untuk menyusun rencana untuk mengeksekusi kueri yang diberikan melalui pemilihan dan penyaringan sebagian dari algoritma yang diimplementasikan untuk memanipulasi data.


IBM Watson dapat menerapkan logikanya untuk ekstraksi dan integrasi informasi tekstual (pengetahuan internal) ke teks-teks baru (pengetahuan eksternal). Namun, itu tidak dapat menerapkan pengetahuannya untuk masalah selain menjawab pertanyaan factoid terbatas tanpa diberi kode untuk melakukannya oleh manusia. Dapat dikodekan untuk mencari bukti yang mendukung hipotesis dalam makalah tentang kanker tetapi hanya menggunakan logika kode manusia untuk menafsirkan teks (mengekstraksi dan mencocokkan kata-kata yang relevan) dan tidak pernah melampaui itu untuk menafsirkan teks sendiri (model pembelajaran dunia dan memetakan teks ke simulasi pada model itu). Pendekatan sebelumnya untuk menafsirkan teks sudah cukup untuk Jeopardy! [15] tetapi itu tidak cukup ketika tidak ada jawaban sederhana. Ada perbedaan besar antara membuat kesimpulan menggunakan properti statistik teks dan menggunakan properti statistik fenomena dunia nyata yang diperkirakan dengan simulasi pada model yang dipelajari dari fenomena itu.


IBM Watson tidak dapat membuat pengetahuan baru - IBM dapat menyimpulkan fakta-fakta sederhana dari sumber-sumber pengetahuan (teks dan basis pengetahuan) menggunakan algoritma yang dikodekan oleh manusia tetapi tidak dapat menginduksi teori dari sumber dan memeriksa kebenarannya. WatsonPaths menghipotesiskan grafik kausal menggunakan pencarian teks yang relevan dengan kasus [16a] [16b] tetapi inferensi rantai sebagai pendekatan untuk penalaran tidak dapat cukup kuat - kesimpulan harus diperiksa dengan simulasi atau eksperimen seperti yang dilakukan oleh otak.


apa itu kecerdasan?


Ahli biologi mendefinisikan kecerdasan sebagai kemampuan untuk menemukan solusi non-standar untuk masalah non-standar (dengan kata lain, kemampuan untuk menangani hal-hal yang tidak diketahui, yang bertentangan dengan yang diketahui dan yang tidak diketahui) dan membedakan sifat ini dari refleks / naluri yang didefinisikan sebagai solusi standar untuk masalah standar [17a] [17b] . Playing Go tidak dapat dianggap sebagai masalah non-standar untuk AlphaGo setelah bermain jutaan game. Mendeteksi malware baru dapat dianggap sebagai masalah non-standar tanpa solusi tingkat manusia sejauh ini.


Sebagian besar peneliti fokus pada pendekatan top-down untuk intelijen dengan pelatihan end-to-end model, yaitu mendefinisikan tujuan untuk masalah tingkat tinggi (misalnya memaksimalkan probabilitas yang diharapkan untuk menang) dan mengharapkan model untuk belajar menemukan solusi untuk subproblem tingkat rendah dari masalah awal (mis. Ko fight in Go) [18a] . Pendekatan ini bekerja untuk masalah yang relatif sederhana seperti game tetap dalam lingkungan simulasi tetapi membutuhkan sejumlah besar episode pelatihan (beberapa kali lipat lebih besar daripada jumlah yang dapat dialami oleh agen di dunia nyata) dan mengarah ke solusi yang tidak mampu digeneralisasikan (model AlphaGo dilatih di papan 19x19 secara efektif tidak berguna untuk papan 9x9 tanpa pelatihan ulang penuh). Masalah tingkat tinggi yang paling sulit yang dapat dipecahkan oleh manusia bersifat terbuka - manusia tidak mencari dalam ruang tetap dari solusi yang mungkin tidak seperti AlphaGo [18b] . Diinformasikan dan dibimbing oleh pengamatan dan percobaan di dunia nyata, manusia menghasilkan subproblem yang baik, misalnya relativitas khusus dan umum.


Beberapa peneliti [bagian "petunjuk arah yang memungkinkan"] fokus pada pendekatan bottom-up, yaitu mulai dengan beberapa tujuan tingkat rendah (misalnya memaksimalkan kemampuan untuk memprediksi dinamika lingkungan, termasuk efek tindakan agen terhadap lingkungan), kemudian menambahkan beberapa tingkat yang lebih tinggi tujuan untuk motivasi intrinsik agen (misalnya memaksimalkan kemajuan belajar atau memaksimalkan pilihan yang tersedia) [19a] [19b] , dan hanya kemudian menambahkan tujuan tingkat tinggi untuk masalah yang menarik bagi manusia (misalnya memaksimalkan skor permainan) [19c] . Pendekatan ini diharapkan dapat mengarah pada solusi yang lebih umum dan kuat untuk masalah tingkat tinggi karena belajar dengan tujuan tingkat rendah seperti itu dapat menyebabkan agen untuk juga belajar perilaku self-directing dan self-correcting membantu dalam situasi non-standar atau berbahaya dengan nol informasi tentang mereka secara efektif disediakan oleh tujuan tingkat tinggi. Perlunya beradaptasi / bertahan hidup menyediakan tujuan optimalisasi bagi organisme untuk memandu pengaturan diri dan pembelajaran / evolusi [20a] [20b] , dan beberapa organisme dapat menetapkan tujuan tingkat tinggi untuk diri mereka sendiri setelah dilatih / dikembangkan untuk memenuhi tujuan tingkat rendah . Sangat mungkin bahwa beberapa set tujuan tingkat rendah universal mungkin berasal dari beberapa persamaan yang mengatur aliran energi dan informasi [21a] , sehingga optimasi dengan tujuan tersebut [bagian "petunjuk arah yang mungkin"] dapat mengarah pada kecerdasan komputer di cara analog dengan bagaimana evolusi Semesta diatur oleh hukum fisika mengarah ke kecerdasan organisme [21b] .


Sementara memecahkan masalah tingkat tinggi dalam lingkungan simulasi seperti Go memiliki keberhasilan, menyelesaikan masalah tingkat rendah seperti visi dan robot belum memiliki keberhasilan seperti itu. Manusia tidak bisa belajar bermain Go tanpa terlebih dahulu belajar membedakan papan dan menempatkan batu. Komputer dapat memecahkan beberapa masalah tingkat tinggi tanpa kemampuan untuk memecahkan masalah tingkat rendah ketika masalah tingkat tinggi disarikan dari subproblem tingkat rendah oleh manusia [22a] . Ini adalah masalah tingkat rendah yang lebih kompleks secara komputasional untuk manusia dan komputer, meskipun tidak harus lebih kompleks seperti masalah matematika atau rekayasa [22b] . Ini adalah masalah tingkat rendah yang merupakan jalan menuju akal sehat, yaitu memperkirakan masuk akal hipotesis sewenang-wenang dari pengamatan yang diperoleh atau dibayangkan dan dari semua pengetahuan yang diperoleh sebelumnya, yang diperlukan untuk mesin untuk beradaptasi dengan lingkungan yang sewenang-wenang dan untuk menyelesaikan secara sewenang-wenang. masalah tingkat tinggi di lingkungan itu [22d] .


hambatan


Kendala terbesar pertama untuk aplikasi di lingkungan dunia nyata sebagai lawan dari yang disimulasikan tampaknya menjadi tujuan yang tidak dibatasi untuk optimasi dalam mempelajari model lingkungan [23a] . Setiap model yang cukup kompleks yang dilatih dengan tujuan yang tidak dibatasi akan mengeksploitasi pola apa pun yang ditemukan dalam data pelatihan yang menghubungkan input dengan variabel target tetapi korelasi palsu tidak akan serta merta menggeneralisasi untuk menguji data [bagian "kemajuan"] [23b] [23c] [23d] . Bahkan miliar contoh tidak membatasi optimisasi secara memadai dan tidak mengarah pada peningkatan kinerja utama dalam pengenalan gambar [24a] [24b] . Agen menemukan cara mengejutkan untuk mengeksploitasi lingkungan simulasi untuk memaksimalkan tujuan yang tidak dibatasi cukup untuk mencegah eksploitasi [25a] [25b] .


Salah satu cara untuk membatasi optimisasi secara memadai untuk menghindari solusi yang tidak dapat digeneralisasikan dan tidak kuat adalah data yang lebih informatif untuk pelatihan, misalnya, menggunakan fisika dari dunia nyata atau dinamika dunia sosial sebagai sumber sinyal sebagai lawan dari lingkungan simulasi dengan agen buatan atau lingkungan fisik terbatas tanpa agen permusuhan - yang terakhir tidak mewakili kasus sudut yang akan dihadapi oleh agen di dunia nyata / sosial yang tidak dibatasi [26a] . Cara lain adalah tujuan yang lebih kompleks untuk optimasi, misalnya, belajar untuk memprediksi tidak hanya statistik yang menarik, seperti imbalan kumulatif di masa depan secara kondisional pada tindakan agen berikutnya, tetapi juga dinamika, yaitu beberapa sifat masa depan yang sewenang-wenang dari lingkungan yang dikondisikan secara kondisional pada beberapa peristiwa masa depan hipotetis sewenang-wenang secara arbitrer termasuk tindakan agen selanjutnya [26b] [26c] [26d] [26e] . Negara dan hadiah sesuai dengan ringkasan statistik agen untuk interaksi dengan lingkungan sementara dinamika sesuai dengan pengetahuan agen tentang bagaimana lingkungan bekerja [27a] [27b] . Kemajuan agen dalam belajar untuk memprediksi dinamika lingkungan [bagian "petunjuk arah yang mungkin"] [28a] [28b] [28c] serta kemajuan agen dalam menciptakan opsi untuk mempengaruhinya [bagian "petunjuk arah yang memungkinkan"] [28d] [28e] [ 28f] mungkin jenis motivasi intrinsik agen yang paling kuat dan mungkin cara paling efisien untuk membatasi optimasi.


Kendala terbesar kedua tampaknya adalah kesenjangan yang sangat besar antara kompleksitas lingkungan simulasi yang tersedia untuk komputer saat ini dan kompleksitas lingkungan dunia nyata yang tersedia untuk robot saat ini sehingga agen yang terlatih dalam lingkungan simulasi tidak dapat ditransfer ke robot di dunia nyata. -Lingkungan dunia dengan kinerja dan ketahanan yang dapat diterima [29] . Tim Boston Dynamics tidak pernah menggunakan pembelajaran mesin untuk mengendalikan robot mereka - mereka menggunakan pemecah real-time persamaan diferensial untuk menghitung dinamika dan kontrol optimal untuk model robot dan lingkungan yang tidak dipelajari dari data tetapi ditentukan secara manual [30] . Peneliti MIT tidak menggunakan pembelajaran mesin untuk mengendalikan robot mereka di DARPA Robotics Challenge 2015, dan robot mereka adalah satu-satunya robot yang tidak jatuh atau membutuhkan bantuan fisik dari manusia [31a] . Peristiwa ekor mungkin tidak dapat dipelajari oleh model statistik [31b] , yaitu melalui pembentukan hyperplane pemisah dari model itu dan menggunakannya sebagai batas keputusan untuk tindakan yang mungkin, dan mungkin memerlukan beberapa bentuk inferensi non-statistik, yaitu melalui penginduksian. model / teori yang logis untuk peristiwa tersebut, menarik hipotesis darinya dan memeriksanya dalam eksperimen. Dengan demikian tidak hanya statistik tetapi dinamika fenomena mungkin harus dihitung - model mungkin harus diprogram atau dilatih untuk mensimulasikan dinamika fenomena [31c] .


Sangat mungkin bahwa satu-satunya cara untuk melatih / mengembangkan agen dengan kecerdasan yang cukup untuk masalah sulit di dunia nyata (seperti robot) dan di dunia sosial (seperti pemahaman bahasa alami) mungkin berubah menjadi:
(1) untuk melatih / mengembangkan agen di lingkungan yang menyediakan banyak kendala untuk optimasi seperti dunia nyata dan sosial (mis. Agen mungkin harus robot yang beroperasi di dunia nyata bersama manusia);
(2) untuk melatih / mengembangkan agen pada masalah yang menyediakan banyak kendala untuk optimisasi sebagaimana masalah tersulit yang dipecahkan oleh organisme di dunia nyata (mis. Agen mungkin harus belajar untuk bertahan hidup sebagai robot di dunia nyata tanpa bantuan langsung dari manusia) dan diselesaikan oleh manusia di dunia sosial (yaitu agen mungkin harus belajar untuk mencapai tujuan di dunia nyata menggunakan komunikasi dengan manusia sebagai satu-satunya alat).


kemajuan


Dapat diperdebatkan selama periode renaisans Deep Learning belum ada kemajuan dalam masalah dunia nyata seperti robotika dan pemahaman bahasa yang hampir sama pentingnya dengan game tetap yang berjalan di lingkungan simulasi.


Pendapat tentang kemajuan penelitian AI dari beberapa peneliti paling realistis:


Michael I. Jordan [32a] [32b] [32c]
Rodney Brooks [33a] [33b]
Philip Piekniewski [34a] [34b]
Francois Chollet [35a] [35b]
John Langford [36a] [36b]
Alex Irpan [37]


Metode Deep Learning sangat tidak kuat dalam tugas pemahaman gambar [makalah tentang generalisasi dan contoh permusuhan di bawah ini] [38a] [38b] [38c] [38d] [38e] [38f] .
Metode Deep Learning belum mendekati penggantian ahli radiologi [39a] [39b] [39c] [39d] .
Metode Deep Learning sangat tidak kuat dalam tugas pemahaman teks [makalah tentang generalisasi dan contoh permusuhan di bawah ini] [40a] [40b] .
Metode Deep Learning tidak dapat melewati level pertama dari game Atari yang paling sulit [41] .


"ObjectNet: Dataset yang dikendalikan Bias Skala Besar untuk Mendorong Batas Model Pengenalan Objek"
"Mendekati CNN dengan Model Fitur-fitur lokal-Tas Bekerja Sangat Baik di ImageNet"
"Mengukur Kecenderungan CNN untuk Mempelajari Keteraturan Statistik Permukaan"
"Invariansi yang Berlebihan Menyebabkan Kerentanan Adversarial"
"Apakah Model Generatif Dalam Tahu Apa Yang Tidak Mereka Ketahui?"
"Apakah Pengklasifikasian ImageNet Menyamaratakan ke ImageNet?"
"Apakah CIFAR-10 Classifiers menggeneralisasi ke CIFAR-10?"
"Pembelajaran Mendalam untuk Segmentasi Tumor Otak: Dampak Pelatihan dan Pengujian Lintas Institusional"
"Variabel Perancu Dapat Menurunkan Kinerja Generalisasi Model Pembelajaran Mendalam Radiologis"
"Contoh Musuh Alami"
"Satu Serangan Piksel untuk Menodai Jaringan Neural Dalam"
"Rotasi dan Terjemahan Cukup: Membodohi CNN dengan Transformasi Sederhana"
"Contoh Musuh Semantik"
"Mengapa Jaringan Konvolusional yang Dalam Menyamaratakan dengan Buruk ke Transformasi Gambar Kecil?"
"Gajah di Kamar"
"Memukul (dengan) sebuah Pose: Jaringan Saraf Mudah Tertipu oleh Posisi Aneh dari Objek yang Dikenal"
"Pemicu Universal Universal untuk Menyerang dan Menganalisa NLP"
"Aturan Musuh Setara Semantis untuk Mendebugkan Model NLP"
"Tepat untuk Alasan yang Salah: Mendiagnosis Heuristik Sintaksis dalam Inferensi Bahasa Alami"
"Menyelidiki Pemahaman Jaringan Saraf pada Argumen Bahasa Alami"


kemungkinan arah


Juergen schmidhuber


"Data menjadi sementara menarik bagi beberapa pengamat subyektif yang memperbaiki diri, tetapi terbatas secara komputasional begitu ia belajar untuk memprediksi atau mengompresi data dengan cara yang lebih baik, sehingga membuatnya lebih subyektif dan lebih indah. Keingintahuan adalah keinginan untuk membuat atau menemukan lebih banyak data non-acak, non-arbitrer, reguler yang baru dan mengejutkan bukan dalam arti tradisional Boltzmann dan Shannon tetapi dalam arti memungkinkan untuk kemajuan kompresi karena keteraturannya belum diketahui. Drive ini memaksimalkan ketertarikan, yang pertama turunan dari keindahan subjektif atau kompresibilitas, yaitu, kecuraman kurva belajar. Ini memotivasi mengeksplorasi bayi, ahli matematika murni, komposer, seniman, penari, pelawak, diri sendiri, dan sistem buatan. "

Kecerdasan dapat dilihat sebagai kemanjuran kompresi: semakin seseorang dapat mengompres data, semakin banyak orang dapat memahaminya. Contoh peningkatan kemanjuran kompresi: 1. pengamatan mentah orbit planet 2. eposiklik geosentris Ptolemaic 3. elips heliosentris 4. mekanika Newtonian 5. mekanika umum 5. relativitas umum 6.? Di bawah pandangan ini, kompresi data adalah pemahaman, peningkatan kompresor adalah pembelajaran, kemajuan perbaikan adalah penghargaan intrinsik. Untuk mempelajari secepat mungkin tentang sepotong data, seseorang harus mengurangi secepat mungkin jumlah bit yang diperlukan untuk mengompresi data itu. Jika seseorang dapat memilih data mana yang akan diamati atau dibuat, orang harus berinteraksi dengan lingkungan dengan cara untuk mendapatkan data yang memaksimalkan penurunan bit - kemajuan kompresi - dari semua yang sudah diketahui.


"Prinsip Algoritma Sederhana di balik Kreativitas, Seni, Sains, Musik, Humor"
"Teori Resmi Kegembiraan dan Kreativitas"


"Teori Resmi Kreativitas dan Kegembiraan dan Motivasi Intrinsik"
"Eksplorasi Aktif, Keingintahuan Buatan & Yang Menarik"


"Didorong oleh Kemajuan Kompresi: Prinsip Sederhana Menjelaskan Aspek Esensi Keindahan Subjektif, Kebaruan, Kejutan, Ketertarikan, Perhatian, Keingintahuan, Kreativitas, Seni, Sains, Musik, Lelucon"
"Teori Resmi tentang Kreativitas, Kegembiraan, dan Motivasi Intrinsik"
"Minimax Tanpa pengawasan: Keingintahuan Adversarial, Jaringan Adversarial Generatif, dan Minimalisasi Prediktabilitas"
"Pembelajaran Penguatan Didorong Curiosity untuk Perencanaan Gerakan pada Humanoids"
"Apa yang Menarik?"
"PowerPlay: Melatih Pemecah Masalah yang Semakin Umum dengan Terus Mencari Masalah Paling Sederhana yang Belum Terpecahkan"


Alex Wissner-Gross


"Sistem intelijen perlu mengoptimalkan entropi sebab-akibat di masa depan, atau untuk membuatnya dalam bahasa yang sederhana, memaksimalkan pilihan masa depan yang tersedia. Yang pada gilirannya berarti meminimalkan semua situasi tidak menyenangkan dengan sangat sedikit pilihan. Ini masuk akal dari sudut pandang evolusi karena konsisten dengan kemampuan untuk bertahan hidup, itu konsisten dengan apa yang kita lihat di antara manusia (mengumpulkan kekayaan dan melakukan lindung nilai atas banyak hal yang tidak dapat diprediksi) dan menghasilkan perilaku yang masuk akal dalam beberapa situasi permainan sederhana. "

"Persamaan untuk Kecerdasan"
"Fisika Kecerdasan Umum Buatan"


"Kecerdasan itu Nyata"
"Kecerdasan Membingungkan Kecerdasan"


"Pasukan Entropik Kausal"


Filip piekniewski


"Dengan memecahkan masalah yang lebih umum dari prediksi fisik (untuk membedakannya dari prediksi statistik), input dan label menjadi sepenuhnya seimbang dan masalah seleksi manusia menghilang sama sekali. Label dalam kasus tersebut hanyalah versi waktu dari input mentah sinyal. Semakin banyak data berarti lebih banyak sinyal, berarti perkiraan yang lebih baik dari manifold data yang sebenarnya. Dan karena manifold itu berasal dari kenyataan fisik (tidak, itu belum diambil sampel dari serangkaian gaussians yang independen dan terdistribusi secara identik), maka tidak mengherankan menggunakan fisika sebagai paradigma pelatihan dapat membantu mengungkapnya dengan benar. Selain itu, menambahkan parameter harus diseimbangkan dengan menambahkan lebih banyak kendala (lebih banyak sinyal pelatihan). Dengan begitu, kita harus dapat membangun sistem yang sangat kompleks dengan miliaran parameter (kenangan) ) belum beroperasi pada prinsip yang sangat sederhana dan kuat. Kompleksitas sinyal nyata dan kekayaan data pelatihan dimensi tinggi dapat mencegahnya dari pernah menemukan "murah", spu solusi serius. Tetapi biaya yang harus kita bayar, adalah bahwa kita perlu menyelesaikan tugas yang lebih umum dan kompleks, yang mungkin tidak mudah dan langsung diterjemahkan ke hal-hal penting yang praktis, setidaknya tidak secara instan. "

"Model Visi Prediktif - Cara Berbeda Melakukan Pembelajaran Jauh"


"Rebooting AI - Postulat"
"Kecerdasan Membingungkan Kecerdasan"
"Kecerdasan Itu Nyata"
"AI Dan Kekeliruan Ludic"
"Persepsi Aneh Tentang Masalah Persepsi"
"Statistik dan Dinamika"
"AI Prediktif VS Reaktif"
"Gunung Intelijen"
"Belajar Fisika Adalah Cara Untuk Pergi"
"Visi Prediktif Singkatnya"


"Visi Mesin Akal Sehat"


"Pembelajaran tanpa pengawasan dari Video Berkelanjutan dalam Jaringan Berulang Prediktif yang Dapat diskalakan"
"Prinsip dasar perhitungan kortikal: pembelajaran tanpa pengawasan dengan prediksi, kompresi, dan umpan balik"


Todd hylton


"Masalah utama dalam komputasi saat ini adalah bahwa komputer tidak dapat mengatur diri mereka sendiri: triliunan derajat kebebasan melakukan hal yang sama berulang-ulang, kemampuan AI yang belum sempurna terfokus. Pendekatan mekanistik kami untuk masalah AI tidak cocok dengan masalah dunia nyata yang kompleks. : mesin adalah penjumlahan dari bagian-bagiannya dan terputus dari dunia kecuali melalui kita, dunia bukanlah mesin.Termodinamika menggerakkan segala sesuatu evolusi Evolusi termodinamika adalah konsep pemersatu yang hilang dalam sistem komputasi Evolusi termodinamika mengandaikan bahwa semua organisasi secara spontan muncul untuk menggunakan sumber-sumber energi bebas di alam semesta dan bahwa ada persaingan untuk energi ini. Evolusi termodinamika adalah hukum kedua termodinamika, kecuali bahwa ia menambahkan gagasan bahwa dalam rangka entropi untuk meningkatkan organisasi harus muncul yang memungkinkan untuk mengakses energi gratis. Hukum termodinamika pertama menyiratkan bahwa ada persaingan untuk energi. "

"Komputasi Termodinamika"
"Komputasi Termodinamika"
"Tentang Termodinamika dan Masa Depan Komputasi"
"Apakah Alam Semesta Produk Evolusi Termodinamika?"
Lokakarya Komputer Termodinamika


"Kecerdasan itu tidak Buatan"
"Of Men and Machines"


"Jaringan Syaraf Termodinamik"


Susanne masih


"Semua sistem melakukan perhitungan dengan cara menanggapi lingkungan mereka. Secara khusus, sistem kehidupan menghitung, pada berbagai skala panjang dan waktu, harapan masa depan berdasarkan pengalaman mereka sebelumnya. Sebagian besar perhitungan biologis pada dasarnya adalah proses non-kalibrasi, karena suatu dominan mesin biologis dalam operasi alami didorong jauh dari keseimbangan termodinamika. Sistem fisik berkembang melalui serangkaian rangsangan input yang mendorong sistem keluar dari keseimbangan dan diikuti oleh relaksasi ke pemandian air panas. "

"Pemrosesan Informasi Optimal"
"Pemrosesan Informasi Optimal: Pembuangan dan Informasi yang Tidak Relevan"
"Batas Termodinamika Pemrosesan Informasi"


"Termodinamika Prediksi"
"Pendekatan Informasi-teori untuk Pembelajaran Penguatan yang didorong oleh Keingintahuan"
"Pendekatan Teori Informasi untuk Pembelajaran Interaktif"


Karl Friston


"Prinsip energi bebas sepertinya merupakan upaya untuk menyatukan persepsi, kognisi, homeostasis, dan tindakan. Energi bebas adalah konsep matematika yang mewakili kegagalan beberapa hal untuk mencocokkan hal-hal lain yang seharusnya mereka prediksi. Otak mencoba untuk meminimalkan Energi bebasnya berkenaan dengan dunia, yaitu meminimalkan perbedaan antara model dan realitasnya. Terkadang ia melakukan itu dengan memperbarui model-model dunianya. Di lain waktu ia melakukannya dengan mengubah dunia agar lebih cocok dengan model-modelnya. Persepsi dan kognisi adalah kedua upaya untuk membuat model yang akurat yang cocok dengan dunia, sehingga meminimalkan energi bebas. Homeostasis dan tindakan keduanya merupakan upaya untuk membuat kenyataan cocok dengan model mental. Tindakan mencoba untuk mendapatkan keadaan eksternal organisme untuk mencocokkan dengan model mental. negara untuk mencocokkan model mental. Karena bahkan bakteri melakukan sesuatu seperti homeostasis, semua kehidupan berbagi prinsip menjadi minimisator energi gratis. ng empat hal - mempersepsikan, berpikir, bertindak, dan mempertahankan homeostasis. Ini benar-benar hanya melakukan satu hal - meminimalkan energi gratis - dalam empat cara yang berbeda - dengan cara tertentu menerapkannya dalam situasi tertentu tergantung pada peluang minimisasi energi gratis mana yang paling nyaman. "

"Prinsip Energi Gratis"
"Energi Gratis dan Inferensi Aktif"
"Inferensi Aktif dan Keingintahuan Buatan"
"Inferensi Aktif dan Keingintahuan Buatan"
"Ketidakpastian dan Inferensi Aktif"


pengantar minimalisasi energi gratis
tutorial tentang inferensi aktif
tutorial tentang energi gratis dan rasa ingin tahu
implementasi


"Prinsip Energi Bebas: Teori Otak Terpadu?"
"Eksplorasi, Kebaruan, Kejutan, dan Minimalisasi Energi Gratis"
"Aksi dan Perilaku: Formulasi Energi Bebas"
"Mekanisme Komputasi Keingintahuan dan Eksplorasi yang diarahkan Tujuan"
"Memperluas Bentang Inferensi Aktif: Lebih Banyak Motivasi Intrinsik dalam Lingkaran Persepsi-Tindakan"


kata penutup


Memecahkan banyak masalah dalam sains / teknik mungkin tidak memerlukan kecerdasan komputer yang dijelaskan di atas - jika komputer akan terus diprogram untuk menyelesaikan masalah non-standar oleh manusia seperti saat ini. Tetapi beberapa masalah yang sangat penting (dan paling hyped) seperti robotik (mengemudi sendiri yang benar-benar tidak dibatasi) dan pemahaman bahasa (benar-benar asisten pribadi) mungkin tetap tidak terpecahkan tanpa kecerdasan tersebut.


versi sebelumnya dari artikel ini

Source: https://habr.com/ru/post/id436458/


All Articles