Sepatah kata tentang proses, atau kita semua sedikit kontrasepsi .Lanjutan Refleksi pada Pikiran Alami dan Buatan (AI), Bagian Satu ada di siniPertanyaan untuk pengisian ulang : apakah seseorang tinggal sekarang? Tidak ketika kita berjalan di sepanjang jalan dan secara langsung merenungkan dunia di sekitarnya, kita bertindak lebih atau kurang
realtime ... Meskipun dalam kenyataannya - sejauh ini apa yang kita lihat akan melalui mekanisme pengakuan / klasifikasi yang biasa - semua ini akan baru, tetapi masih masa lalu. Yaitu Apakah seseorang hidup di masa lalu?
Misalnya: Anda berjalan di sepanjang jalan, melihat seekor anjing. Atau mobil. Bagaimanapun, jika kita berbicara tentang momen, informasi ini sudah usang. Jika kita beroperasi pada data yang telah melalui semua mekanisme kognitif kita (dan otak jauh dari kalkulator tercepat!) Kita tidak akan bisa mengimbangi dunia! Anjing akan menyerang atau sebaliknya - ia akan lari, dan keinginan Anda untuk menepuknya di belakang telinga akan tetap tidak terpenuhi, dan mobil akan menjatuhkan Anda atau melewati Anda, meskipun Anda ingin "menangkap" mobil khusus ini.
Tapi alhamdulillah tidak terjadi seperti ini, dan inilah sebabnya: otak bekerja secara berbeda. Unit persepsi bukanlah objek, atau bahkan totalitas objek, tetapi proses. Anjing itu berlari. Untuk Anda atau dari Anda. Atau tidak lari, tetapi kebohongan, misalnya. Mobil juga stasioner (di tempat parkir), atau bergerak ke arah tertentu. Dalam semua kasus, Anda melihat suatu proses yang memiliki waktu yang lama dan, dengan demikian, perkembangan tertentu di masa depan. Ketika saya mengatakan bahwa kita melihat peristiwa yang terjadi dalam waktu - ini bukan kiasan. Lakukan eksperimen - ambil selusin foto (mis., Gips instan kenyataan) dan jelaskan apa yang Anda lihat. Berikut adalah beberapa orang di ruangan itu, mereka bertengkar, atau di sini seorang pria berjalan di sepanjang jalan, atau di sini dia duduk - menonton TV, dan dia sedang membaca buku. Ini semua adalah proses yang menghabiskan waktu! Anda menganggap pemeran instan sebagai sesuatu yang memiliki panjang. Anda tidak tahu bagaimana melakukannya secara berbeda, karena otak bekerja seperti itu: ia dilatih untuk mengenali proses, bukan objek yang berbeda di atas panggung. Sama seperti bukan mata-hidung-mulut, tetapi wajah dalam kompleks (halo, jaringan saraf convolutional).
Dunia terdiri dari proses, bukan objek. Jika Anda bertanya apa itu
apel , kebanyakan orang dewasa akan mengatakan bahwa itu adalah
buah / buah , dan anak-anak akan mengatakan bahwa itu adalah
makanan . Namun keduanya merupakan deskripsi proses, karena yang pertama berarti apel ini
tumbuh di pohon dan melayani pohon untuk diperbanyak, dan yang kedua - yang
dapat dimakan . Tidak satu pun yang terhubung dengan tanda-tanda langsung dari apel - bentuk, warna, ukuran ... Karena tanda-tanda memungkinkan Anda untuk mengidentifikasi, tetapi tidak memungkinkan untuk digunakan, atau untuk memahami di mana itu digunakan di dunia, yaitu mengidentifikasi dengan tepat prosesnya.
Jika kita mengambil debat tipikal tentang sifat waktu, maka postulat klasik adalah tentang tidak berubahnya masa lalu (di luar konteks perjalanan waktu), pentingnya masa kini (hanya ada sesaat ...;)), dan masa depan, yang belum ada, yang berarti dapat diubah. Ketika kita berbicara tentang realitas objektif, mungkin memang begitu. Namun, seseorang hidup dalam model subyektifnya sendiri tentang dunia, dan di sana semuanya hampir kebalikannya!
Masa lalu jauh dari tidak berubah-ubah seperti yang kita inginkan. Terus-menerus menerima informasi baru, seseorang merekonstruksi masa lalu untuk menghilangkan kontradiksi (
Anda pikir Pyotr Stepanych di sebuah simposium, dan ia meninggalkan klub telanjang ... Ini berarti di mana-mana, ia, seorang penghibur, tidak pergi dan umumnya ... ). Pada saat yang sama, masa depan subjektif Anda dalam banyak aspek adalah konstan (
apa pun itu, tetapi pada hari Jumat saya minum bir dan sepak bola! ). Tidak hanya itu, memiliki tujuan yang pasti di masa depan, Anda tidak hanya akan membangun rantai proses dalam urutan terbalik (
Untuk menjadi direktur sebuah perusahaan besar, Anda harus lulus dari universitas bergengsi dengan ijazah, untuk ini Anda harus terlebih dahulu memasukkannya, untuk ini Anda harus lulus Ujian Negara Bersatu, ajarkan pawai ini pelajaran! ), tetapi juga sangat mungkin - kembalilah dalam proses (
bukankah kita memiliki teman / kenalan yang kini telah meningkat dan terus berhubungan dan dapat membantu anak dengan universitas ) - apa yang bukan alat? ;)
Namun, saya sedikit terganggu. Namun, hal utama yang ingin saya fokuskan adalah
proses . Saya sangat yakin bahwa potensi AI perlu dilatih bukan pada foto atau bahkan dalam video. Jaringan konvolusional memiliki dua level (minimum) - dan pada kenyataannya ini adalah dua jaringan yang berbeda: satu dilatih untuk menemukan pola grafik tertentu dalam gambar mentah, yang kedua berkaitan dengan output yang pertama - yaitu. dengan informasi yang sudah diproses dan disiapkan. Agar berhasil berinteraksi dengan dunia AI, Anda memerlukan hal yang sama: pada tingkat (jauh dari yang pertama), harus ada jaringan yang menerima peta proses yang dikerahkan waktu. Konsep "awal" dan "akhir", "gerakan", "transformasi", "merger" dan "pemisahan" adalah apa yang harus dipelajari jaringan untuk bekerja dengannya.
Saya cukup yakin bahwa mereka yang terlibat dalam game AI, seperti Alpha Go, mengerti dengan cara ini. Mungkin pendekatan di sana agak berbeda, tetapi esensinya sama: situasi saat ini di papan tulis (dan dalam pembukaan untuk beberapa gerakan terakhir) dianalisis untuk apa yang "terjadi sama sekali". Dan tergantung pada seberapa banyak yang terjadi sesuai dengan apa yang seharusnya terjadi, gerakan Anda sendiri dipilih.
Sangat sulit untuk berbicara tentang strategi / perilaku ketika gambar input dari sensor. Dan sebaliknya - vektor yang disiapkan yang berisi keselarasan penuh dari keadaan saat ini dari lapangan dalam game dengan informasi lengkap (hitung gambar penuh dunia) adalah tugas yang layak, seperti yang ditunjukkan oleh latihan. Namun, jika jaringan konvolusional dari tingkat pertama mengidentifikasi objek, dan tingkat berikutnya menganalisis objek-objek ini dalam dinamika, mengidentifikasi proses (akrab dari pelatihan, misalnya) melengkapi data yang diperoleh sebelumnya, maka tampaknya mungkin untuk bekerja dengan ini ...
Pertanyaan untuk para ahli:Seberapa realistis itu, mengingat perkembangan saat ini pada jaringan saraf, untuk melakukan sesuatu seperti ini:
Pada input , misalnya, sinyal video kontinu, mungkin stereo. Sebagai pilihan: dengan beberapa derajat kebebasan (kemampuan untuk memutar kamera - sewenang-wenang, atau sesuai dengan skema). Namun, jika perlu, sinyal video dapat ditambahkan / diganti dengan metode persepsi spasial lainnya - dari sonar ke lidar.
Sebenarnya ...pada input tersebut dapat ada aliran waktu nyata - setidaknya ucapan / teks, setidaknya kutipan mata uang, tetapi ... Dalam proses yang sedang dipertimbangkan, lebih mudah bagi saya untuk mengandalkan satu-satunya contoh alasan yang tersedia bagi saya untuk studi langsung - milik saya! ) Dan dalam "sampel" ini saluran indera berada di luar persaingan!
Keluaran:- Peta kedalaman (jika kamera statis) atau peta lingkungan. spasi (kamera / lidar dinamis, dll.);
Untuk apaHal ini diperlukan jika kita ingin memiliki penataan ruang objek nyata untuk mengevaluasi interaksi mereka. Dalam hal ini, gambar dari kamera hanya merupakan proyeksi dua dimensi dari ruang yang lebih besar, dan diperlukan transformasi tambahan.
- Memilih objek individual (dengan mempertimbangkan kedalaman / peta ruang, dan tidak hanya / tidak begitu banyak kontur yang terlihat);
- Menyoroti objek bergerak (kecepatan / akselerasi, merencanakan / memprediksi lintasan (?));
- Klasifikasi hierarkis objek sesuai dengan atribut yang dapat dipulihkan (bentuk / dimensi / warna / nuansa gerakan / Komponen (?)). Yaitu dasarnya mengambil metrik untuk ruang Hilbert .
tentang hierarkimungkin kata "Hierarkis" tidak sepenuhnya sesuai dalam kasus ini. Saya ingin menekankan bahwa dimungkinkan kapan saja untuk memilih metrik sehingga
jarak Heming di antara mereka memungkinkan kita untuk mempertimbangkan dua set metrik yang berbeda sebagai satu konsep. Seperti "mobil merah" dan "Blue bus" harus digeneralisasi menjadi konsep "kendaraan", misalnya.
Penting: jika mungkin, sistem tidak dilatih sebelumnya. Yaitu beberapa hal dasar dapat diletakkan (misalnya, jaringan konvolusional dari lapisan pertama, untuk menyorot kontur / geometri), tetapi Anda harus belajar memilih objek dan kemudian mengenalinya sendiri.
- Dan akhirnya, pembangunan sapuan (berdasarkan paragraf 1.4, yaitu, peta spasial dengan memperhitungkan metrik) dalam waktu (untuk sekarang, pada tahap ini, periode yang diamati secara langsung terlihat), dengan tujuan menganalisis poin 2-4, s. untuk mengidentifikasi: proses / peristiwa (yang pada dasarnya adalah perubahan waktu dalam klausa 3) dan klasifikasi klusternya (klausa 4).
Sekali lagi: dari gambar dari sensor, pertama-tama kita mengekstrak deskripsi dunia dalam bentuk yang lebih siap, diberi label sesuai dengan atribut yang dapat dipulihkan dan dibagi bukan menjadi piksel, tetapi menjadi objek. Kemudian kami memperluas dunia, yang terdiri dari objek-objek dalam waktu, dan mengirimkan "gambar dunia" yang dihasilkan ke input jaringan berikutnya, yang bekerja dengannya seperti lapisan sebelumnya dengan gambar sentuhan berfungsi. Di mana kontur objek menonjol, sekarang "kontur" dari proses yang sedang berlangsung akan dibedakan. Posisi relatif benda di ruang angkasa mirip dengan hubungan sebab akibat dari proses dalam waktu ... Entah bagaimana.
Agaknya setelah ini, sistem harus dapat mengenali proses dengan bagian-bagian mereka (sebagai mampu mengidentifikasi gambar, hanya memiliki fragmen dari mereka, atau sebagai
kelanjutan penulisan teks sesuai dengan model ), dan sebagai hasilnya - untuk memprediksi mereka, baik maju dan mundur dalam waktu, memperluas model Klausa 5 tidak terbatas di kedua arah. Juga, mungkin, memiliki gagasan tentang proses komposit, sistem dapat mengungkapkan proses yang lebih luas, global dan, sebagai akibatnya, tersirat, yang merupakan bagian dari global yang diidentifikasi, tetapi tidak secara langsung dirasakan, oleh beberapa proses lokal terkait.
Nah dan yang terakhir: memiliki kondisi tetap sistem di masa mendatang (di mana hanya elemen signifikan dari metrik Hilbert yang diperbaiki, dengan interpretasi bebas dari sisanya, bukan nilai signifikan) - apakah jaringan dapat "menebak" sisanya?
Baik i.e. jika itu adalah gambar di mana hanya dua fragmen terputus yang ditentukan - dapatkah jaringan dilatih pada beberapa sampel menyelesaikan gambar penuh "konsisten"? Sampel dalam kasus ini adalah interval waktu yang sama dari percobaan, fragmen adalah keadaan saat ini dan yang diberikan. Hasil: "cerita" yang konsisten menghubungkan satu dan yang lainnya ...
Menurut saya ini sudah menjadi dasar yang sangat besar untuk percobaan lebih lanjut:
- memasukkan tindakan sendiri dalam "sejarah", jika mungkin / perlu
- prioritas pola sebab-akibat "reguler" di atas emisi stokastik yang tidak terkendali (masalah roulette)
- semacam rasa ingin tahu, yaitu pengetahuan aktif tentang pola melalui tindakan ... dll
PS Saya sepenuhnya mengakui bahwa saya baru saja menciptakan sepeda, dan orang-orang berpengetahuan telah lama menerapkan prinsip-prinsip ini dalam praktik. ;) Dalam hal ini, saya meminta Anda untuk "menyodok hidung Anda" dalam perkembangan yang sesuai. Dan akan sangat luar biasa jika ada deskripsi terperinci tentang masalah mendasar dari pendekatan ini atau alasan mengapa ini tidak bekerja secara prinsip.
PPS Saya sadar bahwa teksnya kasar, dan pemikiran itu melonjak dari satu ke yang lain, tetapi saya benar-benar ingin menanyakan beberapa orang pertanyaan-pertanyaan ini (bagian "pertanyaan untuk para ahli"), dan ini sulit dilakukan tanpa setidaknya presentasi.
Teks sebelumnya (dan saya membacanya kembali sekarang, dan menyadari bahwa itu sangat sulit untuk dipahami) memenuhi tugasnya: Saya menerima beberapa diskusi yang berharga bagi saya ... Saya harap kali ini juga! ;)
UPD: Terlepas dari kekurangan - diskusi masih terjadi, yang saya sangat senang!
UPD2: Daftar tautan pada suatu topik yang diberikan oleh orang yang berbeda di waktu yang berbeda, atau menemukannya sendiri:
- Tentang segmentasi, populer: ribuan ...
- Dan jika diperkuat oleh penglihatan stereo? Satu , dua dan katakanlah tiga ...
- Itu semua tentang OpenCV, matematika murni, tanpa neuron. Dan Anda dapat menggabungkannya , atau lebih ... Namun.
- Jika, sesuai dengan set metode objek yang disebutkan sebelumnya, objek dipilih, maka serangkaian tanda untuk melacaknya di masa depan mungkin dapat dibentuk dengan cepat ...
- Mengapa Anda perlu mencari pendekatan lain ketika ada Pembelajaran Penguatan besar?
- Jaringan pra-terlatih yang menyoroti tindakan pada video ... Sulit untuk mengatakan seberapa berlaku hal ini dalam kasus kami, tetapi menarik!