Sekilas ke kotak hitam - sistem baru dari MIT akan menunjukkan bagaimana algoritma pembelajaran mesin bekerja

MIT memperkenalkan alat interaktif yang menjelaskan mengapa sistem cerdas membuat satu keputusan atau lainnya. Artikel ini adalah tentang cara kerjanya.


/ Unsplash / Randy Fath

Masalah kotak hitam


Sistem pembelajaran mesin otomatis (AutoML) berulang kali menguji dan memodifikasi algoritma dan parameternya. Menggunakan metode penguatan pembelajaran , sistem tersebut memilih model AI yang lebih cocok daripada yang lain untuk memecahkan masalah yang diberikan. Misalnya, untuk mengotomatisasi dukungan teknis . Tetapi sistem AutoML bertindak seperti kotak hitam, yaitu metode mereka disembunyikan dari pengguna.

Fitur ini sangat menyulitkan debugging algoritma pembelajaran mesin. Dan, misalnya, dalam kasus sistem autopilot, konsekuensinya bisa berakibat fatal. Pada 2016, Tesla dengan autopilot untuk pertama kalinya menjadi peserta dalam kecelakaan fatal, bertabrakan dengan truk besar. Penyebab kecelakaan tidak dapat dipercaya. Para ahli hanya memiliki asumsi - algoritma mencampur truk tinggi dengan tanda jalan dipasang di tepi bawah flyover. Dan kesalahan belum dieliminasi - pada awal Maret, Amerika Serikat lagi mengalami kecelakaan serupa .

Untuk menjelaskan bagaimana algoritma mesin sampai pada satu kesimpulan atau yang lain, insinyur menggunakan teknik posterior atau model yang ditafsirkan seperti pohon keputusan . Dalam kasus pertama, data input dan output digunakan untuk memperkirakan "proses berpikir" dari algoritma. Keakuratan teknik seperti itu buruk.

Pohon keputusan adalah pendekatan yang lebih akurat, tetapi hanya bekerja dengan data yang dikategorikan . Oleh karena itu, untuk masalah yang kompleks, penglihatan komputer tidak nyaman.

Insinyur dari MIT, Universitas Sains dan Teknologi Hong Kong, dan Universitas Zhejiang memutuskan untuk memperbaiki situasi. Mereka mempresentasikan alat untuk memvisualisasikan proses yang terjadi di dalam kotak hitam. Dia dipanggil ATMSeer.

Bagaimana sistem bekerja


ATMSeer didasarkan pada Auto-Tuned Models (ATM). Ini adalah sistem pembelajaran mesin otomatis yang mencari model paling efektif untuk menyelesaikan masalah tertentu (misalnya, mencari objek). Sistem secara sewenang-wenang memilih jenis algoritma - jaringan saraf, pohon keputusan, " hutan acak " atau regresi logistik. Dengan cara yang sama ia menentukan hiperparameter model - ukuran pohon atau jumlah lapisan jaringan saraf.

ATM melakukan serangkaian percobaan dengan data uji, secara otomatis menyetel hyperparameter dan mengevaluasi kinerja. Berdasarkan informasi ini, ia memilih model berikut, yang dapat menunjukkan hasil terbaik.

Setiap model disajikan dalam bentuk semacam "unit informasi" dengan variabel: algoritma, hiperparameter, kinerja. Variabel ditampilkan pada grafik dan diagram yang sesuai. Selanjutnya, para insinyur dapat mengedit parameter ini secara manual dan memantau perubahan dalam sistem intelijen secara real time.

Insinyur MIT menunjukkan antarmuka alat dalam video berikut . Di dalamnya, mereka memilah beberapa case pengguna.


Panel kontrol ATMSeer memungkinkan Anda untuk mengelola proses pembelajaran dan mengunduh set data baru. Ini juga menampilkan indikator kinerja semua model pada skala dari nol hingga sepuluh.

Prospek


Para insinyur mengatakan alat baru ini akan berkontribusi pada pengembangan bidang pembelajaran mesin, menjadikan pekerjaan dengan algoritma cerdas lebih transparan. Sejumlah spesialis MO telah mencatat bahwa dengan ATMSeer mereka lebih percaya diri dalam kebenaran model yang dihasilkan AutoML mereka.

Sistem baru ini juga akan membantu perusahaan memenuhi persyaratan GDPR. Peraturan perlindungan data umum membutuhkan algoritma pembelajaran mesin untuk transparansi . Pengembang sistem yang cerdas harus dapat menjelaskan keputusan yang dibuat oleh algoritma. Ini diperlukan agar pengguna dapat sepenuhnya memahami bagaimana sistem memproses data pribadi mereka.


/ Unsplash / Esther Jiao

Di masa depan, Anda dapat mengharapkan lebih banyak alat untuk melihat ke dalam kotak hitam. Misalnya, insinyur dari MIT sedang mengerjakan solusi lain. Ini akan membantu mahasiswa kedokteran melatih keterampilan menulis sejarah.

Selain MIT, IBM bekerja di bidang ini. Bersama dengan rekan-rekan dari Harvard, mereka memperkenalkan alat Seq2Seq-Vis. Ini memvisualisasikan proses pengambilan keputusan dalam terjemahan mesin dari satu bahasa ke bahasa lain. Sistem menunjukkan bagaimana setiap kata dalam sumber dan teks akhir dikaitkan dengan contoh-contoh di mana jaringan saraf dilatih. Jadi, lebih mudah untuk menentukan apakah kesalahan terjadi karena input data yang salah atau algoritma pencarian.

Alat-alat yang membuat algoritma pembelajaran mesin lebih transparan juga akan menemukan aplikasi di ITSM ketika mengimplementasikan Service Desk. Sistem akan membantu dengan pelatihan bot obrolan cerdas, dan akan membantu menghindari situasi ketika mereka tidak berperilaku sebagaimana dimaksud .



Materi dari blog perusahaan kami:


Dan sebuah blog di Habré:

Source: https://habr.com/ru/post/id459030/


All Articles