MIT memperkenalkan alat interaktif yang menjelaskan mengapa sistem cerdas membuat satu keputusan atau lainnya. Artikel ini adalah tentang cara kerjanya.
/ Unsplash / Randy FathMasalah kotak hitam
Sistem pembelajaran mesin otomatis (AutoML) berulang kali menguji dan memodifikasi algoritma dan parameternya. Menggunakan metode
penguatan pembelajaran , sistem tersebut
memilih model AI yang lebih cocok daripada yang lain untuk memecahkan masalah yang diberikan. Misalnya, untuk mengotomatisasi
dukungan teknis . Tetapi sistem AutoML bertindak seperti kotak hitam, yaitu metode mereka disembunyikan dari pengguna.
Fitur ini sangat menyulitkan debugging algoritma pembelajaran mesin. Dan, misalnya, dalam kasus sistem autopilot, konsekuensinya bisa berakibat fatal. Pada 2016, Tesla dengan autopilot untuk pertama kalinya
menjadi peserta dalam kecelakaan fatal, bertabrakan dengan truk besar. Penyebab kecelakaan tidak dapat dipercaya. Para ahli hanya memiliki asumsi - algoritma
mencampur truk tinggi dengan tanda jalan dipasang di tepi bawah flyover. Dan kesalahan belum dieliminasi - pada awal Maret, Amerika Serikat lagi
mengalami kecelakaan serupa .
Untuk menjelaskan bagaimana algoritma mesin sampai pada satu kesimpulan atau yang lain, insinyur menggunakan teknik posterior atau model yang ditafsirkan seperti pohon keputusan . Dalam kasus pertama, data input dan output digunakan untuk memperkirakan "proses berpikir" dari algoritma. Keakuratan teknik seperti itu buruk.
Pohon keputusan adalah pendekatan yang lebih akurat, tetapi hanya bekerja dengan data yang dikategorikan . Oleh karena itu, untuk masalah yang kompleks, penglihatan komputer tidak nyaman.
Insinyur dari MIT, Universitas Sains dan Teknologi Hong Kong, dan Universitas Zhejiang memutuskan untuk memperbaiki situasi. Mereka
mempresentasikan alat untuk memvisualisasikan proses yang terjadi di dalam kotak hitam. Dia dipanggil ATMSeer.
Bagaimana sistem bekerja
ATMSeer didasarkan pada
Auto-Tuned Models (ATM). Ini adalah sistem pembelajaran mesin otomatis yang mencari model paling efektif untuk menyelesaikan masalah tertentu (misalnya, mencari objek). Sistem secara sewenang-wenang memilih jenis algoritma - jaringan saraf, pohon keputusan, "
hutan acak " atau regresi logistik. Dengan cara yang sama ia menentukan hiperparameter model - ukuran pohon atau jumlah lapisan jaringan saraf.
ATM melakukan serangkaian percobaan dengan data uji, secara otomatis menyetel hyperparameter dan mengevaluasi kinerja. Berdasarkan informasi ini, ia memilih model berikut, yang dapat menunjukkan hasil terbaik.
Setiap model disajikan dalam bentuk semacam "unit informasi" dengan variabel: algoritma, hiperparameter, kinerja. Variabel ditampilkan pada grafik dan diagram yang sesuai. Selanjutnya, para insinyur dapat mengedit parameter ini secara manual dan memantau perubahan dalam sistem intelijen secara real time.
Insinyur MIT menunjukkan antarmuka alat
dalam video berikut . Di dalamnya, mereka memilah beberapa case pengguna.
Panel kontrol ATMSeer
memungkinkan Anda untuk mengelola proses pembelajaran dan mengunduh set data baru. Ini juga menampilkan indikator kinerja semua model pada skala dari nol hingga sepuluh.
Prospek
Para insinyur mengatakan alat baru ini akan berkontribusi pada pengembangan bidang pembelajaran mesin, menjadikan pekerjaan dengan algoritma cerdas lebih transparan. Sejumlah spesialis MO telah
mencatat bahwa dengan ATMSeer mereka lebih percaya diri dalam kebenaran model yang dihasilkan AutoML mereka.
Sistem baru ini juga akan membantu perusahaan memenuhi persyaratan GDPR. Peraturan perlindungan data umum membutuhkan algoritma pembelajaran mesin untuk transparansi . Pengembang sistem yang cerdas harus dapat menjelaskan keputusan yang dibuat oleh algoritma. Ini diperlukan agar pengguna dapat sepenuhnya memahami bagaimana sistem memproses data pribadi mereka.
/ Unsplash / Esther JiaoDi masa depan, Anda dapat mengharapkan lebih banyak alat untuk melihat ke dalam kotak hitam. Misalnya, insinyur dari MIT sedang
mengerjakan solusi lain. Ini akan membantu mahasiswa kedokteran melatih keterampilan menulis sejarah.
Selain MIT, IBM bekerja di bidang ini. Bersama dengan rekan-rekan dari Harvard, mereka memperkenalkan alat Seq2Seq-Vis. Ini
memvisualisasikan proses pengambilan keputusan dalam terjemahan mesin dari satu bahasa ke bahasa lain. Sistem menunjukkan bagaimana setiap kata dalam sumber dan teks akhir dikaitkan dengan contoh-contoh di mana jaringan saraf dilatih. Jadi, lebih mudah untuk menentukan apakah kesalahan terjadi karena input data yang salah atau algoritma pencarian.
Alat-alat yang membuat algoritma pembelajaran mesin lebih transparan juga akan menemukan aplikasi di
ITSM ketika mengimplementasikan Service Desk. Sistem akan membantu dengan pelatihan bot obrolan cerdas, dan akan membantu menghindari situasi ketika mereka
tidak berperilaku sebagaimana dimaksud .
Materi dari blog perusahaan kami:
Dan sebuah blog di Habré: