Jaringan saraf adalah hal yang keren, tetapi potensinya masih dibatasi oleh biaya dan energi; jaringan saraf biner dapat membantu mengatasi hal ini

Konsep jaringan saraf pertama kali muncul lebih dari 40 tahun yang lalu, ketika para ilmuwan bereksperimen dengan pemodelan matematika fungsi otak. Mereka menemukan cara membuat implementasi mekanis dari jaringan saraf yang dapat diajarkan untuk mengenali pola dan mengklasifikasikan data - misalnya, untuk mengenali jika ada kucing atau anjing di video.
Selama dekade terakhir, kompleksitas dan kemampuan jaringan saraf telah tumbuh secara signifikan. Bersama dengan peningkatan kekuatan superkomputer dan prosesor grafis (GPU) yang murah dan terjangkau, mereka muncul sebagai metode standar untuk menyelesaikan masalah, mengenali pola, dan mendeteksi anomali. Organisasi saat ini menggunakannya untuk membuat prediksi, meneliti preferensi pengguna, memvalidasi data, dan mengelola risiko.
Namun, meskipun digunakan secara aktif, mereka memiliki kelemahan yang membatasi potensi mereka. Holy Grail adalah jaringan saraf yang dapat dengan cepat menganalisis informasi, murah dan tidak membutuhkan energi. Membuat jaringan yang memenuhi kriteria ini adalah tugas yang sulit, tetapi harus dipecahkan sehingga kita dapat mengambil keuntungan dari jaringan saraf yang lebih dekat dengan tepi jaringan TI dan komunikasi, serta pada perangkat terminal.
Salah satu alternatif yang banyak dieksplorasi organisasi adalah jaringan biner. Ini adalah teknologi yang cukup baru, tetapi kemungkinan akan menjadi sangat berpengaruh pada tahun 2020. Untuk memahami alasannya, kita perlu memahami cara kerja kedua jenis jaringan.
Bagaimana cara kerja jaringan saraf?
Jaringan saraf terdiri dari beberapa lapis jumlah tertimbang. Setiap jumlah tertimbang memberikan angka yang menunjukkan bahwa mungkin ada beberapa tanda dalam data ini, atau mungkin tidak ada. Lapisan-lapisan ini menggabungkan, misalnya, gambar mentah ke dalam set fitur, dan menggabungkannya kembali untuk akhirnya sampai pada jawaban.
Sederhananya, katakanlah Anda ingin jaringan saraf dapat mengenali wajah dalam foto. Sistem membagi gambar menjadi segmen-segmen kecil, dan kemudian lapisan jaringan memindai setiap segmen gambar, mencari tanda bahwa mereka telah diajarkan untuk mengidentifikasi. Lapisan pertama, misalnya, dapat mencari fitur dasar: lingkaran hitam, lingkaran putih, persegi panjang putih, warna kulit. Tanda-tanda ini mudah diperhatikan.
Lapisan kedua dapat mencari mata (lingkaran hitam di dalam putih), mulut (satu set persegi panjang putih yang terletak di dekatnya dan dikelilingi oleh kulit), lapisan berikutnya dapat mencari dua mata di atas mulut dan dengan kulit di sekitarnya. Setiap fitur memberikan setiap segmen gambar perkiraan probabilitas kehadiran fitur yang diinginkan di bagian foto ini. Kemudian probabilitas ini digabungkan, dan jika sejumlah lapisan percaya bahwa tanda yang diinginkan ada di foto, maka jaringan menyimpulkan bahwa orang tersebut ada di sana.
Fig. 1Dalam gbr. Gambar 1 (dan ini adalah foto Barack Obama) menunjukkan bagaimana lapisan analisis dan probabilitas ini diringkas, memungkinkan jaringan bekerja dengan nilai perkiraan untuk menghasilkan jawaban yang relatif akurat.
Perhatikan bahwa fitur seperti lingkaran hitam, mata atau mulut tidak diprogram oleh seseorang, tetapi terdeteksi oleh jaringan selama pelatihan. Ada kemungkinan bahwa pola lain (misalnya, hidung, telinga atau garis rambut) lebih cocok untuk pencarian orang, dan keindahan jaringan saraf adalah bahwa mereka dapat digunakan untuk mencari pola-pola tersebut.
Kerugian Jaringan Saraf Tradisional
Masalahnya adalah bahwa dalam mencari akurasi setinggi mungkin ada kebutuhan untuk berurusan dengan tingkat probabilitas dibatasi sangat rinci, dan untuk perhitungan matematis ini diperlukan sumber daya yang serius. Karena penggunaan angka floating point untuk analisis segmen, jaringan saraf membutuhkan daya komputasi, memori, dan waktu yang relatif banyak untuk bekerja.
Meskipun cloud memiliki daya komputasi dan memori yang cukup, banyak aplikasi tepi tidak dapat mengandalkan cloud. Misalnya, robomobiles perlu mengambil keputusan secara instan berdasarkan lingkungannya, dan dalam hal ini mereka tidak dapat mengandalkan komunikasi bandwidth terbatas.
Jaringan saraf yang bekerja dengan angka floating point pada perangkat akhir tidak dapat digunakan. Karena itu, banyak perusahaan menggunakan bilangan bulat aritmatika, yang menghemat sejumlah besar memori dan daya komputasi, tetapi ada cara yang lebih baik - ini adalah tempat jaringan syaraf biner memanifestasikan dirinya.
Cara kerja jaringan biner
Jika jaringan saraf biasa adalah lukisan Picasso, maka jaringan saraf biner adalah sketsa pensil kasar.
Jika jaringan saraf menetapkan setiap segmen probabilitas yang dihitung secara akurat, maka jaringan saraf biner, seperti namanya, mengurangi nilai-nilai yang mungkin menjadi versi hitam dan putih, yaitu menjadi -1 (jika jaringan menganggap bahwa tidak ada tanda dalam fragmen ini), atau + 1 (jika ada).
Sekarang jumlah tertimbang mengevaluasi setiap sifat baik secara positif (mengalikan dengan +1) atau negatif (mengalikan dengan -1), dan alih-alih mengalikan penuh, kita hanya perlu mempertimbangkan mengalikan dengan +1 dan -1.
Fig. 2Pendekatan ini mengorbankan tingkat akurasi tertentu, tetapi kami dapat mengkompensasi kerugian dengan sedikit meningkatkan jaringan. Jaringan biner pada dasarnya jauh lebih sederhana.
Dibandingkan dengan rekan floating-point mereka, mereka membutuhkan ruang 32 kali lebih sedikit untuk menyimpan nomor (1 bit bukannya 32), dan ratusan kali lebih sedikit energi, itulah sebabnya mereka jauh lebih cocok untuk "aplikasi tepi" seperti robomobiles, ketika perangkat itu sendiri dapat memproses informasi tanpa melibatkan komputasi awan.
Biasanya dalam lapisan jaringan biner dengan nilai-nilai non-biner masih terjadi, terutama pada input, dan kadang-kadang pada output. Pada input, gambar kemungkinan besar akan berwarna penuh, dan itu harus ditafsirkan secara numerik sebelum lapisan biner dimulai. Dan layer output juga akan selalu memiliki output non-biner.
Masa depan jaringan biner
Kesederhanaan seperti itu membuka bidang luas untuk penggunaan komersial dalam kondisi di mana efisiensi adalah segalanya. Pada chip built-in, lebih mungkin untuk menyimpan koefisien jaringan biner daripada jaringan dengan koefisien floating point. Produsen prosesor perlu mengadopsi teknologi ini dan memberikan dukungan untuk jaringan biner.
2020 kemungkinan akan menjadi tahun jaringan biner. Perusahaan secara aktif bekerja pada implementasi teknologi ini, dan perangkat lunak yang diperlukan untuk pelatihan jaringan biner berkembang pesat. Kita mungkin melihat aplikasi nyata pertama dari teknologi ini segera, dan chip daya rendah, berenergi rendah akan muncul di perangkat tepi yang dapat mengklasifikasikan gambar atau data lainnya.
Dengan demikian, teknologi generasi selanjutnya akan didasarkan pada kesederhanaan.