Beberapa minggu yang lalu, saya menghadiri aksi untuk mahasiswa Universitas Teknik di Brno (Republik Ceko) yang disebut ŽijemeIT. Ini adalah konferensi mini tahunan untuk siswa, di mana sejumlah perusahaan IT besar dan terkenal di Brno menyajikan presentasi ikhtisar tentang kegiatan mereka, arahan yang menarik dan proyek. Tahun ini, ada kecenderungan nyata bagi perusahaan untuk menggunakan pembelajaran mesin dan kecerdasan buatan untuk menyelesaikan berbagai masalah bisnis. Dalam ulasan singkat ini, saya ingin berbagi beberapa pengamatan menarik tentang topik ini. Siapa peduli, saya minta dipotong
Tindakan tersebut dilakukan dalam bentuk presentasi perusahaan dan stand informasi dengan selebaran iklan. Pada presentasi, Anda bisa mendapatkan ide umum tentang aktivitas perusahaan, dan selama istirahat Anda dapat mengajukan pertanyaan menarik kepada pembicara atau mengobrol dengan perwakilan perusahaan di stan dan mempelajari lebih lanjut tentang proyek dan lowongan terbuka. Tujuan dari tindakan ini adalah untuk memperkenalkan siswa kepada calon majikan dan mungkin menemukan pekerjaan di masa depan.

Di mana pembelajaran mesin menemukan penerapannya
Tahun ini, banyak presentasi yang dikhususkan untuk topik pembelajaran mesin dan kecerdasan buatan. Teknologi ini digunakan di berbagai bidang dan bidang TI.
Misalnya, perusahaan Amerika, Mavenir, menganalisis keamanan jaringan operator seluler dan mengidentifikasi transaksi penipuan (apa yang disebut audit kerentanan jaringan). Untuk menganalisis pesan spam dan mengidentifikasi serangan penipuan, Mavenir menggunakan metode pembelajaran mesin klasik.
Pada awalnya, spesialis perusahaan mengumpulkan data dari operator seluler, khususnya data tentang panggilan telepon dan pesan SMS (durasi panggilan, nomor pemanggil, nomor pengirim pesan, teks pesan). Kemudian, grafik statistik dibangun atas dasar mereka dan berbagai metode analitik diterapkan: grafik sosial, analisis semantik. Tujuannya adalah untuk mengidentifikasi aktivitas mencurigakan di jaringan. Analisis data statistik memungkinkan Anda membuat pengelompokan teks pesan. Pada akhirnya, berdasarkan penelitian, para ahli Mavenir memberikan penyedia layanan laporan dan perincian terperinci tentang potensi kegiatan penipuan dalam jaringan selulernya.
Di sini ada masalah dalam menerima data panggilan dan pesan di berbagai negara. Untuk menganalisis kerentanan dalam jaringan, diperlukan data operator nyata. Regulator yang berbeda dari kontrol data pribadi beroperasi di berbagai negara: GDPR beroperasi di Eropa, dan negara memiliki undang-undang mereka sendiri.
Dalam hal teknologi, Keras dan scikit-belajar digunakan. Mengenai Python, ada batasan pada multithreading - batasan yang terkenal dari Global Interpret Locker (GIL), yang merupakan batasan kritis ketika memproses data dalam jumlah besar. Sebelumnya digunakan C ++ XGBoost. Ini memungkinkan Anda untuk mendapatkan penundaan yang sangat kecil (kurang dari 0,1 ms).

Contoh lain adalah Y Soft. Perusahaan ini mengembangkan antarmuka pengguna untuk printer. Salah satu tugas penting di sini adalah untuk menguji program yang sudah selesai. Pengujian manual cukup memakan waktu, memakan waktu dan tidak mengesampingkan kemungkinan kesalahan. Oleh karena itu, perusahaan mengotomatiskan pengujian manual dari antarmuka pengguna program menggunakan visi komputer dan lengan robot (proyek RQA dapat dibaca di
sini dan di
sini ).

Lengan robot diotorisasi di terminal menggunakan kredensial, pergi ke layar target, memilih tugas yang diinginkan (memindai, mencetak), memeriksa keberhasilan dan akhirnya pergi ke layar utama.

Robot dimonitor oleh kamera yang merekam tindakannya di video. Di sini tugas deteksi layar dan pengenalan elemen dalam aplikasi diselesaikan. Metode visi komputer klasik awalnya digunakan: deskriptor fitur, OCR. Salah satu masalah adalah apa yang disebut efek Moiré - penampilan serangkaian garis-garis horizontal pada layar monitor, yang sering terjadi ketika melihat layar monitor melalui kamera. Sebagai hasil dari percobaan, masalah diselesaikan dengan menggunakan penggolong gambar baru berdasarkan histogram dari tepi terdistorsi kumulatif lokal. Dalam hal ini, penggunaan AI dapat secara signifikan meningkatkan kecepatan operasi (sekitar satu detik versus 20 detik dengan metode pemrosesan gambar tradisional).

Dalam hal teknologi, mereka awalnya menggunakan CNTK (wrapper over C ++) dan Accord. CNTK memiliki API yang kompleks, dan Accord tidak lagi didukung dan memiliki konkurensi rendah. Akhirnya, perpustakaan .NET ML digunakan bersama dengan teknologi .NET (ASP .NET).
Di mana pembelajaran mesin belum berlaku
Dalam beberapa kasus, metode tradisional untuk memecahkan masalah tanpa menggunakan pembelajaran mesin masih tetap menjadi pilihan terbaik. Misalnya, Thermo Fisher Scientific sedang mengembangkan program pencitraan untuk mikroskop elektron dengan pra-pemrosesan gambar. Untuk pemrosesan gambar, metode visi komputer tradisional digunakan.

Ini karena beberapa faktor. Pertama, metode pembelajaran mesin tidak dapat memberikan akurasi 100 persen, bahkan kesalahan yang tidak signifikan selalu terjadi. Dalam hal ini, ketika pelanggan adalah organisasi ilmiah (misalnya, laboratorium penelitian yang terlibat dalam produksi microarray), akurasi kritis untuk pelanggan sangat penting. Kedua, untuk mencapai efisiensi prediksi maksimum, model pembelajaran spons yang sama membutuhkan sejumlah besar data untuk pelatihan, lebih disukai sebanyak mungkin bagi mereka yang keakuratannya akan dievaluasi. Dalam kasus Thermo Fisher Scientific, pelanggan tidak siap untuk memberikan data mereka untuk pengujian kinerja.

Akhirnya, hasil yang diperoleh dengan kesimpulan dari jaringan saraf sulit untuk dijelaskan (fenomena jaringan saraf yang dikenal sebagai "kotak hitam"). Ini adalah kasus ketika akurasi ekstrim dan pemahaman tentang proses pengambilan keputusan memiliki prioritas yang lebih tinggi daripada pelaksanaan tugas dan kecepatan eksekusi.
Itu saja untuk saat ini. Semoga beruntung untuk semua orang dan sampai jumpa lagi!