Peneliti di Sberbank AI Laboratory - tentang Ilmu Data dan tugas RnD



Jaringan saraf tidak hanya menghibur Prisma dan FindFace. Saat ini, pembelajaran mesin dan Big Data mampu memecahkan masalah bisnis yang nyata. Dmitry Babaev, mantan kepala divisi Ilmu Data di MTS, pengembang algoritma untuk menyelesaikan pertanyaan di mesin pencari Yandex, tahu tentang teknologi baru di sektor B2B.

Sekarang dia bekerja sebagai peneliti di laboratorium kecerdasan buatan di Sberbank. Sayangnya, sebagian besar perkembangan bank adalah rahasia komersial, tetapi spesialis dengan penuh semangat mengatakan tentang segala sesuatu yang diizinkan.

Pewawancara: Daria Kozlova
Termohon: Dmitry Babaev

Perusahaan Rusia mana yang memiliki lab AI dan Big Data mereka sendiri?

Di Rusia, beberapa perusahaan memiliki laboratorium serupa, karena ini sebagian besar merupakan sejarah akademik. Yandex pasti memiliki unit penelitian. Mereka juga tersedia di perusahaan asing - misalnya, Google, Microsoft, Facebook. Perusahaan besar dan menengah memiliki divisi Ilmu Data, tetapi mereka biasanya tidak terlalu memperhatikan penelitian teoritis.

Menurut Anda tugas apa yang sedang mereka coba selesaikan?

Divisi Ilmu Data mengatasi tantangan yang dibutuhkan bisnis. Sebelum melakukan tugas, mereka mengevaluasi dampak ekonomi dari implementasinya, atas dasar mana mereka memutuskan apakah akan melakukan sesuatu atau tidak. Tetapi di departemen penelitian ini lebih mudah - manfaat potensial dari penyelesaian masalah penelitian sudah dianggap cukup tinggi.

Apakah Anda akan memberikan beberapa contoh?

Tugas biasa dari Ilmu Data dapat ditunjukkan dengan contoh dari bidang telekomunikasi: untuk menemukan orang-orang yang tertarik dengan tarif baru. Contoh lain: optimalisasi bermacam-macam barang dalam rantai ritel. Seringkali perusahaan berhasil menghemat jumlah yang sangat besar hanya dengan membawa bermacam-macam barang ke toko yang tepat, misalnya, mengirimkan barang-barang mahal ke toko tempat mereka akan dibeli, dan bukan toko tempat mereka mengumpulkan debu di rak-rak.

Tugas penelitian mungkin terlihat berbeda. Contoh dari tugas tersebut adalah untuk memahami mengapa jaringan saraf memberikan perkiraan satu atau yang lain - untuk satu atau beberapa data input. Namun secara umum, tugas RnD sangat beragam.

Berapa jumlah yang diinvestasikan dalam pengembangan yang terkait dengan AI dan pembelajaran mesin?

Tergantung pada perusahaan. Di perusahaan besar, mereka siap mengeluarkan lebih banyak uang untuk ini, dalam yang kecil - kurang. Dalam telekomunikasi, menurut pengamatan saya, sebuah proyek besar, di mana volume data ratusan terabyte, membutuhkan dari puluhan hingga ratusan juta rubel. Di sisi lain, tidak ada batasan untuk kesempurnaan (senyum - kira-kira. Ed) .

Di Yandex, Anda telah mengembangkan mekanisme untuk menyelesaikan permintaan pencarian secara otomatis. Bisakah ini dianggap teknologi jaringan saraf? Bagaimana cara kerja algoritma?

Tidak, itu adalah pendekatan pembelajaran mesin (ML) klasik berdasarkan statistik permintaan pencarian. Bergantung pada awal permintaan dan permintaan pengguna yang dimasukkan, opsi yang paling cocok untuk penambahan otomatis dari basis data permintaan pencarian yang paling sering dipilih. Ini sebelum jaringan saraf, ketika semua orang menganggap mereka sebagai teknologi buntu. Kemudian mereka masih kalah dengan algoritma ML klasik.

Ceritakan tentang pencapaian Rusia paling signifikan di bidang AI.

Contoh paling terkenal adalah Prisma. Perusahaan ini tidak terdaftar di Rusia, tetapi, bagaimanapun, tulang punggung negara adalah spesialis dalam negeri. Ngomong-ngomong, para ilmuwan yang mengembangkan metode pemrosesan gambar yang digunakan dalam Prisma juga berasal dari Rusia (kelompok Victor Lempitsky).

Di Yandex, algoritma AI adalah jantung dari hasil pencarian peringkat. Algoritma peringkat untuk kedekatan teks kueri dan situs menggunakan jaringan saraf disebut Palekh.

Contoh terkenal lainnya adalah FindFace NTechLab. Ini adalah demonstrasi pengoperasian algoritma pengenalan wajahnya, yang ia jual sebagai produk komersial.

Perusahaan-perusahaan Rusia yang bergerak dalam teknologi suara, misalnya, Pusat Teknologi Pidato, juga dikenal di pasar dunia.

Di Sberbank, omong-omong, teknologi biometrik wajah dari salah satu perusahaan Rusia telah digunakan selama beberapa tahun. Ini digunakan untuk memerangi pencurian identitas dalam pinjaman ritel. Laboratorium mempekerjakan orang-orang yang berpartisipasi dalam proyek ini.

Transisi ke teknologi baru membutuhkan penggantian perangkat keras dan perangkat lunak, yang dirasakan pengguna akhir dalam dirinya sendiri dalam bentuk kegagalan dan kesalahan jaringan. Bagaimana cara melaksanakan fase transisi semenyolok mungkin untuk klien?

Sebenarnya, ini adalah tugas klasik dalam pengembangan, mereka telah mampu menyelesaikannya sejak lama. Salah satu metode adalah pengujian. Sebelum memperkenalkan versi baru, itu diuji untuk waktu yang lama: mereka memeriksa kasus batas, serta apakah perangkat lunak dapat menahan beban yang diperlukan, dan kemudian membuka versi baru untuk sekelompok kecil pengguna. Dalam hal ini, jika terjadi kesalahan, persentase terkecil dari pengguna akan menderita.

Apakah AI mampu memperbaiki kesalahan dan crash secara mandiri dalam sistem?

Ada algoritma yang hanya dirancang untuk situasi seperti itu. Tetapi tugas mereka bukan untuk mendeteksi atau memperbaiki kegagalan, tetapi untuk memprediksi bahwa itu akan terjadi segera - untuk melihat pola abnormal dalam sistem. Biasanya dalam sistem yang kompleks ada banyak indikator dari keadaan apa sekarang ini. Setelah menemukan pola yang tidak normal, kecerdasan buatan dapat mengirim pesan ke administrator: ada sesuatu yang salah - lihat apa - sesuatu perlu dilakukan. Sebagai contoh, beban telah meningkat, perlu menambahkan kapasitas siaga agar sistem dapat menahannya.

Saat ini, AI memiliki karakter pengamatan dan fungsi deteksi "di muka" (misalnya, dua jam). Tetapi untuk memperbaiki masalah, seseorang masih dibutuhkan.

Apa yang sedang mereka kerjakan di laboratorium AI Sberbank sekarang?

Laboratorium Sberbank AI diciptakan untuk mengembangkan kompetensi AI dalam organisasi. Sekarang, dengan munculnya metode pengajaran yang efektif untuk jaringan saraf yang dalam, bidang ini telah membuat kemajuan besar. Perusahaan besar membutuhkan orang-orang yang berpengalaman dalam teknologi AI baru untuk mengikuti kemajuan yang cepat. Penting juga dipahami di bidang mana AI masuk akal untuk menginvestasikan usaha dan uang. Laboratorium akan membantu mencari tahu.

Misi penting lain dari laboratorium adalah penelitiannya sendiri di bidang ini, serta penciptaan teknologi baru yang akan menguntungkan bank. Tentu saja, kami terlibat dalam penelitian yang dapat diterapkan di bank, tetapi juga mencoba untuk memastikan bahwa hasil kami bermanfaat tidak hanya di bidang keuangan. Sebagai contoh, kami tertarik pada arah analisis deret waktu; Ada banyak data dengan struktur seperti itu (transaksional dan lainnya) di perbankan. Dari karya-karya dengan komponen ilmiah yang lebih besar, orang dapat mengingat penelitian tentang penciptaan metode baru untuk menafsirkan hasil karya jaringan saraf.

Dengan siapa Sberbank bekerja?

Bank bekerja sama dengan beberapa universitas: Institut Fisika dan Teknologi Moskow, HSE, Universitas Negeri Moskow. Sekarang mendengar iPavlov, proyek bersama dengan MIPT. Ini adalah proyek untuk mengembangkan sistem dialog untuk berkomunikasi dengan komputer dalam bahasa alami. Ada juga kegiatan yang sangat menarik dengan universitas lain, dari menyelesaikan masalah optimisasi yang kompleks hingga perkembangan mendasar hingga meningkatkan algoritma pembelajaran yang mendalam. Masih ada banyak kegiatan untuk belajar dan mempromosikan pengetahuan - misalnya, kuliah AI untuk siswa.

Apa kekhususan algoritma Sberbank AI?

Ada bagian perbankan klasik. Misalnya, penilaian adalah penilaian kelayakan kredit klien. Di semua negara, ini diatur oleh bank sentral dan karena itu sebagian besar didasarkan pada metode yang ditafsirkan dengan baik - regresi logistik dan pohon keputusan. Metode klasik ini dapat diandalkan dan stabil. Di masa depan, kami berharap bahwa regulator akan mengizinkan penggunaan metode yang lebih kompleks. Untuk melakukan ini, perlu dibuktikan bahwa metode baru cukup dapat diandalkan.

Di laboratorium AI dari Sberbank, kami berurusan dengan metode yang lebih kompleks, terutama jaringan saraf yang dalam dan algoritma AI untuk data khas bank. Jenis data yang khas untuk bank adalah rangkaian waktu: misalnya, harga suatu produk (harga kemarin, sehari sebelumnya, dll.).

Pada 19 April, Anda akan berbicara sebagai pembicara di Konferensi AI . Tentang apa yang Anda beri tahu pengunjung?

Dalam beberapa tahun terakhir, metode pembelajaran yang mendalam telah menunjukkan keberhasilan luar biasa. Mereka sudah memecahkan masalah yang mereka rasa takut untuk didekati sebelumnya. Misalnya, mereka telah mencapai tingkat kualitas manusia dalam ucapan-ke-teks dan teks-ke-ucapan dalam pengenalan gambar. Tetapi mereka memiliki keterbatasan mereka sendiri yang mencegah mereka untuk terus maju. Saya ingin membicarakan hal ini, juga tentang pendekatan yang dengannya mereka mungkin dapat dielakkan. Dalam banyak hal, ini masih merupakan bidang penelitian, dan bukan solusi siap pakai untuk digunakan dalam pekerjaan sehari-hari. Namun, ada harapan yang masuk akal untuk masa depan dengan teknologi AI yang bahkan lebih efektif.

Source: https://habr.com/ru/post/id411431/


All Articles