Dalam Netologi, arah Ilmu Data muncul pada tahun 2016. Ketika kami pertama kali memulai, ada ketakutan: lapangan itu baru, permintaan akan tanggal para ilmuwan untuk perusahaan itu layak, tetapi tidak ada banyak orang yang ingin memasuki bidang ini, dan ada juga banyak sumber daya berbahasa Inggris gratis untuk belajar sendiri di jaringan, jadi kami mengambil risiko.
Tapi hari ini sudah ada 10 kursus dalam berbagai spesialisasi dalam bekerja dengan data, dan jumlah lulusan lebih dari 800. Kami memutuskan untuk bertanya kepada salah satu lulusan tentang pekerjaannya dengan data, bagaimana ia datang ke lapangan, bagaimana Machine Learning berkembang di Loco Bank dan orang seperti apa yang dia cari di timnya.
Vyacheslav Potapov, Kepala Analisis Data dan Pembelajaran Mesin di Loko Bank dan lulusan kursus Ilmuwan Data :
Saya lulus dari Universitas Teknik Negeri Moskow. Bauman di spesialisasi "Pesawat Luar Angkasa" dan tahap atas pada tahun 2011. Setelah itu, ia bekerja selama 7 tahun di berbagai tempat sebagai analis, pengembang basis data, dan arsitek gudang. Selama waktu ini, saya belajar banyak tentang pemrosesan dan penyimpanan data, tetapi pada titik tertentu saya ingin lebih banyak terjun ke dalam analisis - untuk memahami apa arti semua angka-angka ini, apa yang saya simpan dan proses.
Saya mulai mencari arah untuk pertumbuhan: Saya mempelajari posisi terkait di bidang TI, melihat tingkat gaji di industri dan apa yang lebih diminati. Ada banyak artikel tentang Habr dan video di Youtube, sampai batas tertentu mereka membantu saya memahami esensi bekerja dengan data dan bagaimana keterampilan saya yang ada pada saat itu dapat bermanfaat.
Kemudian saya bertemu dengan Data Science (DS) dan Machine Learning (ML), tetapi fondasi dasarnya tidak cukup. Lapangannya sangat luas dan ketika Anda menonton beberapa video atau artikel, Anda hanya mendapatkan pengetahuan yang terpisah-pisah, tetapi secara umum tidak ada pemahaman apa esensi dari keahlian itu, apa arah, metode, alat. Ini adalah cara membaca buku teks tebal tentang matematika untuk universitas, tetapi tanpa penjelasan dan praktik, akan sulit untuk menerapkan pengetahuan yang didapat.
Seorang kolega memberi tahu saya tentang Netologiya, di mana ada program penuh waktu yang besar dalam Ilmu Data, dan saya tidak memenuhi penawaran yang cocok di pasar berbahasa Rusia. Akibatnya, ia berhasil menghapus pelajaran dan mempertahankan tesisnya pada topik "Pengenalan Gambar Menggunakan Jaringan Saraf Tiruan". Seperti yang saya ingat sekarang, itu sangat sulit, saya tidak memiliki praktik menyelesaikan tugas-tugas penuh, dan saya benar-benar ingin bukan hanya pekerjaan pendidikan, tetapi proyek yang berfungsi penuh.
Sejalan dengan studinya, ia mencoba menyelesaikan masalah dengan Kaggle dan mengerjakan proyek kerja.
Dan tepat setelah kursus saya mulai mencari tempat di mana saya bisa sepenuhnya terlibat dalam analisis data, karena sulit untuk menggabungkan pekerjaan arsitek sistem BI dan praktek di DS.
Setelah serangkaian wawancara, ia memilih Loko-Bank dan arah DS.
Bagiku Ilmu Data, sebagaimana analog dari lembaga penelitian, membutuhkan kepercayaan, kesabaran, dan pemahaman perspektif dari manajemen.
Di Loko-Bank, mereka melihat prospek ini - jadi saya mulai bekerja di blok Bisnis Digital, yang sedang mengembangkan arah analitik.
Apa yang dilakukan analis dan Data Scientist di Loko Bank
Sekarang bank memiliki departemen TI klasik yang bertanggung jawab untuk infrastruktur dan penyimpanan data, departemen lain menggunakan sumber data ini dan menetapkan persyaratan untuk integrasi yang baru. Secara total, sekitar 40 karyawan bekerja di perusahaan dengan analitik.
Di Loko Bank, otomatisasi proses, analisis data, dan pembangunan ekonomi berbasis data menjadi prioritas perusahaan. Saya berharap bahwa berdasarkan informasi kami akan dapat membangun penjualan dengan lebih tepat, melakukan penilaian risiko dan seluruh bisnis.
Dalam unit bisnis, bekerja dengan analitik dibagi menjadi dua bidang: analitik klasik - BI, yang spesialisnya menganalisis indikator yang direncanakan dan aktual perusahaan, menyiapkan laporan penjualan, saldo, pendapatan dan pengeluaran serta arahan ML.
Machine Learning berfokus pada pembuatan algoritma yang membuat prediksi berdasarkan bukti dari analis klasik, menghasilkan data baru dan mencari dependensi dan anomali tersembunyi. Ini adalah departemen yang saya pimpin.
ML di bank baru mulai berkembang. Tetapi saya memiliki tujuan - untuk membangun sebuah sistem sehingga membantu bisnis dan memungkinkan Anda untuk menggunakan semua pendekatan modern untuk meningkatkan pendapatan dan mengurangi biaya. Kami harus sepenuhnya mengubah proses bisnis dan mencari cara untuk mengimplementasikan alat pembelajaran mesin dalam arsitektur TI yang ada. Ini bisa sulit dengan ini, karena arsitektur tidak dirancang kemarin, dan beberapa persyaratan tidak diletakkan di dalamnya.
Misalnya, persyaratan untuk mengumpulkan log bagi pelanggan untuk masuk ke bank seluler. Untuk analitik klasik, mereka tidak diperlukan, sehingga tidak pernah dikumpulkan atau disimpan. Saya menjelaskan bahwa berdasarkan log ini, kita dapat melatih model untuk membuat prediksi pada beban platform dan melihat hubungan antara penggunaan bank seluler dan profitabilitas pelanggan. Dan jika bukan karena pengembangan ML, analitik seperti itu tidak akan ada, karena tidak ada yang akan berurusan dengan masalah ini. Yang dibutuhkan adalah panduan yang akan menjelaskan mengapa dan mengapa, memberikan arahan, cara membangun arsitektur, cara mengumpulkan data, cara membangun model, di mana harus menerapkannya.
Dengan diperkenalkannya pembelajaran mesin, saya ingin membangun budaya bekerja dengan data di bank secara keseluruhan: pengumpulan, pemrosesan, serta integrasi sumber-sumber baru. Pada saat yang sama, kami sudah menyelesaikan tugas analitik prediktif untuk pelanggan, kami terlibat dalam segmentasi mereka untuk kemudian mengoptimalkan tarif dan meningkatkan penjualan perusahaan.
Kami juga terlibat dalam pemantauan keuangan, kami menganalisis klien dan transaksi yang mencurigakan. Sekarang perusahaan menghabiskan sejumlah besar sumber daya manusia dan keuangan untuk tugas ini. Dan kami ingin menyederhanakan dan membuat proses ini lebih efisien.
Jika kita berbicara tentang apa yang telah dilakukan, maka kita mulai mengumpulkan dan menyimpan data, khususnya log pengguna, tentang yang saya tulis di atas. Sekarang kami menyimpan informasi tentang sejarah perubahan dalam kartu pelanggan di Layanan Pajak Federal.
Saat ini, kami sedang mengembangkan model untuk menentukan perilaku negatif pelanggan (badan hukum dan pengusaha perorangan) dan telah menerima hasil baik pertama. Skor untuk salah satu metrik populer adalah 0,86. Dari algoritma yang kami gunakan meningkatkan gradien. Dalam waktu dekat kami berencana untuk mencapai stabilitas dalam pekerjaannya, termasuk dengan menghubungkan sumber tambahan. Model ini harus membantu mengurangi risiko perusahaan dan mengoptimalkan biaya untuk menemukan pelanggan yang tidak jujur.
Apa jenis spesialis yang dibutuhkan untuk arahan ML
Tim kami hanya dibentuk, jadi sekarang saya mencoba mengambil generalis. Tentu saja, seseorang mungkin lebih cenderung untuk mengembangkan atau, sebaliknya, untuk analisis bisnis, tetapi bagaimanapun ia harus memahami proses menciptakan solusi secara keseluruhan, memahami perannya di dalamnya. Ini adalah pilihan yang baik bagi mereka yang ingin mencoba sendiri dalam peran yang berbeda.
Adalah penting bahwa seseorang tahu bagaimana memecahkan masalah praktis yang nyata, setidaknya dapat menjelaskan pendekatan dan serangkaian langkah. Pada wawancara, saya mencoba memberikan masalah logika, dan saya meminta pemahaman umum tentang algoritma dan teknik, tanpa matematika.
Karena saya sendiri seorang insinyur, saya mencoba mencari orang-orang dengan latar belakang teknik di tim saya, meskipun ini bukan tabu. Saya tahu contoh ketika orang masuk ke profesi tanpa pendidikan teknis.
Membuat solusi ML jauh dari tugas sepele, jadi tidak cukup hanya dengan mengambil semua data, membuangnya ke dalam algoritma dan menunggu keajaiban. Anda harus dapat membenamkan diri dalam bidang subjek, dapat berkomunikasi, bertanya dan mendengarkan, di suatu tempat keterampilan ini ternyata lebih berharga daripada yang teknis.
Lebih khusus lagi, departemen sekarang terutama tertarik pada insinyur Big Data. Jaringan saraf dan xgboost memang bagus, tetapi pertama-tama Anda harus mencari spesialis yang dapat mengumpulkan data yang benar dan siap dalam jumlah besar. Tanpa mereka, pembelajaran mesin tidak akan berhasil. Saya membutuhkan setidaknya dua orang ke arah ini. Tetapi perusahaan memiliki banyak persyaratan untuk mereka: mereka harus mengetahui alat ETL, SQL dan memiliki pengalaman dalam membangun etalase dan gudang data, serta dapat menyelesaikan masalah optimasi.
Akan lebih baik untuk melengkapi staf dengan dua analis, lebih disukai dengan pengalaman di sektor perbankan. Dan meskipun Ilmu Data adalah prioritas, bidangnya bisa apa saja.
Masalah utama pasar adalah kurangnya orang yang dapat menerjemahkan kebutuhan bisnis ke dalam tugas-ML yang bermakna, dan kadang-kadang mengusulkan solusi secara proaktif.
Untuk mengatasi masalah ini, Anda perlu memahami bisnis itu sendiri dan alat yang ada, serta memiliki keterampilan lunak yang baik untuk menyajikan solusi untuk masalah dengan benar. Dan sangat sulit untuk menemukan itu.
Di mana mengembangkan
Karena kami baru saja memperkenalkan ML di perusahaan bisnis, kami perlu menerapkan sejumlah keputusan yang akan lebih tergantung pada seluruh area. Keputusan ini terkait dengan alasan keberadaan departemen untuk bisnis. Machine Learning sekarang dikenal oleh semua orang, jadi itu adalah minat khusus.
Setelah keberhasilan implementasi alat ML dalam departemen saya, kami berencana untuk memperluas kumpulan tugas dan staf spesialis di seluruh bank.
Pertama-tama, bank adalah aliran data yang besar, basis pelanggan yang besar, dan karenanya, merupakan tanggung jawab besar.
Di satu sisi, ada pelanggan yang ingin mendapatkan layanan yang baik dan menyimpan data mereka, dan di sisi lain, selalu ada orang yang ingin mengakses fasilitas penyimpanan untuk informasi rahasia.
Menurut pendapat saya, dengan meningkatnya beban kerja dan kerumitan proses, pendelegasian beberapa tanggung jawab dan fungsi ke mesin adalah satu-satunya syarat yang memungkinkan untuk pertumbuhan stabil perusahaan.
Dan seseorang yang ingin datang ke arah Machine Learning di sektor perbankan harus mampu menghubungkan tugas kerja ML dengan tujuan utama bank.
Kiat bagi mereka yang ingin memasuki bidang Pembelajaran Mesin
Pertama-tama, ada baiknya Anda menjawab sendiri pertanyaan tentang apa yang sebenarnya ingin Anda lakukan, dan setelah itu lihat apa yang perlu Anda lakukan. DS adalah bidang yang sangat besar untuk pengembangan, dan di satu sisi itu bagus, tetapi di sisi lain, Anda dapat berkeliaran untuk waktu yang sangat lama dan tidak sampai pada sesuatu yang spesifik.
Pada awalnya, saya tidak akan merekomendasikan menyelam jauh ke dalam matematika. Fokus pada pemecahan masalah dan alat praktis (perpustakaan, metode). Saya sangat terbantu oleh pengalaman mengembangkan basis data, pembersihan dan pemrosesan data, dan analisis awal. Dalam pekerjaan nyata, pengumpulan dan persiapan data yang menempati sebagian besar waktu, dan pekerjaan berkualitas tinggi dalam arah ini akan secara signifikan meningkatkan kualitas solusi ML di masa depan.
Sangat menyenangkan bahwa kita hidup di masa ketika informasi apa pun dapat dengan mudah ditemukan. Jaringan ini memiliki banyak kursus di berbagai bidang, komunitas (ODS), konferensi dan lokakarya diadakan secara berkala. Tetapi Anda perlu memahami bahwa ML adalah disiplin muda, itu hanya dibentuk dan tidak ada pendekatan mendasar untuk belajar. Oleh karena itu, jalur pengembangan harus dipilih dengan cermat: untuk mempelajari berbagai program pelatihan, untuk menetapkan aksen yang tepat untuk diri Anda sendiri. Saya beruntung - saya memilih kursus yang memenuhi persyaratan dan harapan saya, dan mengarah pada pengembangan arah yang besar dan menjanjikan di Loko-Bank.
Dari para editor