
Beberapa waktu yang lalu, kami menemukan materi lama kami di mana kami mengajarkan aliran pertama dalam kursus pembelajaran mesin kami di
Sekolah Data dan membandingkannya dengan yang saat ini. Kami terkejut betapa banyak yang kami tambahkan dan ubah dalam 5 tahun pelatihan. Menyadari mengapa kami melakukan ini dan bagaimana, pada kenyataannya, pendekatan untuk memecahkan masalah-masalah Ilmu Data telah berubah, kami memutuskan untuk menulis publikasi ini.
Kami mulai pelatihan dengan metode dasar dan algoritma pembelajaran mesin, memberi tahu cara mempraktikkannya, cara memilih parameter, cara membersihkan dan menyiapkan data, cara mengukur kualitas. Kami percaya (dan masih percaya) bahwa pelatihan agen penuh-Ilmuwan harus mencakup tidak hanya metode pembelajaran mesin klasik, tetapi juga metode analisis grafik (jejaring sosial, SNA), analisis teks, bekerja dengan jaringan saraf dan data besar (Data Besar).
Dengan demikian, pada output kami mendapatkan pakar dalam bidang luas Ilmu Data, yang mampu menerapkan metode yang luas dalam praktiknya. Kami membawa spesialis yang sama ke bisnis kami. Pertama, di perusahaan tempat kami bekerja dan mengarahkan bidang yang relevan, dan kemudian dalam bisnis kami untuk pengembangan produk berdasarkan pembelajaran mesin -
Data Studio .
Tetapi kemudian kami menyadari bahwa ini tidak hanya tidak cukup untuk keberhasilan implementasi proyek-proyek Ilmu Data, tetapi ini bahkan bukan hal utama.
Pendekatan pada awal praktik Ilmu Data dan, sejujurnya, bagi banyak analis sejauh ini, adalah sebagai berikut: beri saya data, saya akan menghapusnya, membuat vektor fitur, membaginya dalam pelatihan dan sampel uji, menjalankan beberapa algoritma ML, dan inilah hasilnya.
Apakah pendekatan ini memiliki hak untuk hidup?
Ya, memang, tetapi di mana area subjek sudah dipelajari dengan baik dan sudah ada akumulasi pengalaman yang baik dalam menerapkan analitik. Contohnya? Skor bank, arus keluar dari operator, cross-selling (Penawaran Terbaik Berikutnya) di ritel, bank, telekomunikasi, peramalan efektivitas saham dalam ritel, peramalan saldo. Daftar ini berlanjut.
Sekarang mari kita bayangkan area lain: perkiraan waktu kedatangan dalam transportasi multimoda (kapal, kereta, truk): tanda-tanda apa yang akan Anda gunakan? Jenis muatan, berat muatan, keberadaan simpul penyortiran tertentu? Dan jika Anda memikirkannya? Mungkin beberapa tanda yang lebih sederhana dan jelas (bahkan tanpa model pembelajaran mesin) akan memberikan Anda akurasi yang signifikan?
Atau Anda perlu memprediksi sensitivitas pelanggan besar terhadap perubahan harga untuk produk tertentu. Bagaimana cara menentukan elastisitas? Apa tepatnya yang akan Anda prediksi?
Tetapi apakah perlu untuk membangun model jika proses produksinya kemudian berubah?
Ternyata Anda harus dapat bekerja dalam bidang studi analitik yang baru, karena di bidang yang dipelajari dengan baik, sudah ada begitu banyak perkembangan dan ini adalah "samudra merah".
Apa yang diperlukan untuk masuk ke area baru dengan analitik?
Untuk melakukan ini, Anda harus dapat memahami secara mendalam area subjek dari suatu proses tertentu, deskripsi yang seringkali tidak tersedia. Memahami jenis data apa yang secara umum dibutuhkan, memahami apa tepatnya bisnis dilakukan. Apakah Anda perlu memahami analitik di sini, apakah Anda memerlukan algoritma prediksi, apakah Anda perlu mengubah proses bisnis, apakah ada tuas operasional (apa gunanya memprediksi shutdown peralatan jika masih ada cara untuk menghindarinya?).
Untuk meringkas, hal-hal berikut ini diperlukan:
- Pendekatan analitis, kemampuan untuk merumuskan dan menguji hipotesis
- Memahami prinsip dan fitur proses bisnis dan individu
- Memahami Proses Ekonomi
- Memahami teknologi
- Kemampuan untuk mengikat data dengan proses bisnis
Dan, jika Anda melepaskan diri dari pembelajaran mesin, bidang apa yang paling mampu melakukan ini? Benar - konsultasi manajemen. Dan di mana ini diajarkan menggunakan apa yang disebut metode-kasus (banyak contoh dari situasi bisnis yang berbeda) - benar, di program MBA (master administrasi bisnis).
Dengan demikian, ternyata Ilmuwan Data yang ideal adalah lulusan MBA dengan pengalaman dalam konsultasi, yang telah menyelesaikan kursus pembelajaran mesin.
Ini, tentu saja, adalah kerja keras, tetapi memang benar bahwa di antara kontraktor, mereka yang memiliki tingkat proses dan standar tertinggi, pada tingkat pemilihan dan pelatihan staf telah mengembangkan budaya pemikiran analitis. Kami mematuhi pendekatan yang sama di
Data Studio kami . Dan, secara logis, kami meletakkan pendekatan yang sama dalam pelatihan kami di
School of Data .
Anda bisa keberatan. Lagi pula, apa yang ditulis di atas lebih berlaku dalam konsultasi, di mana setiap kali Anda tidak tahu sebelumnya dari mana subjek subjek proyek akan berasal. Dan bagaimana dengan perusahaan besar di mana area tersebut secara garis besar dijelaskan?
Di perusahaan, kami mengamati semua spesifikasi yang sama yang dijelaskan di atas, dan kebutuhan akan analis dan seluruh tim untuk memahami bisnis, kebutuhan akan tanggung jawab untuk hasil akhir.
Karena alasan inilah di perusahaan besar kita sekarang melihat tren dalam spesialisasi divisi Ilmu Data dan pergeseran fungsi analitik dari divisi terpusat, satu untuk seluruh perusahaan, ke fungsi bisnis, yaitu, lebih dekat ke bisnis. Dengan spesialisasi ini, kemampuan seorang analis untuk dengan cepat memahami bisnis baru dan menawarkan solusi yang realistis, bukan model, adalah keunggulan kompetitif.
Apa yang sebenarnya telah berubah dalam kurikulum kita? Di hadapan kita semua, kita mengajar berdasarkan kasus-kasus praktis. Struktur dan sifat kasus telah berubah. Sebelumnya, kasus kami seperti tugas pada Kaggle: di sini adalah tugas, di sini adalah variabel target, di sini adalah metrik kualitas, berikut adalah datanya.
Sekarang tugasnya terdengar berbeda: di sini adalah tugas dalam hal klien, di sini adalah deskripsi dari proses klien. Merumuskan tugas analitik, mengusulkan metrik kualitas, mengevaluasi kesesuaian penggunaan analitik, menghitung efek ekonomi, menyarankan metode, merumuskan permintaan untuk data yang Anda butuhkan. Dan semuanya seperti biasa: bersihkan data, bangun model, dll. Dan kami memberikan contoh-contoh seperti itu dari area yang sama sekali berbeda, untungnya, kehadiran konsultasi kami sendiri di bidang ini sangat memperluas jangkauan tugas yang tersedia yang kami selesaikan berdasarkan pengalaman kami sendiri.
Tetapi disiplin pendekatan analitis bukan hanya praktik kasus. Kami juga mengajarkan kerangka kerja standar (pola analisis dasar) yang digunakan dalam konsultasi. Kami juga menambahkan ke pelatihan proses pengembangan produk analitis yang kami patuhi di dalam kelas, dari analisis bisnis hingga penyajian hasil kepada pelanggan dan merencanakan penyebaran solusi produktif termasuk tahapan, peran, titik keputusan utama, dan momen interaksi dengan pelanggan.
Kami memberikan peran terpisah untuk presentasi - terlalu sering kami melihat celah antara pikiran analis dan persepsi pikiran ini oleh karyawan pelanggan.
Secara umum, kami percaya bahwa tugas melatih Data Scientist bukanlah bagaimana mempersiapkan spesialis untuk area yang ada (sudah ada banyak kursus untuk ini dan ini telah menjadi komoditas dalam banyak cara), tetapi untuk mempersiapkan peneliti ahli untuk bekerja di area baru di mana Digitalisasi baru saja datang.
Yah, dan, seperti biasa - awal kursus baru di
School of Data kami pada 16 September. Kami menerima pesanan untuk proyek-proyek baru di
Data Studio sepanjang waktu, seperti halnya kami merekrut karyawan (lihat bagian lowongan terbuka).
PS Kami memperbarui situs kami sedikit agar lebih nyaman. Karena itu, jangan kaget dengan tampilan baru.