
Baru-baru ini, banyak kursus telah muncul, baik akademik maupun swasta, yang bertujuan untuk melatih analisis data dan melatih spesialis yang mampu menyelesaikan masalah bisnis menggunakan pembelajaran mesin. Jika Anda melihat dengan dekat pada program-program kursus ini, semuanya hampir sama, perbedaannya hanya dalam format pelatihan (offline online) dan pada guru.
School of Data mulai melakukan kursus seperti itu pada tahun 2015. Apalagi, mereka mulai melakukan sesuai dengan skenario yang sama. Kami meninjau sejumlah besar program dari berbagai kursus akademik dalam pembelajaran mesin, berdasarkan pengalaman, hanya memilih apa yang benar-benar diperlukan untuk menyelesaikan masalah praktis dan membuat sejumlah besar notebook Jupyter di mana kami mencoba membuat matematika dan pembelajaran mesin di jari kami.
Kami mencoba mengajar terutama teknologi pembelajaran mesin, metode pengolah kata, jaringan saraf, analisis struktur jaringan, sistem rekomendasi, dan bidang analisis data lainnya. Dan sepertinya ulasan siswa bagus, tapi masih ada yang kurang.
Mengingat bahwa kegiatan utama kami adalah pengembangan tugas nyata dalam kerangka
Data Studio , para siswa, pertama-tama, kami siapkan untuk diri kami sendiri. Kami dengan cepat menyadari bahwa dalam praktiknya, pengetahuan tentang analisis data dan metode pembelajaran mesin adalah, seperti yang dikatakan para ahli matematika, "kondisi yang diperlukan tetapi tidak cukup." Itulah sebabnya kami sangat cepat memperbarui program kelas kami, dengan mempertimbangkan kebutuhan nyata.
Secara singkat, kesimpulan yang kami dapatkan (dan atas dasar mana kami sedang membangun pelatihan kami):
- Pembelajaran Mesin dan Teknologi Jaringan Saraf Tiruan Berlebihan
- Teknik pembelajaran mesin mencopoti budaya pemikiran analitik
- Untuk mencapai efek ekonomi dari proyek yang melibatkan analisis data, soft skill lebih penting daripada pengetahuan mendalam tentang ML
- Data Profesi ilmuwan sangat berlebihan, tidak akan ada lagi spesialis universal
Paragraf berikut akan membahas semua masalah ini.
Sebagian besar tugas di perusahaan besar yang sekarang mencoba untuk menyelesaikan menggunakan metode analisis data modern dan jaringan saraf telah diselesaikan untuk waktu yang lama. Bank adalah kasus paling sukses dalam manajemen risiko. Dalam telekomunikasi, ini adalah CRM / CBM, di mana seluruh model bisnis terkait dengan peningkatan pelanggan LTV. Pekerjaan ritel serupa - ada beberapa tugas (perkiraan RTO, manajemen inventaris, promosi) yang menyediakan bisnis inti.
Ada perusahaan manufaktur di mana tugas utamanya adalah meningkatkan stabilitas rezim, mengurangi kerugian dan pemeliharaan prediktif di satu sisi, dan mengelola saldo inventaris dan pemasaran di sisi lain.
Tugas-tugas ini bukan hal baru, analis mereka telah menyelesaikannya sejak lama. Apalagi analis yang memahami bidang subjek. Selain itu, dalam kebanyakan kasus ada sejumlah besar vendor yang secara de facto standar untuk tugas-tugas tertentu, seperti manajemen harga (dalam kasus ritel), atau sistem APC (dalam kasus produksi). Selain itu, sebagai aturan, algoritma optimisasi termasuk pembelajaran mesin dalam sistem tersebut sudah ada.
Untuk membuat sesuatu yang secara fundamental baru di sini dan menghasilkan uang di atasnya sangat sulit. Seperti kata pepatah, "apel yang jatuh dari pohon" telah dipanen. Tetap mencari hanya untuk kasus bisnis baru di mana analitik memberikan efek ekonomi. Benar-benar ada contoh seperti itu - dan ada lebih banyak dan lebih banyak lagi.
Namun, untuk menemukan contoh seperti itu dan melihat efek analitik tidak mudah. Untuk melakukan ini, Anda harus dapat memahami secara mendalam area subjek dari suatu proses tertentu (deskripsi yang, seringkali tidak). Memahami jenis data apa yang secara umum dibutuhkan, memahami apa tepatnya bisnis dilakukan. Untuk memahami apakah analisis diperlukan di sini sama sekali, apakah diperlukan beberapa algoritme prediktif (lebih sering daripada tidak), apakah perlu mengubah proses bisnis (lebih sering ya), apakah ada tuas operasional (apa gunanya memprediksi penutupan peralatan jika masih ada cara untuk menghindarinya? ?).
Jadi - dalam proses penerapan produk digital seperti itu, banyak pertanyaan muncul yang memerlukan pendekatan analitis, budaya tertentu bekerja dengan data, kemampuan untuk mengajukan hipotesis, mengajukan pertanyaan pada diri sendiri, dan berpikir dalam hal pemilik bisnis. Faktanya adalah bahwa ini tidak diajarkan di Sekolah Analisis Data, ini tidak diajarkan di Coursera. Ya, kursus modern mungkin melatih insinyur dan ahli matematika yang baik, tetapi tidak ada analis, mereka tidak melakukannya.
Selain itu, pengetahuan tentang metode pembelajaran mesin dan jaringan saraf lebih mungkin untuk membunuh budaya pemikiran analitis. Sebagian besar Ilmuwan Data modern, seperti anak-anak di belakang mobil sport, menganggap diri mereka unik (mereka tahu banyak kata-kata pintar tentang xgboost, jaringan saraf, dll.), Mereka tidak tahu cara mengemudi (tetapi mengapa jika mobil melakukan segalanya untuk Anda), dan mereka hanya berjalan cepat karena ada banyak tenaga kuda (besi yang kuat, meskipun di sini lebih cenderung untuk berlatih kembali).
Sebagai hasilnya, kita mendapatkan gambar berikut: beberapa orang pintar yang tersayang datang, hampir tidak mengajukan pertanyaan, mengatakan bahwa data akan memberi tahu kita segalanya. Mereka mengambil beberapa data, lalu datang - mereka mengatakan bahwa mereka membangun semacam model, mereka menyebut akurasi dalam persen dan hanya itu. Begitu Anda memulai tantangan - mereka mengatakannya dengan kata-kata aneh, hancurkan kecerdasan, tetapi tidak ada artinya dari mereka.
Ini menjelaskan bahwa sekarang di antara kontraktor untuk transformasi digital atau analisis data - terutama perusahaan konsultan konsultasi (bukan IT) yang mendominasi. Karena mereka memiliki budaya analitik, budaya pemikiran bisnis, mereka selalu menghilangkan sakit kepala, menawarkan solusi. Mereka tidak terbatas pada membangun model pembelajaran mesin, mereka melakukan analisis nyata yang membantu membuat keputusan.
Tren lain yang terjadi di dunia saat ini adalah bahwa bahkan jika Ilmuwan Data kurang berhasil, itu tidak bisa universal. Di banyak perusahaan, struktur terpusat yang awalnya dibuat terlibat dalam analisis data telah didistribusikan. Kantor pusat hanya memiliki peran menyediakan infrastruktur, dan seluruh bagian grosir, produk digital nyata sudah dibuat langsung di unit bisnis. Dalam struktur ini, masing-masing, Data Scientist (asalkan dia "benar") menjadi ahli dalam bidang subjek - fungsional ditransfer kepadanya, yang sampai saat itu telah didukung oleh analis "lama" yang bekerja sebelum dia. Dalam hal sukses, ia juga diberikan tuas operasional.
Akibatnya, ada kecenderungan meningkat untuk memberikan pengaruh operasional analis yang sukses di tangan mereka dan tanggung jawab mereka meningkat. Tetapi hanya dalam satu bidang studi. Kami memperkirakan (seperti yang dikonfirmasi oleh perusahaan besar di pasar) bahwa tidak akan ada lagi analis universal - hype telah usai, sekarang saatnya untuk bertanggung jawab atas hasilnya. Mereka yang dapat memecahkan masalah bisnis dengan bantuan analitik akan pergi ke bagian bahan makanan, dan mereka yang dapat mengajar xgboost akan kembali ke akademi atau memberikan kuliah tentang pembelajaran mesin.
Itu sebabnya, kami telah merevisi sepenuhnya program kami (termasuk karena kami membawa banyak lulusan kami ke
Data Studio kami ) dan sekarang:
0. Sebagai permulaan, di pintu masuk kita melihat pada setiap siswa calon karyawan kita yang akan berlayar bersama kita di kapal yang sama dan berpartisipasi dalam proyek-proyek besar. Oleh karena itu, kami tertarik pada kenyataan bahwa siswa dalam 3,5 bulan ini dipersiapkan seefisien mungkin. Anda selalu dapat memiliki waktu untuk mengambil kursus berikutnya di Coursera, jika ada kebutuhan untuk memahami detail dari algoritma tertentu. Namun, mendapatkan pengalaman kasus nyata jauh lebih sulit. Dan itu sebabnya:
1. Pelatihan didasarkan pada metode kasus. Kami mengambil tugas nyata, pertama kami menganalisis model bisnis, unit ekonomi, kami memahami kualitas apa, berdasarkan bilangan real, kita harus capai dalam tugas ini. Kami mengevaluasi dampak ekonomi potensial. Dan hanya setelah itu kita mulai berurusan dengan bagian teknis, secara bertahap terjun ke metode analitis, pembelajaran mesin dan jaringan saraf. Dan yang penting - kami melakukannya hanya jika benar-benar diperlukan dalam tugas ini
2. Kami bekerja dengan setiap siswa secara individual. Terlepas dari kenyataan bahwa kami mencoba untuk merekrut kelompok yang homogen, kami memahami bahwa orang berbeda - masing-masing memiliki rencana pelatihan individu dan pekerjaan rumah mereka sendiri. Menurut pendapat kami, ini omong kosong ketika beberapa orang menyelesaikan masalah yang sama. Ini tidak efektif bahkan dalam hal akal sehat. Semua siswa menerima jawaban guru dalam obrolan, siswa tidak akan pernah dilempar satu-satu dengan tugas tersebut.
Satu-satunya hal yang kami peringatkan sebelumnya di pintu masuk adalah bahwa pelatihan akan membutuhkan waktu yang signifikan, Anda akan selalu perlu melakukan pekerjaan rumah, menyelami rinciannya, dan sering menghabiskan akhir pekan untuk pelatihan.
Kami memahami bahwa ini bukan cerita massal.
Studio Data telah berhasil beroperasi selama beberapa tahun, termasuk karena sulit untuk masuk ke dalamnya. Kami sangat menyadari bahwa dalam kenyataan saat ini lebih mudah untuk menumbuhkan analitik daripada mengikuti kursus dengan Coursera. Itulah mengapa siswa yang paling termotivasi awalnya datang ke
School of Data . Biasanya - ukuran grup tidak lebih dari 15-20 orang, yang memungkinkan Anda untuk membuat pelatihan menjadi hampir individual.
Belum lagi fakta bahwa kami benar-benar memikirkan seluruh sisi teknis - notebook Jupyter yang telah disiapkan sebelumnya, sistem komunikasi yang efektif untuk peserta jarak jauh, siaran online - semua ini bahkan membantu peserta jarak jauh untuk berkomunikasi langsung dengan anak-anak lain di kelas.
Kami tidak mengajarkan Data Scientists - kami melatih orang-orang yang memiliki keahlian penuh yang dapat menyelesaikan masalah bisnis dengan bantuan analitik.
Awal
kursus baru pada 23 September. Untuk pertanyaan proyek, silakan hubungi kami di
Data Studio .