Cara membuat departemen Ilmu Data dan tidak mengacaukannya



Ilmu Data mulai datang tidak hanya untuk perusahaan besar, tetapi juga untuk perusahaan kecil, dan bahkan pemula. Namun, sangat sering manajer puncak tidak memiliki pemahaman tentang apa yang diperlukan untuk penerapannya yang sukses. Banyak orang berpikir bahwa satu ilmuwan data dalam sebulan akan menyelesaikan semua masalah perusahaan, dan kecerdasan buatan saat klik akan mulai bekerja dengan sempurna di semua departemen. Sayangnya, ini tidak benar. Nama saya Ivan Serov dan dalam posting ini saya akan memberi tahu Anda mengapa Anda harus mulai membuat departemen DS dan kesulitan apa yang terlibat.

Manajemen harapan


Salah satu yang paling penting dalam menciptakan departemen adalah untuk segera menetapkan harapan dan KPI. Dengan DS, seperti halnya inovasi lainnya, Anda harus melalui seluruh siklus, yang akan dimulai dengan kerugian operasional. Dalam kasus terbaik, biaya arsitektur dan spesialis dapat diambil kembali dalam enam bulan, dan lebih sering dalam setahun, dua atau tiga, tergantung pada ukuran perusahaan. Anda harus siap untuk ini dan tidak menyerah semuanya setelah beberapa kegagalan. Seringkali, manajer puncak menutup departemen setelah satu tahun, karena dia tidak berhasil meraih laba. Karena itu, kepercayaan pada DS hilang. Hanya dengan menetapkan harapan dan tujuan yang diperlukan (lebih disukai oleh SMART ), departemen yang sukses dapat dibuat.



Mulai dari yang kecil


Yang terbaik adalah memulai dengan yang disebut proyek bukti konsep - ini tidak terlalu rumit dan berumur pendek, tetapi dapat membawa manfaat bisnis. Misalnya, tingkatkan pendapatan sebesar 2% karena sistem rekomendasi. Jangan mencoba membuat ansambel dari 5 jaringan saraf khusus dan bekerja di sana sepanjang tahun. Misalnya, bahkan untuk proyek klasifikasi teks, Anda dapat mulai dengan algoritma sederhana (seperti sekumpulan kata) dan sudah mendapatkan pertumbuhan. Sebagai hasilnya, proyek percontohan ini akan menjadi titik awal untuk pengembangan lebih lanjut dan akan memberikan manajemen pemahaman bahwa uang masuk ke hal-hal yang berguna dan bahwa DS perlu dikembangkan. Ini akan memberi waktu untuk mengerjakan hal-hal yang lebih kompleks. Dengan tidak adanya kompetensi, masuk akal bagi proyek percontohan untuk mempekerjakan tim eksternal konsultan DS. Mereka dapat membantu mewujudkan keinginan Anda dengan kualitas yang cukup baik, atau memahami proyek apa yang dapat Anda lakukan di industri Anda, di mana untuk memulai dan bagaimana Anda harus membangun strategi AI lebih lanjut.



Kumpulkan data


Semuanya di sini sederhana dan rumit pada saat yang bersamaan: idealnya, perusahaan harus menggunakan semua data yang dimilikinya. Misalnya, jika Anda adalah pengecer online, Anda memiliki setidaknya data tentang penjualan produk tertentu, perilaku pelanggan di situs dan surat pemasaran. Anda sudah dapat membangun banyak model, misalnya, sistem pengiriman surat pribadi.

Faktanya, mengumpulkan semua data perusahaan dalam satu basis data seringkali merupakan masalah besar karena perbedaan sumber, kurangnya interaksi yang jelas antar departemen atau bahkan kurangnya spesialis BI di perusahaan. Organisasi yang memiliki semua data yang disimpan dalam excel pertama-tama harus mulai mengumpulkannya ke dalam database (SQL), dan baru kemudian memikirkan DS.

Semua data yang tersedia harus dikumpulkan dalam bentuk yang nyaman bagi analis dan ilmuwan data untuk mengambilnya (paling sering ini adalah SQL). Penting untuk menyetujui terlebih dahulu dengan departemen BI tentang formulir di mana Anda ingin menerima data, memproses dan menggunakannya dalam produksi.
Dengan sejumlah kecil data, Anda dapat membelinya dari perusahaan pihak ketiga. Misalnya, telekomunikasi: hubungkan data ini dengan nomor telepon dengan Anda dan dengan demikian memperkaya mereka. Tetapi dalam setiap kasus ini, perlu untuk menghitung apakah ada manfaat dari ini.



Temukan Analis


Penting bahwa perusahaan sudah memiliki departemen analitik pada saat pembentukan departemen DS. Ini adalah orang-orang yang akan membantu para ilmuwan menemukan data, memberi tahu mereka apa yang mereka maksud, bagaimana cara mengumpulkan variabel yang diperlukan dengan benar, dan banyak lagi. Analytics adalah langkah pertama dalam menggerakkan perusahaan menuju pendekatan pengambilan keputusan yang didorong oleh Data (yaitu, ketika semua keputusan di perusahaan didasarkan pada data yang diterima, dan bukan pada keinginan manajemen). Mereka akan membantu memanfaatkan data tanpa menggunakan model, dan laporan akan membantu manajemen membuat keputusan yang tepat. Selain itu, di masa depan, analislah yang akan memantau status semua model DS dan menyiapkan laporan berdasarkan hasil.

Ambil tim


Banyak artikel telah ditulis tentang item ini, saya hanya akan mencoba untuk meringkas apa yang telah dikatakan. Jadi, tim DS yang baik paling sering terdiri dari:

  • Manajer Proyek - mengelola proyek, bertanggung jawab atas seluruh bagian bisnis;
  • Data Scientist - membuat model;
  • Insinyur Data - mengumpulkan data dan menyiapkan jalur produksi;
  • Pengembang - memperkenalkan solusi DS.

Semua peran sangat bervariasi dan dapat bervariasi tergantung pada keinginan Anda. Misalnya, kadang-kadang tim mungkin masih memiliki analis bisnis, kadang-kadang mungkin ada beberapa ilmuwan data sekaligus, kadang-kadang seorang insinyur data dan pengembang dapat menjadi satu orang. Ada banyak opsi untuk tim dan Anda perlu membangun kebutuhan Anda. Atau coba beberapa opsi dan pilih yang terbaik.

Selain tim standar, untuk membuat departemen dari awal, Anda tidak hanya membutuhkan spesialis yang baik dari daftar di atas, tetapi juga seorang penginjil yang akan menjelaskan kepada semua orang apa DS itu dan apa manfaatnya bagi departemen lain mungkin - Chief AI Officer / Chief Data Officer yang sama / Chief Digital Officer (pilih nama Anda sendiri). Penting untuk menyebutkan bahwa jika Anda menyewa satu ilmuwan data dan memberikan tugas kepadanya dan analis, dan arsitek, dan pengembang, Anda tidak boleh mengharapkan hasil cepat, apalagi, ini dapat menghilangkan motivasi orang ini, dan perusahaan akan memiliki departemen yang sukses di masa depan.

Jika perusahaan besar dan ada banyak peluang untuk pengembangan Big Data, maka Anda juga membutuhkan Arsitek Data, yang akan mengonfigurasi arsitektur, pengumpulan data multi-berulir, dan menggunakan Hadoop atau Spark (sistem untuk memproses array data besar), yang akan digunakan oleh ilmuwan data perusahaan .



Jangan lupa tentang komunikasi dan pelatihan internal


Setelah proyek percontohan, perlu untuk mengembangkan tim secara aktif. Perusahaan harus menyelenggarakan setidaknya dua jenis pelatihan:
Untuk data Para ilmuwan, ini bisa berupa lokakarya tentang berbagai topik, pertemuan mingguan, hackathon, kelas master. Juga, Anda harus memperhatikan untuk membeli kursus online untuk tim (misalnya, dengan coursera) dan mungkin bahkan memasukkannya ke dalam KPI. Ini akan membantu menjaga agar tim selalu mendapatkan informasi terbaru di bidang yang berkembang pesat dan meningkatkan interaksi internal.
Untuk manajer proyek dan manajer puncak, dapat juga berupa lokakarya dalam bentuk analisis kasus bisnis atau strategi AI perusahaan, atau, misalnya, kursus dasar memahami pembelajaran mesin dan teknologi pembelajaran mendalam (apa yang bisa dan tidak bisa dilakukan, dasar-dasar teknologi). Ini hanya akan membantu manajemen menghasilkan harapan dari DS.

Juga, kemungkinan besar, bahkan sebelum penciptaan departemen DS, perusahaan sudah memiliki orang-orang yang tertarik - ini mungkin pengembang yang telah mengambil beberapa kursus DS, atau pebisnis yang ingin menjadi manajer proyek DS - mereka harus tertarik dengan departemen dan membantu mengembangkan . Misalnya, setelah melatih pengembang dalam metode pembelajaran mesin, Anda bisa mendapatkan spesialis yang baik dan termotivasi yang mengetahui struktur internal perusahaan dan lebih murah daripada ilmuwan data pasar rata-rata, yang juga perlu waktu untuk mengetahuinya.



Komunikasi eksternal itu penting


Barang ini sering dilupakan, tetapi tidak kalah pentingnya dari yang lain. Pasar untuk spesialis pembelajaran mesin sangat kekurangan personel (semuanya telah mulai membaik dalam beberapa tahun terakhir, tetapi masih), setiap ilmuwan data yang baik memahami nilainya dan memilih perusahaan tempat ia ingin bekerja - oleh karena itu, menawarkan gaji yang besar sekarang tidak cukup, perlu terlibat dengan proyek. Untuk melakukan ini, Anda harus membangun komunikasi eksternal dengan benar - bekerja dengan media, pemimpin opini, komunitas, membicarakan proyek yang diimplementasikan, menulis artikel di berbagai publikasi tematik, berbicara di konferensi, mensponsori acara industri seperti hackathon, dan sebagainya - ini hanya sebagian kecil dari itu apa yang harus dilakukan untuk menarik bakat ke perusahaan.

Itu saja, sebagai kesimpulan saya hanya akan mengatakan bahwa saya tidak secara khusus menyebutkan kesulitan dalam proses departemen Ilmu Data, tetapi hanya mengatakan apa yang diperlukan untuk membuatnya. Jika Anda memiliki sesuatu untuk ditambahkan - selamat datang di komentar.

Source: https://habr.com/ru/post/id436052/


All Articles