
Pada 2014, saya bergabung dengan tim kecil di Grup Media Schibsted sebagai Spesialis Ilmu Data ke-6 di perusahaan ini. Sejak itu, saya telah bekerja pada banyak usaha di bidang Ilmu Data di sebuah organisasi yang sekarang memiliki lebih dari 40 orang. Dalam posting ini, saya akan berbicara tentang beberapa hal yang saya pelajari selama empat tahun terakhir, pertama sebagai spesialis, dan kemudian sebagai manajer Ilmu Data.
Posting ini mengikuti contoh Robert Chang dan artikelnya yang sangat bagus, " Melakukan Ilmu Data di Twitter, " yang saya temukan sangat berharga ketika saya pertama kali membacanya di 2015. Tujuan dari kontribusi saya sendiri adalah untuk berbagi pemikiran yang sama berguna dengan spesialis dan manajer Ilmu Data di seluruh dunia.
Saya membagi pos menjadi dua bagian:
- Bagian I: Ilmu Data dalam Kehidupan Nyata
- Bagian II: Mengelola Tim Ilmu Data
Di Bagian I, saya fokus pada pekerjaan yang benar-benar dilakukan oleh para pakar Ilmu Data, sementara Bagian II membahas bagaimana mengelola tim Ilmu Data seefisien mungkin. Saya akan mengatakan bahwa kedua bagian itu penting untuk spesialis dan manajer.
Saya tidak akan menghabiskan banyak waktu untuk menggambarkan siapa dan siapa spesialis Ilmu Data dan siapa yang tidak - ada cukup artikel tentang topik ini di seluruh Internet.
Secara singkat tentang Schibsted: media dan pasar di lebih dari 20 negara di seluruh dunia. Saya terutama mengerjakan bisnis pasar kami, tempat jutaan orang membeli dan menjual barang setiap hari. Jika Anda ingin melihat beberapa contoh dunia nyata dari pekerjaan ilmu data di Schibsted, berikut adalah beberapa pilihan:
Dengan pemikiran ini, mari selami!
Bagian I: Ilmu Data dalam Kehidupan Nyata
Memulai sebagai spesialis Ilmu Data di perusahaan baru dengan ambisi besar benar-benar hebat, tetapi juga bisa tampak menakutkan. Apa yang orang-orang di sekitar saya harapkan? Tingkat keterampilan apa yang akan dimiliki oleh kolega saya? Bagaimana cara saya bekerja untuk melayani perusahaan? Dalam posisi di mana ada begitu banyak hype, kadang-kadang sulit untuk tidak merasa seperti penipu .
Ketakutan menjadi orang bodoh sering kali mendorong seorang profesional Ilmu Data untuk fokus terutama pada kompleksitas. Ini membawa kita pada kesimpulan pertama.
1.1. Kesulitan meningkatkan nilai, mulai dari yang sederhana
Mereka menyewa spesialis Ilmu Data, jadi masalah ini pasti sangat kompleks, bukan?

Asumsi ini akan sering menyesatkan Anda sebagai spesialis Ilmu Data. Pertama-tama, masalah yang Anda temui dalam bisnis sangat sering diselesaikan dengan menggunakan metode yang cukup sederhana. Kedua, penting untuk diingat bahwa kompleksitas meningkatkan nilai. Model yang kompleks kemungkinan akan membutuhkan lebih banyak pekerjaan pada implementasinya, risiko kesalahan yang lebih tinggi dan lebih banyak kesulitan dalam menjelaskannya kepada pelanggan. Karena itu, Anda harus selalu mencari pendekatan yang paling sederhana terlebih dahulu.
Tetapi bagaimana memahami apakah pendekatan yang paling sederhana sudah cukup?
1.2. Selalu memiliki model dasar
Perkiraan kualitas model Anda, kemungkinan besar, tidak masuk akal sendiri tanpa dibandingkan dengan model dasar. Perbandingan dengan akurasi dengan pemilihan acak, dalam banyak kasus, tidak cukup.

Pada titik tertentu, kami membuat model untuk memprediksi kemungkinan bahwa pengguna akan kembali ke situs kami - model pengembalian. Sekitar 15 atribut berdasarkan perilaku pengguna digunakan dalam model kami, dan kami mencapai akurasi sekitar ~ 0,8 ROC-AUC. Dibandingkan dengan akurasi prediksi acak (0,5), kami cukup senang dengan hasil ini. Tetapi ketika kami membuang semuanya dari model, kecuali untuk dua tanda paling penting: baru-baru ini (jumlah hari dari kunjungan terakhir) dan frekuensi (jumlah hari kunjungan di masa lalu), kami menemukan bahwa regresi logistik sederhana pada kedua variabel ini memberi kami 78% ROC-AUC ! Dengan kata lain, kita dapat mencapai lebih dari 97% kinerja dengan membuang lebih dari 85% atribut.
Saya telah melihat berkali-kali bagaimana para pakar Ilmu Data menunjukkan hasil percobaan offline pada model kompleks tanpa model dasar yang sederhana untuk perbandingan. Ketika Anda melihat ini, Anda harus selalu bertanya: bisakah kita mencapai hasil yang sama menggunakan model yang jauh lebih sederhana?
1.3. Gunakan data yang Anda miliki
Saya pernah makan siang dengan seorang insinyur data dan spesialis Ilmu Data lainnya. Mata yang terakhir menyala ketika dia berbicara tentang semua hal luar biasa yang bisa dia lakukan “jika saja dia memiliki data tentang X, Y atau Z”. Pada suatu saat selama percakapan, insinyur itu tertawa: “Anda, pakar Ilmu Data, selalu berbicara tentang apa yang dapat Anda lakukan dengan data yang tidak Anda miliki. Bagaimana kalau melakukan sesuatu dengan data yang Anda miliki? "

Kedengarannya kasar, tetapi insinyur itu mengungkapkan kebenaran penting. Anda tidak akan pernah memiliki dataset yang sempurna dan akan selalu ada data yang dapat Anda gunakan. Dalam kebanyakan kasus, Anda dapat melakukan sesuatu dengan apa yang Anda miliki.
1.4. Bertanggung jawab atas data
Sebagaimana dinyatakan di atas, kualitas dan kelengkapan data hampir selalu menjadi masalah. Tetapi alih-alih duduk dan menunggu seseorang memberi Anda data di piring perak, Anda harus berbicara dan bertanggung jawab atas data yang Anda butuhkan.

Saya tidak berbicara tentang kepemilikan formal dalam arti model manajemen data. Saya sedang berbicara tentang memperluas peran saya dan membantu, jika memungkinkan, untuk mendapatkan data yang Anda butuhkan.
Ini mungkin berarti berpartisipasi dalam pembuatan skema dan format pengumpulan data. Ini mungkin berarti melihat kode Javascript yang berjalan di antarmuka aplikasi web untuk memastikan bahwa peristiwa dipecat ketika seharusnya. Atau itu bisa berarti membangun jalur pipa data tanpa menunggu teknisi data melakukan segalanya untuk Anda.
1.5. Lupakan datanya
Jelas, ini bertentangan dengan semua yang saya katakan di atas, tetapi sangat penting untuk tidak terlalu fokus pada data yang Anda miliki.

Ketika masalah baru muncul, Anda harus terlebih dahulu mencoba melupakan data yang ada. Kenapa begitu? Ya, karena data Anda yang ada dapat membatasi ruang pengambilan keputusan, dan ini dapat mengalihkan Anda dari menemukan pendekatan terbaik. Anda akan terjebak dalam optimal lokal, di mana Anda mencoba menarik solusi untuk masalah pada set data yang tersedia untuk Anda (gunakan di luar pembelajaran). Akibatnya, Anda tidak akan pernah memiliki kumpulan data baru.
1.6. Kembangkan pemahaman terperinci tentang kausalitas
Kita semua tahu bahwa korelasi tidak menyiratkan hubungan kausal. Masalahnya adalah bahwa banyak pakar Ilmu Data berhenti pada hal ini dan takut untuk menghubungkan penyebab dengan efeknya.

Mengapa ini menjadi masalah? Karena manajer produk, tim pemasaran, CEO Anda, atau dengan siapa Anda bekerja di sana, sama sekali tidak khawatir tentang korelasinya. Mereka peduli tentang hubungan sebab akibat.
Manajer produk ingin memastikan bahwa ketika dia memutuskan untuk merilis fitur baru ini, dia akan memicu peningkatan 10% dalam keterlibatan produk. Tim pemasaran ingin tahu bahwa meningkatkan jumlah surat dari 2 per minggu menjadi 4 tidak akan memaksa orang untuk berhenti berlangganan buletin. Dan CEO ingin tahu bahwa berinvestasi dalam penargetan yang lebih baik akan mengarah pada peningkatan pendapatan iklan.
Nah, apakah ada solusi kompromi? Ternyata ada dua di antaranya.
Eksperimen online paling terkenal. Bahkan, Anda menjalankan uji coba secara acak, di antaranya adalah tes A / B paling populer. Idenya sederhana: karena kita secara tidak sengaja memilih siapa yang akan menjadi kelompok sasaran dan siapa yang akan menjadi kelompok kontrol, maka jika kita menemukan perbedaan yang signifikan secara statistik antara kelompok-kelompok tersebut, “perlakuan” yang kita gunakan dapat dianggap alasannya. Tanpa masuk ke penalaran filosofis, dalam praktiknya ini adalah asumsi yang masuk akal.
Pendekatan yang kurang dikenal untuk mencari hubungan sebab akibat adalah pemodelan sebab akibat. Idenya di sini adalah bahwa Anda membuat asumsi tentang struktur kausal dunia, dan kemudian menggunakan data pengamatan (bukan eksperimental) untuk memeriksa apakah asumsi ini konsisten dengan data, atau untuk mengevaluasi kekuatan berbagai hubungan sebab-akibat. Adam Kelleher telah menulis serangkaian artikel yang hebat, " Ilmu Pengetahuan Data Kausal, " yang saya sarankan untuk dibaca. Selain itu, Alkitab kausalitas adalah buku Kausalitas oleh Judea Pearl.
Dalam pengalaman saya, sebagian besar pakar Ilmu Data memiliki pengalaman luas dalam menciptakan model pembelajaran mesin dan evaluasi offline mereka. Jauh lebih sedikit orang yang memiliki pengalaman dengan penilaian dan eksperimen online. Penjelasannya sederhana: Anda dapat mengunduh dataset dari Kaggle, melatih model dan mengevaluasi secara offline dalam hitungan menit. Untuk mengevaluasi model ini secara online, di sisi lain, Anda memerlukan akses ke dunia nyata. Bahkan jika Anda bekerja di perusahaan Internet dengan jutaan pengguna, Anda sering harus mengatasi banyak hambatan untuk mengekspos model pembelajaran mesin Anda kepada pengguna.
Sekarang, sementara beberapa ahli Ilmu Data memiliki pengalaman penilaian online yang luas, sangat sedikit yang memiliki pengalaman dengan pemodelan kausal. Saya pikir ada banyak alasan bagus. Salah satu alasannya adalah bahwa sebagian besar buku tentang kausalitas cukup teoretis, di antaranya ada beberapa panduan praktis tentang cara memulai pemodelan kausal di dunia nyata. Saya memperkirakan bahwa dalam beberapa tahun ke depan kita akan melihat pedoman yang lebih praktis untuk pemodelan kausal.
Mengembangkan pemahaman terperinci tentang kausalitas akan memungkinkan Anda untuk memberikan rekomendasi praktis kepada pelanggan Anda dan pada saat yang sama mendukung integritas Anda sebagai spesialis dalam Ilmu Data.
Bagian II: Mengelola Tim Ilmu Data
Schibsted, seperti banyak perusahaan lain, memiliki dua jalur karier: sebagai pekerja mandiri dan sebagai pemimpin. Dalam konteks Ilmu Data, yang pertama ditujukan bagi mereka yang benar-benar ingin meningkatkan pengetahuan mereka di bidang Ilmu Data dan berkontribusi pada perusahaan melalui kerja praktek dan kepemimpinan teknis. Jalur kepemimpinan adalah bagi mereka yang lebih bersemangat tentang pengembangan orang dan manajemen tim.
Saya sama sekali tidak yakin jalur mana yang tepat bagi saya, tetapi pada akhirnya saya memutuskan untuk mencoba jalur pemimpin. Tidak banyak waktu berlalu ketika saya menyadari bahwa ini benar-benar cara yang tepat bagi saya, tetapi tentu saja, saya mengalami banyak masalah (dan saya masih melakukannya!).
Tantangan pertama yang akan Anda hadapi adalah sangat sedikit manajer Ilmu Data lainnya di dunia. Jika Anda berpikir bahwa spesialis yang berpengalaman dalam Ilmu Data jarang, maka manajer yang berpengalaman dalam Ilmu Data jauh lebih sedikit. Dengan demikian, Anda kurang lebih dibiarkan menggunakan perangkat Anda sendiri.
Tetapi apakah benar bahwa mengelola tim Ilmu Data sangat berbeda dari mengelola tim jenis lain? Ya dan tidak
Jika Anda belum pernah menjalankan tim sebelumnya, Anda mungkin dapat menemukan bahan bacaan klasik untuk manajemen seperti Andrew Grove's High Output Management . Selain itu, bantuan proaktif untuk manajer senior (dari disiplin ilmu lain) untuk saran juga sangat penting.
Namun, tim Ilmu Data memiliki beberapa perbedaan utama, jadi sekarang kami akan fokus pada kesimpulan, terutama yang terkait dengan tim Ilmu Data.
2.1. Tim Ilmu Data sebenarnya bukan tim
Ketika kebanyakan orang memikirkan tim, mereka memikirkan sesuatu seperti ini:

Apa saja karakteristik tim sepak bola seperti FC Barcelona? Setidaknya tiga hal:
- Tujuan bersama
- Peran yang berbeda dalam tim, masing-masing dengan tanggung jawab yang berbeda
- Kemandirian dalam mencapai tujuan Anda
Jika Anda mengelola tim yang hanya terdiri dari spesialis Ilmu Data, kemungkinan besar tidak satu pun dari karakteristik ini terpenuhi. Sebaliknya, tim Anda akan memiliki:
- Banyak, Mengubah Tujuan
- Spesialis, dan mereka pandai dalam hal yang sama: Ilmu Data
- Tim lain yang dapat Anda ajak bekerja untuk memberi dampak pada pengguna dan pendapatan
Analogi yang lebih cocok daripada tim sepak bola untuk tim spesialis Ilmu Data adalah:

Permintaan untuk layanan Mulder dan Scully berubah dari waktu ke waktu. Mereka tertarik ketika pengalaman mereka dibutuhkan. Dan mereka tidak akan pernah menyelesaikan masalah ini tanpa berbicara dengan orang di luar FBI.
Mengapa perbedaan ini penting?
Karena jika Anda memiliki tim pakar Ilmu Data dan Anda mengelolanya sebagai tim "klasik" dengan tujuan bersama, berbagai peran, dan otonomi penuh, Anda akan dengan cepat mendapatkan tim yang frustrasi.
Saya telah melihat tim Ilmu Data dikelola seperti produk atau tim pengembangan lainnya, dan konsekuensi yang tak terhindarkan dari hal ini adalah bahwa spesialis Ilmu Data mulai melakukan apa pun selain Ilmu Data. Sebaliknya, mereka akhirnya mengembangkan, membusuk, atau mengelola produk.
Jadi para pakar Ilmu Data berbeda. Tetapi bagaimana Anda menjamin bahwa Ilmu Data Anda tidak akan hidup di menara gading?
2.2. Lekatkan Profesional Ilmu Data di Tim Lain
Keajaiban terjadi ketika Anda menempatkan para pakar Ilmu Data bersama manajer produk, programmer, peneliti antarmuka, pemasar, dan banyak lagi.
Secara sederhana, fungsi objektif yang ingin Anda maksimalkan adalah sebagai berikut: interaksi yang bermanfaat antara spesialis Ilmu Data di tim Anda dan orang-orang di tim lain.
Saya suka memikirkannya menggunakan konsep saluran luas. Mari kita ilustrasikan ini dengan manajer produk yang dipasangkan dengan spesialis Ilmu Data.
Yang terburuk, ketika tidak ada saluran di antara mereka:

Ini berarti bahwa tidak ada komunikasi antara DS dan PM. Dengan kata lain, DS tidak akan mengetahui masalah produk apa pun yang dihadapi PM, yang membuatnya tidak mungkin untuk menganalisis atau menyelesaikan masalah ini.
Sedikit lebih baik ketika kita memiliki saluran sempit di antara mereka:

Dalam hal ini, informasi datang, tetapi biasanya terbatas dan seringkali tidak sinkron. Informasi datang melalui orang lain (misalnya, manajer lain) atau melalui formulir permintaan, dll. Jenis komunikasi ini umum ketika diharapkan bahwa spesialis Ilmu Data akan melayani banyak pelanggan yang berbeda. Tapi ini bisa membuat frustrasi, karena konteks bisnis sering tidak ada, dan ini dapat menyebabkan kesalahpahaman dan keributan bodoh.
Kondisi yang paling efektif adalah ketika kita memiliki saluran yang luas:

Dalam arti paling harfiah, saluran lebar adalah ketika spesialis Ilmu Data duduk di sebelah manajer produk. Ini, tentu saja, memungkinkan mereka untuk berkomunikasi jauh lebih efektif. Menjaga orang agar tetap dekat secara fisik tidak selalu nyaman atau bahkan mungkin (kami di Schibsted tersebar di 22 negara yang berbeda!), Tetapi ada versi virtual dari prinsip ini: dari Slack hingga pemrograman pasangan jarak jauh dan Hangouts.
Secara alami, tidak mungkin bagi setiap manajer produk di perusahaan untuk mengatur saluran yang luas dengan setiap spesialis Ilmu Data di tim Anda, ini tidak berskala. Tugas Anda sebagai manajer Ilmu Data adalah menentukan kapan mengatur saluran yang luas. Dan kemudian menyingkirlah!
Salah satu kasus di Schibsted ketika kami secara aktif bekerja untuk menciptakan saluran yang luas adalah pengembangan alat penetapan harga mobil kami, yang membantu Anda menetapkan harga saat menjual mobil Anda ( coba di pasar Finn kami di Norwegia ). Awalnya, kami memiliki saluran yang agak tipis, seperti ini: "Cobalah untuk membangun model penetapan harga paling akurat yang Anda bisa." Kami menemukan ini sangat tidak efisien, karena ada banyak pertanyaan produk yang tidak dapat kami jawab tanpa bereksperimen dengan pengguna pada tahap awal.
Namun, setelah beberapa waktu, semuanya berakhir dengan fakta bahwa kami mengintegrasikan salah satu spesialis Ilmu Data kami ke dalam tim produk, dan kami mendapatkan hasilnya jauh lebih baik. Anda dapat membaca tentang beberapa pekerjaan awal kami pada alat peringkat mobil di pos ini .
Contoh ketika kami memiliki saluran lebar dari awal adalah model perkiraan untuk langganan digital baru . Model ini membantu meningkatkan konversi penjualan sebesar 540% dan diberi penghargaan INMA Best Use of Data Analysis Award pada tahun 2017.
2.3. Bertanggung jawab atas produktivitas analitik
Andrew Grove menyatakan dalam buku High Output Management bahwa Anda, sebagai manajer, memiliki hasil tim Anda. Ini berarti bahwa manajer Ilmu Data harus berinvestasi dalam menciptakan lingkungan sebaik mungkin agar spesialis Ilmu Data-nya menjadi produktif.

Ini dalam banyak hal bertentangan dengan model penanaman yang dijelaskan di atas. Jika Anda menanamkan semuanya sepanjang waktu, ada kemungkinan besar bahwa sebagai hasilnya Anda akan mendapatkan gudang data dan infrastruktur yang tidak optimal, diduplikasi beberapa kali.
Beberapa manajer pengembangan mengklaim bahwa ketika Anda menjadi seorang pemimpin, Anda harus benar-benar berhenti menulis kode. , Data Science 10% : , . . Data Science.
« 15 , , , , ad-hoc ?! , ».
« ― ?»
.
, . , , , Data Science.
, Lean Management, Data Science. XKCD :

, Data Science . !
2.4. -> ->
«» , Data Science, . Data Science . , , , .

:
- . 98% , , (… , ).
- , , - , .
, Data Science, , , , .
, , .
, , , , . , .
, ― . , . . Slack . ( !) , .
. . , !
, ? , , . , , , Data Science.
. , , , , . .
2.5. ,
Data Science. , . , , - , ?
Ferrari, .

, .

Ferrari , .

Data Science ― , , . , , , , (ROI).
Data Science. - , .
, , . , , , , ― , . , , .
, Data Science . , . , , , .
2.6. OKR
, Data Science. Objectives and Key Results (OKR). , OKR ― , . , . OKR , .
OKR , , , , .
, OKR , . , : , .
, , OKR.
-: OKR. OKR , , , . « », . , . , .
LSTM ? , NLP-, , LSTM . ? . ? , .
OKR, .
, OKR . , .
-: OKR . , . , :

, , 10 , . , , ― . . OKR .
, , OKRs ― .
2.7.
Dan pada akhirnya poin paling penting.
Ketika Google mempelajari tim-timnya selama dua tahun untuk mencari tahu apa yang membuat beberapa tim bekerja dengan baik dan yang lain membuatnya kurang berfungsi, ada satu hal yang menonjol. Ini keamanan psikologis .
Singkatnya, keamanan psikologis dapat diringkas sebagai keyakinan bahwa Anda tidak akan dihukum ketika Anda melakukan kesalahan.
Sekarang pikirkan tentang ini dalam konteks pengantar Bagian I. Sindrom penipu sangat besar dalam Ilmu Data. Apa yang Anda takutkan ketika Anda merasa seperti penipu? Buat kesalahan
Selama bertahun-tahun, saya telah menemukan bahwa orang-orang dari berbagai bidang datang ke Ilmu Data. Di tim Schibsted kami, kami beruntung bahwa kami memiliki orang-orang yang fantastis dengan pengalaman yang sangat luas. Orang-orang dengan pengalaman di bidang keuangan, penelitian, pendidikan, konsultasi, pengembangan perangkat lunak, dll.
Adalah bodoh untuk menganggap bahwa semua orang ini mengetahui hal yang sama. Sebaliknya, nilai dari pengalaman yang begitu beragam terletak pada kenyataan bahwa setiap orang membawa sesuatu yang baru bagi tim.
Gagasan Ilmu Data "unicorn" adalah racun bagi keamanan psikologis.
Apakah ada perbaikan cepat untuk meningkatkan keamanan psikologis? Saya kira tidak. Tetapi saya percaya bahwa itu harus di bagian atas daftar prioritas Anda sebagai manajer - terutama ketika Anda membuat tim baru atau ketika anggota baru bergabung dengan Anda. Meskipun tidak ada perbaikan cepat, ada langkah-langkah jelas yang dapat Anda ambil untuk meningkatkan keamanan psikologis. Berikut adalah beberapa yang bekerja dengan baik untuk kami:
- Buat budaya umpan balik . Jelaskan bahwa anggota tim Anda diharuskan untuk berkomunikasi "plus dan apa yang dapat ditingkatkan" satu sama lain setelah presentasi, sprint, dll. Omong-omong, Anda sebagai manajer harus melakukan ini juga! Dan ajari orang bagaimana memberikan umpan balik yang membangun dengan benar - ini bukan hal yang wajar bagi semua orang.
- Tingkatkan waktu tatap muka . Pemrograman pasangan, pemecahan masalah di papan ... Ini sangat penting untuk tim jarak jauh. Tiket ini hampir pasti bernilai uang.
- Buat pasangan atau tim alih-alih pekerjaan individu. Anda mungkin akhirnya melakukan lebih sedikit hal dalam tim, tetapi Anda akan melakukannya dengan lebih baik. Dan mereka yang bekerja sama akan membangun kepercayaan satu sama lain.
- Dorong diskusi pertemuan yang terbuka dan jujur . Bekerja aktif untuk menyeimbangkan waktu siaran semua peserta - beberapa orang mungkin perlu diminta untuk berbicara.
- Ingat perbedaan budaya . Anda dapat berasal dari budaya egaliter, eksplisit dan langsung . Ada kemungkinan besar bahwa Anda akan kehilangan sinyal dari anggota tim yang berasal dari budaya hierarkis, implisit, dan tidak langsung.
- Lakukan eksperimen kelompok untuk peningkatan berkelanjutan. Melibatkan seluruh tim dalam masalah "Bagaimana Anda mengelola tim dengan sukses" memberi setiap orang rasa tanggung jawab atas kesejahteraan tim.
- Ukur kebahagiaan dan keamanan psikologis. Temukan cara mudah untuk secara teratur mengajukan pertanyaan tentang kebahagiaan dan keamanan psikologis. Jika Anda tidak memiliki sistem SDM yang trendi untuk tujuan ini, mulailah dengan Typeform dan lakukan iterate hingga Anda dan tim menemukannya berguna. Bagikan peringkat rata-rata (anonim) atau temuan dengan tim dan sertakan dalam cara memperbaiki situasi.
...
Selamat, Anda telah mencapai akhir! Saya harap posting ini sedikit bermanfaat bagi Anda sebagai spesialis atau manajer Ilmu Data.
Kami telah melalui banyak hal, berikut adalah daftar pendek:
Bagian I: Ilmu Data dalam Kehidupan Nyata
1.1. Kompleksitas meningkatkan nilai, mulai dengan yang sederhana
1.2. Selalu memiliki model dasar
1.3. Gunakan data yang Anda miliki
1.4. Ambil alih data
1.5. Lupakan datanya
1.6. Kembangkan pemahaman terperinci tentang kausalitas
Bagian II: Mengelola Tim Ilmu Data
2.1. Tim Ilmu Data sebenarnya bukan tim
2.2. Lekatkan Profesional Ilmu Data di Tim Lain
2.3. Bertanggung jawab atas produktivitas analitik
2.4. Data -> Kekuasaan -> Politik
2.5. Gunakan sumber daya Anda, berjuang untuk pengembalian investasi yang tinggi
2.6. OKR untuk fokus dan perataan
2.7. Pertama-tama, keamanan psikologis
...
Terima kasih sudah membaca! Jika ini bermanfaat, pertimbangkan untuk membagikan pos ini dengan orang lain. Saya berharap suatu hari nanti dapat melihat pemikiran Anda sendiri tentang bekerja sebagai spesialis atau manajer sains data