Demokratisasi data Uber

Halo semuanya!


Di bawah Halloween, saya menghadiri sebuah konferensi di Budapest ( Data Crunch ) dan mendengarkan sejumlah presentasi yang menarik. Salah satunya adalah dari Uber, yang berbicara tentang pendekatan yang mereka gunakan untuk mengelola platform manajemen data mereka. Laporan ini tidak terlalu teknis seperti manajerial dan bahan makanan.


Uber memanfaatkan ekstensif data yang dikumpulkannya sebagai hasil interaksi dengan penumpang dan pengemudi. Mereka menghitung biaya perjalanan, mengevaluasi arus orang, mengubah algoritma harga, memberikan rekomendasi kepada pengemudi tentang bagaimana mereka dapat menghasilkan lebih banyak uang dan semua ini berdasarkan pada data yang dikumpulkan. Dalam perusahaan seperti itu, semua pekerjaan dengan data tidak dapat terkonsentrasi di tangan sekelompok analis dan DS, karena jika tidak, mereka harus mempekerjakan terlalu banyak, dan selain itu, mereka tidak selalu tenggelam dalam konteks bisnis.


Sejak awal, perusahaan mengambil jalur membangun platform manajemen data yang akan memungkinkan penggunaan alat analitik yang cukup canggih untuk berbagai pengguna. Mereka mengidentifikasi 4 kelompok utama:


  1. Pengguna biasa - mereka tahu SQL dasar, pada dasarnya hanya perlu tabel data, dasbor)
  2. Manajer regional - mereka tahu sedikit lebih banyak SQL, lihat data di bagian yang berbeda, ada kebutuhan besar untuk slice & dadu
  3. Analis Data - SQL Tingkat Lanjut, Bangun Dasbor, Lakukan Penelitian, Cari Wawasan dalam Data
  4. Ilmu Data - tingkat maksimum pemahaman bekerja dengan data, membangun model, melakukan eksperimen, tes A / B, dll.
    Di sela-sela, saya juga belajar dari mereka bahwa sebenarnya ada tingkat 5 - manajer top yang terutama menggunakan laporan dan dasbor tingkat atas.

Menariknya, di Uber, orang-orang yang bekerja entah bagaimana dengan data harus mengetahui SQL setidaknya pada tingkat minimum.


Sebagai contoh produk yang mereka buat berdasarkan platform mereka, mereka mengutip otomatisasi tes A / B. Perusahaan membelanjakan sejumlah besar A / B dan mengalokasikan untuk masing-masing Data Scientist, sehingga ia mengorganisir percobaan dan kemudian memberikan penilaian tes - lagi, bukan kemewahan yang diijinkan. Oleh karena itu, mereka ingin memberi pengguna biasa kesempatan untuk menafsirkan dan menggunakan A / B dengan benar dan tanpa kesalahan, tanpa memuat Data Scientist.


Konstruksi mereka atas produk ini dimulai dengan pekerjaan yang mendalam dengan Data Scientist, sebagai jika orang-orang ini tidak yakin bahwa semuanya dianggap benar, maka tidak ada produk Data yang akan keluar. Bahkan, mereka mulai mengotomatiskan peluncuran dan evaluasi tes A / B, memberikan Data Scientist alat untuk membuat hidup mereka lebih mudah. Setelah itu, mereka membangun antarmuka pada alat ini yang akan menunjukkan hasil tes dalam bentuk sederhana (apa yang diluncurkan, perbedaan apa, apakah perbedaannya signifikan). Pada saat yang sama, mereka menyembunyikan "di balik tudung" jumlah maksimum nuansa yang melekat dalam tes A / B sehingga pengguna tidak perlu menyelam jauh ke dalam matematika dan statistik.


Menariknya, sebagian besar orang yang berbicara dengan saya tentang rehat kopi mengatakan bahwa mereka tidak memiliki tes A / B dalam praktik mereka, bahwa mereka menggunakan banyak penelitian kualitatif dan intuisi ketika membuat keputusan. Jadi seperti di tempat lain, begitu Anda berpikir, Anda perlu memotong!

Source: https://habr.com/ru/post/id428772/


All Articles