Apa yang saya pelajari tentang pembelajaran mesin setelah bekerja di 12 startup

Halo semuanya.

Setelah bekerja di 12 startup di bidang pembelajaran mesin, saya membuat delapan kesimpulan yang berguna tentang produk, data, dan orang-orang.

Semua startup berasal dari area yang berbeda (fintech, bioteknologi, perawatan kesehatan, teknologi pelatihan) dan pada tahap yang berbeda: baik pada tahap pra-seed dan pada tahap akuisisi oleh perusahaan besar. Peran saya juga telah berubah. Saya adalah seorang konsultan strategis, kepala analisis data, dibanjiri dengan karyawan penuh waktu. Semua perusahaan ini berusaha menciptakan produk yang baik, dan banyak yang berhasil.

Selama bekerja, saya sampai pada kesimpulan berikut:

Produk lebih penting daripada AI


Startup ini mengembangkan produk, bukan belajar kecerdasan buatan. Sebagai ahli matematika yang yakin, pada awalnya saya lebih tertarik pada pembelajaran mesin dan penciptaan metode dan algoritma baru.

Saya segera menyadari bahwa model pembelajaran mesin yang akurat pun tidak berharga dalam dan dari diri mereka sendiri. Nilai AI dan pembelajaran mesin secara langsung tergantung pada nilai produk di mana mereka digunakan. Tujuan dari startup adalah untuk belajar cara membuat produk pembelajaran mesin.

Dengan pendekatan ini, kadang-kadang ternyata pembelajaran mesin bukanlah alat yang paling efektif. Terkadang masalahnya bukan pada tugas yang dihadapi, tetapi dalam proses penyelesaian. Bahkan dalam situasi seperti itu, sangat berguna untuk beralih ke ilmuwan: mereka menggunakan pendekatan berbasis data yang ilmiah. Namun, jangan buang waktu di AI di mana Anda harus memperbaiki proses.

Berusaha keras untuk sinergi antara data dan produk


Anda tidak dapat membuat sesuatu yang berharga dengan menambahkan perkiraan berdasarkan model pembelajaran mesin ke produk yang sudah ada. AI yang kuat bukanlah pelengkap produk, itu adalah fondasinya. Dalam kasus seperti itu, AI yang menciptakan nilai. Produk tersebut dikembangkan dengan mempertimbangkan fakta ini: di dalamnya produk dan data bekerja secara sinergis.

Eksekusi yang baik menghasilkan interaksi yang saya sebut "kombinasi produk dan data." Produk sepenuhnya menyadari potensi data dan pada saat yang sama menghasilkan data baru yang diperlukan untuk perbaikan.

Saat bekerja pada AI, tidak hanya insinyur dan ilmuwan yang bekerja dengan data ini yang dibutuhkan. Bekerja pada nilai produk lebih cepat jika anggota tim lain berpartisipasi dalam diskusi, dari manajer produk ke manajer. Ini membutuhkan tingkat pengetahuan dan keterlibatan yang bahkan para insinyur yang bekerja di startup tidak terbiasa.

Data pertama, lalu AI


AI dan pembelajaran mesin membutuhkan banyak data berkualitas tinggi. Saat membuat produk dari awal, pikirkan tentang pengumpulan data sejak hari pertama. Sebelum memperkenalkan teknologi kecerdasan buatan ke dalam produk yang sudah ada, bersiaplah untuk berinvestasi banyak dalam rekayasa data dan perubahan arsitektur.

Pertama, cari tahu nilai produk, dan baru kemudian mulai bekerja. Semakin baik pemrosesan data, semakin informatif analisisnya - ini sangat penting untuk pengembangan perusahaan. Jadi, Anda menunjukkan nilai produk dan menarik investor. Mulailah berpikir tentang kecerdasan mesin saat analitik dapat diandalkan.

Investasikan dalam komunikasi


Untuk membuat produk, Anda memerlukan manajer produk yang berkualitas dan dukungan manajemen. AI yang kuat dan pembelajaran mendalam sangat menarik bagi banyak orang, tetapi orang-orang yang jauh dari industri TI tidak berpengalaman dalam teknologi ini. Untuk membahas pembelajaran mesin dan AI, Anda perlu memahami statistik: komunikasi yang tidak efisien mengarah pada harapan yang tidak realistis.

Manajer produk dan insinyur data harus secara konstan mendiskusikan metrik bisnis dan bagaimana mereka diubah menjadi suatu produk. Ini sangat penting bagi para insinyur: untuk pekerjaan yang efektif, mereka perlu memperdalam pengetahuan di bidangnya dan di bidang bisnis.

"Solusi sederhana dan jelas" tidak begitu jelas


Seperti yang saya sebutkan di atas, seringkali tugas lebih mudah diselesaikan dengan menggunakan metode yang sederhana dan jelas. Ini sebagian karena keputusan "sederhana dan jelas" hari ini kompleks dan asli kemarin. Menggunakan word2vec sekarang semudah regresi . Semakin banyak alat baru yang muncul setiap hari, dan memahami alat ini penting untuk seorang analis data.

Munculnya alat-alat open source baru telah mengarah pada fakta bahwa sekarang platform eksklusif dalam pembelajaran mesin bukanlah solusi yang efektif. Tentu saja, Anda harus menggunakan algoritma kepemilikan jika mereka efektif dalam industri Anda dan untuk menyelesaikan masalah Anda. Tapi mari kita tinggalkan studi mendalam karyawan Google - fokus pada tugas bisnis.

Jika ragu, tunjukkan data kepada pengguna


Pada tahap awal, penting untuk membangun umpan balik dengan pasar. Namun, pembelajaran mesin membutuhkan data yang membutuhkan banyak waktu untuk mengumpulkan. Ini masalahnya: bagaimana menganalisis gambar tanpa data dalam jumlah besar?

Lebih sering daripada tidak, solusi terbaik adalah menunjukkan data yang terakumulasi kepada pengguna. Tidak masalah jika Anda memiliki sedikit data: orang hanya memproses sejumlah kecil data pada satu waktu. Lihat bagaimana pengguna berinteraksi dengan data: apa yang mereka abaikan dan apa yang ingin mereka pahami secara lebih rinci? Dengan cara ini Anda akan memahami seberapa potensial data bisnis Anda bernilai.

Bangun kepercayaan


Kepercayaan adalah dasar bagi keberhasilan sebagian besar teknologi: orang ingin mempercayai teknologi yang mereka gunakan. Beberapa orang khawatir bahwa otomatisasi akan merampok pekerjaan mereka, sementara yang lain bergantung pada teknologi untuk membuat keputusan penting. Dalam kedua kasus tersebut, kepercayaan pada aplikasi dan algoritma pembelajaran mesin adalah penting.

Jika kecerdasan buatan tidak membantu seseorang membuat keputusan, tetapi memutuskan sebaliknya, pengguna dengan cepat kehilangan kepercayaan pada aplikasi.

Kepercayaan mudah hilang dan sangat sulit untuk diperoleh kembali. Buat produk yang akan dipercaya orang.

Bagikan artikel dengan kolega, menarik kesimpulan dan bekerja secara produktif. Jika Anda memiliki sesuatu untuk dibagikan, tulis di komentar. Informasi lebih lanjut tentang pembelajaran mesin di saluran telegram Neuron (@neurondata).

Semua pengetahuan!

Source: https://habr.com/ru/post/id459775/


All Articles