Cara cepat menemukan dan tidak kehilangan spesialis AI dan Data Science

Bekerja sama dengan Anna Perova


Pendahuluan


Setiap hari, umat manusia menciptakan, menggunakan, dan menyimpan sejumlah besar data. Setiap artikel, blog atau posting instagram, setiap suka dan memang setiap fakta komunikasi adalah data yang, ketika diproses, menjadi berharga, menghasilkan keuntungan dan memperingatkan terhadap risiko siapa yang memilikinya dan tahu bagaimana cara mengekstrak informasi yang relevan.


Dengan meningkatnya kemampuan analisis data dan kesadaran akan kegunaan arsip yang ada, kebutuhan akan para ahli dalam Ilmu Data, pembelajaran mesin dan kecerdasan buatan (AI) juga dapat bekerja dengan data dan membuat model yang berguna berdasarkan data tersebut, serta sistem data pemrosesan sendiri dan memaksanya. untuk bekerja.


Mengapa mereka yang merekrut tim di bidang ini perlu memikirkan metode perekrutan baru?


Seperti TechCrunch menulis kembali pada tahun 2015 , menurut Mckinsey , yang, diakui, tidak jauh dari kebenaran, 490.000 spesialis akan diperlukan di daerah ini pada 2018.


Jika Anda mengandalkan data LinkedIn - dari 236 juta profil, sekitar 11.400-19.400 adalah profil Data Scientists.


Sudah, rata - rata investasi tahunan Amazon di AI Hiring adalah $ 227,8 juta , sementara investasi pesaing utama Google di AI Hiring adalah $ 130,1 juta . Spesialis di bidang kecerdasan buatan perusahaan terkemuka menerima dari $ 100.000 hingga $ 500.000 per tahun. Ini dibuktikan oleh survei yang dilakukan oleh The New York Times, dan pada prinsipnya diperiksa secara berkala baik di dice.com, atau monster.com, atau di LinkedIn.


Area ini baru dan sedang tren. Kuantitas dan kualitas spesialis muda tidak memenuhi permintaan tertinggi bagi mereka baik di seluruh dunia maupun di Rusia - di sini situasinya hanya berbeda dalam urutan gaji dan sejauh ini - dalam jumlah lowongan terbuka di bidang Ilmu Data & AI.


Menurut analisis hh.ru, jumlah lowongan terbuka di bidang Pembelajaran Mesin, Pembelajaran Mendalam, Ilmu Data: lebih dari 1000. Jumlah spesialis terlatih dengan pengalaman yang diperlukan tidak lebih dari 300. Kandidat dengan setidaknya pengalaman minimal dalam bidang AI ini, Ilmu Data tidak cocok untuk posisi ini sekitar 3 ribu. Dan ini sendiri merupakan masalah untuk pencarian dan perekrutan karena:


  • di satu sisi, hanya ada sedikit spesialis berharga;
  • di sisi lain, ada banyak kandidat yang baru memulai jalannya di lapangan yang bersangkutan, ke dalam pelatihan siapa (dalam hal perekrutan) mereka harus berinvestasi.

Semua ini mengarah ke pasar tenaga kerja yang sangat panas, dan ketika mempekerjakan di daerah ini, sejumlah faktor harus diperhitungkan:


  • kompetisi tertinggi untuk talenta (gaji & ketentuan) - ada lebih banyak lowongan daripada kandidat, tetapi persyaratan untuk kandidat tinggi; perkiraan statistik: 10-15 tawaran pekerjaan untuk satu kandidat dengan pengalaman 3+ tahun di Ilmu Data & AI;
  • perusahaan dipaksa untuk lebih fleksibel dalam hal gaji, jadwal, peluang tambahan, secara umum, preferensi diberikan pada jam kerja yang fleksibel, paruh waktu, kebutuhan akan kebebasan untuk menjadi kreatif untuk menemukan pendekatan dan solusi terbaik;
  • kandidat tertarik pada proyek dan tugas sejak itu Data Scientist - sering memiliki tipe kepribadian tertentu: pola pikir analitis, motivasi untuk pengembangan intelektual dan profesional, keinginan untuk penelitian, berbagai tugas, keingintahuan dan di tempat itu ada individualisme tertentu dan ketelitian dalam mengenali hasil;
  • perusahaan tetap membutuhkan tim yang kuat, yang mampu memberikan hasil tepat waktu, di mana ada seseorang untuk belajar, dan dengan siapa membuat proyek penelitian;
  • sumber daya dan kapasitas, peralatan yang baik, GPU diperlukan.

Karena tingginya kompetisi untuk bakat di bidang ini, sejumlah pertanyaan seleksi muncul, yang utamanya adalah:


  • Di mana menemukan spesialis AI & Ilmu Data?
  • Cara mengenali Bagaimana memilih yang terbaik atau yang paling menjanjikan (siapa yang akan dengan cepat dan menguntungkan menjalani pelatihan) dari sekelompok kecil kandidat? Apa yang harus menjadi kriteria seleksi untuk Headhunter?
  • Bagaimana tidak kalah? Bagaimana cara mempertahankan profesional AI & Data Science?

1. Di mana menemukan?


Selain sumber-sumber standar dan terkenal, saya ingin menarik perhatian ke spesialis paling produktif dalam hal pengalaman pribadi saya dalam mempekerjakan AI & Data Science.


  • Slack, Buka Saluran Sains Data. Sumber daya ini bukan untuk perekrut dan terutama ditujukan untuk komunikasi antara insinyur dan spesialis di bidang Ilmu Data.
    Apa yang perlu Anda lakukan: Posting iklan Anda di Slack di komunitas Open Data Science. Lebih baik untuk meminta kolega Anda, spesialis DS atau insinyur Data, untuk melakukan ini, tanpa menyembunyikan tingkat gaji dan peluang untuk pengembangan. Tekankan fitur-fitur tugas dan proyek yang menarik, teknologi yang dapat digunakan.


  • Kompetisi yang Memukau.
    Apa yang perlu Anda lakukan: Pilih yang teratas - 50-100 di kompetisi Kaggle. 20 pertama biasanya menyelesaikan masalah untuk kesenangan, menikmati bekerja di perusahaan besar dan tidak mencari pekerjaan. Setelah 20 pertama, Anda dapat memilih kandidat potensial dengan potensi tinggi dalam DataScience dan AI, hubungi mereka, tawarkan pertemuan dan proyek. Dalam hal penolakan, dimungkinkan untuk meminta rekomendasi menggunakan program referensi perusahaan Anda (Anda dapat mengajukan pertanyaan secara terperinci tentang berburu dengan Kaggle di PM, atau, jika Anda tertarik, kami akan menyiapkan materi terpisah).


  • Indeks-H. Indeks Hirsch, tetapi lebih merupakan metode untuk mengevaluasi / mencari kandidat, yang lebih baik digunakan saat mencari AI, ML / DL, Visi Komputer, pakar Ilmu Data. Kriteria ini memungkinkan untuk mengevaluasi mana dari para ilmuwan dan profesor yang dikutip lebih baik dan mana yang lebih buruk dan menemukan mereka yang berspesialisasi dalam bidang profesional yang diinginkan dan dapat menjadi guru untuk spesialis muda. Apa yang perlu Anda lakukan: mencari Ilmu Data dan spesialis AI menggunakan data terbuka pada indeks Hirsch. Dapatkan minat pada topik yang sesuai dengan kebutuhan Anda. Indeks rata-rata untuk ilmuwan dari berbagai tingkatan:
    1. ilmuwan muda, mahasiswa pascasarjana - 0-2;
    2. Kandidat Sains - 3-6;
    3. Doctor of Science - 7-10;
    4. Anggota Dewan Disertasi - 10-15;
    5. ilmuwan terkenal dunia, ketua Dewan Disertasi - 16 ke atas.

Situs yang berguna untuk mencari kandidat berdasarkan indeks kutipan: eLIBRARY.ru.
Situs ini berisi publikasi oleh para ilmuwan Rusia. Ada lebih dari 24 juta artikel yang diposting, basis data terus diperbarui.
Salah satu celah utama adalah mendaftar di situs, kemudian menemukan profesor dengan sejumlah besar publikasi dengan kutipan tingkat tinggi, menemukan cara untuk menghubunginya dan meminta rekomendasi dari rekan penulis dan mahasiswa. Sebagai pilihan, buka publikasi dan hubungi penulis bersama melalui jejaring sosial yang dapat diakses.
Ketika merekrut para ilmuwan, penting untuk mempertimbangkan bahwa mereka mungkin tidak memiliki keterampilan praktis dan pemahaman tentang bisnis, tetapi karir ilmiah mereka mungkin berguna untuk pengembangan proyek-proyek sains intensif, termasuk di bidang AI.


  • Atur kompetisi Ilmu Data Anda sendiri: hackathon, kompetisi pemrograman. Peristiwa semacam itu dilakukan oleh Komunitas AI, Open Data Science, dll. Anda dapat mencoba mengaturnya sendiri, tetapi kualitasnya cenderung menurun.
    Contoh kompetisi yang bagus: Kontes Sberbank .


  • Mulai kursus pelatihan ML / Deep Learning gratis - formatnya tidak penting. Yang utama adalah memutuskan topik dan tugas, memantau spesialis yang paling sesuai dengan hasil penyelesaian "pekerjaan rumah". Untuk saluran yang bagus, undang lebih dari 50 yang paling menjanjikan. Akibatnya, akan ada sekitar 10-15, dan Anda akan menyewa tidak lebih dari 5, tetapi metode ini akan menghemat banyak waktu dan tenaga.
  • Sistem rekomendasi internal. Tetapkan bonus referensi yang layak untuk karyawan internal. Merangsang rekomendasinya.
  • Kembangkan jaringan AI Anda. Komunitas AI dan Ilmu Data di Rusia dan di dunia masih sangat kecil dan aktif berkomunikasi di konferensi, mudah untuk mendapatkan rekomendasi dari para guru dan pembicara, seringkali bahkan mungkin untuk melakukannya secara gratis (OpenAITalks, Skolkovo Robotics, NIPS, ICLR dll.)

2. Cara memilih spesialis Ilmu Data & AI yang sangat baik


Tidak mudah bagi HR untuk memahami semua konsep sekaligus, jadi yang paling penting adalah memahami judul utama dengan baik agar setidaknya entah bagaimana mengarahkan diri Anda. Dan bertindak sesuai dengan instruksi (bab "DAFTAR FINAL, atau Prinsip pemilihan personel") - yaitu dengan sangat jelas menyeimbangkan kompleksitas pekerjaan dan menguji motivasi finansial dan non-finansial.


Jadi, sebagai permulaan, penting untuk memutuskan apa yang sekarang dipahami sebagai Ilmuwan Data


Data Para ilmuwan menggunakan data statistik, pembelajaran mesin, dan pendekatan analitis untuk memecahkan masalah bisnis yang kritis. Fungsi utama mereka adalah untuk membantu organisasi mengubah volume data besar mereka menjadi model yang berharga dan dapat ditindaklanjuti.


Mereka harus memiliki pengetahuan yang baik tentang matematika, program, mengembangkan algoritma pembelajaran mesin untuk mengotomatisasi algoritma. Mereka juga diharapkan memiliki kemampuan tinggi untuk menginterpretasikan data, kemampuan memvisualisasikannya penting, keterampilan memecahkan masalah itu penting, bahkan jika masalahnya tidak dirumuskan sampai akhir.


Adalah penting bahwa mereka dapat bekerja dengan berbagai jenis data dan data dari berbagai tingkat kesiapan.


Latar belakang matematika yang baik (pengetahuan tentang aljabar linier, geometri analitik, teori probabilitas dan statistik matematika) adalah suatu keharusan. Dan ini bahkan lebih penting untuk analisis data daripada pengetahuan teknik. Pelatihan model ML membutuhkan pemahaman tentang model mana yang harus digunakan, bagaimana menafsirkan dan bagaimana meningkatkan hasil.


Pengetahuan bahasa pemrograman : Python atau R (tetapi menavigasi tumpukan teknologi yang Anda gunakan); C / C ++; Jawa
Keahlian : Scala, Apache Spark, Hadoop, pembelajaran mesin, pembelajaran mendalam, dan statistik.
Sebagai tambahan : Tensorflow, PyTorch, Keras, Caffe, Pandas dll., Jupyter, dan RStudio., Pengalaman dengan sistem yang sangat dimuat, Cuda.


Perbedaan antara Ilmuwan Data dan Insinyur Data adalah kemampuan untuk tidak hanya menganalisis data, tetapi juga mengintegrasikannya ke dalam sistem yang ada. Dalam hal ini, pengetahuan yang mendalam tentang bahasa pemrograman, serta pengalaman membuat atau berpartisipasi dalam penciptaan sistem yang sangat banyak, multi-threaded, dll., Sangat penting.


Konsep kunci yang harus dipahami oleh perekrut adalah Pembelajaran Mesin, Pembelajaran Mendalam, Ilmu Data, Penambangan Data, Big Data, Visi Komputer, Pemrosesan Gambar, pengenalan mobil, pengenalan wajah, sistem Rekomendasi, pemrosesan Bahasa Alami, pemrosesan kaggle.


Memfilter kandidat berdasarkan wawancara SDM telepon:


  1. Penting untuk memahami seberapa dalam pengetahuan kandidat dalam matematika (aljabar linier, teori probabilitas)
  2. Kerangka apa yang digunakannya? Pengalaman yang beragam disambut.
  3. Apa proyek proyek paling kompleks yang harus dibuat? Apa peran dan hasil pribadi?
  4. Kompetisi apa yang dia ikuti?
  5. Apakah ada artikel di jurnal ilmiah dan di sini di habr.com?

Algoritma rekrutmen dan seleksi:


  1. Wawancara teknis terdiri dari 3 bagian:
    • Pengujian online selama 20 menit. Contoh situs untuk memposting tes online. ;
    • Pengujian - 1 jam. Wawancara teknis di kantor. Tugas tes 20 menit-1 jam. Anda dapat membuat tes 10-15 tugas (tugas dalam teori probabilitas, statistik matematika, visi komputer, pembelajaran mesin). Tes dilakukan oleh kandidat sendirian di ruang pertemuan. Dia tidak harus menyelesaikan semua masalah, tetapi penting untuk menyelesaikan setidaknya 50%. Dalam pengujian, penting untuk menetapkan poin untuk penilaian obyektif dan kemampuan untuk membandingkan kandidat;
    • Bagian lisan dari wawancara teknis adalah 1 jam (diskusi tentang hasil masalah dalam teori probabilitas, statistik matematika dan analisis tentang bagaimana kandidat mendekati pemecahan masalah dalam visi komputer, pembelajaran mesin).

Harus dipahami bahwa kondisi kerja dan "barang" lainnya diketahui oleh kandidat dan disuarakan sebelumnya, jika tidak, motivasi tidak hanya untuk semua orang .


  1. Wawancara SDM & Kepribadian dengan Timlider
    Ciri-ciri kepribadian yang diperlukan untuk seorang DataScientist adalah:
    • Kemampuan belajar yang tinggi Dia harus pintar, cepat memperoleh keterampilan baru, bersiaplah dan terus-menerus berkembang di bidangnya dan lebih disukai di bidang subjek perusahaan.
    • Keingintahuan, minat pada teknologi baru, pengalaman praktis dalam penggunaannya, minat dalam bidang terkait.
    • Ketekunan dan ketekunan - kemampuan untuk mengerjakan satu masalah untuk waktu yang lama
    • Kreativitas - minat pada peluang baru, motivasi dan kemampuan untuk datang dengan solusi baru.

Cara mempertahankan spesialis AI & Data Science di perusahaan:


Di sini, alat retensi standar memiliki karakteristiknya sendiri.


  • Kemampuan untuk bekerja dengan seorang guru, ahli di Pasar AI di Rusia atau negara lain, kemampuan untuk menulis PHD, melakukan penelitian bersama;
  • Sebuah tim profesional yang kuat, dari siapa dimungkinkan untuk belajar dan dengan siapa itu menarik untuk membuat proyek AI (Top-10 universitas, karyawan dari perusahaan berskala besar dari pemimpin pasar AI di Rusia);
  • Kemampuan menulis artikel. Untuk melakukan penelitian, dan publikasi untuk konferensi internasional (NIPS, ICLR dll.);
  • Bantuan dalam memperoleh gelar ilmiah, termasuk internasional;
  • Akses ke sumber utama.

Dan nilai-nilai universal:


  • Tugas yang menarik, kemampuan untuk membuat publikasi;
  • Gaji tinggi, pertumbuhan regulernya sesuai dengan tingkat pasar;
  • Hormat Termasuk kepercayaan dalam keahlian, pengakuan prestasi dalam perusahaan dan komunitas ilmiah (bonus, bonus untuk mencapai hasil);
  • Peralatan bagus, akses ke data;
  • Informasi tentang perubahan - karyawan harus mengetahui rencana masa depan perusahaan. Bahkan di perusahaan besar, penting untuk berhati-hati agar tidak membuat mereka dalam kegelapan;
  • Merawat karyawan - jajak pendapat reguler dengan kemungkinan menerima jawaban jujur. Cara meningkatkan kehidupan karyawan, membantu mereka menjadi lebih efisien (buah-buahan di kantor, alat musik, ruang untuk relaksasi, selamat tidak hanya pada hari ulang tahun Anda, tetapi juga pada hari libur lainnya, dll).

Sebagai kesimpulan, perlu dicatat bahwa penting untuk mengetahui bahwa perbedaan antara lowongan ini dari yang lain - metode rekrutmen sebelumnya untuk para kandidat ini tidak bekerja begitu efektif. Penting untuk mencapai keseimbangan antara kekurangan spesialis yang ekstrim, keinginan untuk menjadi lebih fleksibel dalam kondisi dan kebutuhan untuk menyaring dan memilih profesional yang kuat yang dapat memberikan kontribusi positif terhadap perubahan bisnis.

Source: https://habr.com/ru/post/id412625/


All Articles