Judul artikel ini mungkin agak aneh. Memang: jika Anda bekerja di bidang Ilmu Data pada 2019, Anda sudah diminati. Permintaan akan spesialis di bidang ini terus meningkat: pada saat penulisan ini, 144.527 lowongan dengan kata kunci "Ilmu Data" diposting di LinkedIn.
Namun demikian, itu pasti layak mengikuti berita dan tren terbaru di industri. Untuk membantu Anda dalam hal ini, tim
CV Compiler dan saya menganalisis beberapa ratus pekerjaan sains data pada bulan Juni 2019 dan menentukan keterampilan apa yang paling diharapkan pengusaha dari para kandidat.
Keterampilan Data Science paling dicari pada tahun 2019
Grafik ini menunjukkan keterampilan yang paling sering disebutkan oleh pemberi kerja dalam pekerjaan Ilmu Data pada tahun 2019:

Kami menganalisis sekitar 300 pekerjaan dengan StackOverflow, AngelList, dan sumber daya serupa. Beberapa istilah dapat diulang lebih dari satu kali dalam lowongan yang sama.
Penting: Peringkat ini menunjukkan preferensi pengusaha dan bukan spesialis di bidang Ilmu Data.
Tren Kunci dalam Ilmu Data
Jelas, Ilmu Data bukan terutama kerangka kerja dan perpustakaan, tetapi pengetahuan mendasar. Namun, beberapa tren dan teknologi masih layak disebut.
Data besar
Menurut
penelitian pasar Big Data pada tahun 2018 , penggunaan Big Data di perusahaan meningkat dari 17% di 2015 menjadi 59% di 2018. Dengan demikian, popularitas alat untuk bekerja dengan big data telah meningkat. Jika Anda mengabaikan Apache Spark dan Hadoop (kami akan membicarakan yang terakhir lebih terinci), alat yang paling populer adalah
MapReduce (36) dan
Redshift (29).
Hadoop
Meskipun popularitas Spark dan penyimpanan cloud,
era Hadoop belum berakhir. Oleh karena itu, beberapa perusahaan mengharapkan kandidat untuk mengetahui
Apache Pig (30),
HBase (32), dan teknologi serupa.
HDFS (20) juga ditemukan di beberapa pekerjaan.
Pemrosesan data waktu nyata
Mengingat penggunaan beragam sensor dan perangkat seluler di mana-mana, serta popularitas
IoT (18), perusahaan berusaha mempelajari cara memproses data secara real time. Oleh karena itu, platform threading seperti
Apache Flink (21) sangat populer di kalangan pengusaha.
Rekayasa Fitur dan Tuning Hyperparameter
Penyusunan data dan pemilihan parameter model merupakan bagian penting dari pekerjaan setiap spesialis di bidang Ilmu Data. Oleh karena itu, istilah
Data Mining (128) cukup populer di kalangan pengusaha. Beberapa perusahaan juga memperhatikan
Hyperparameter Tuning (21) (istilah seperti
Feature Engineering juga tidak boleh dilupakan ). Pemilihan parameter optimal untuk model adalah penting, karena kinerja keseluruhan model tergantung pada keberhasilan operasi ini.
Visualisasi data
Kemampuan untuk memproses data dengan benar dan menampilkan pola yang diperlukan adalah penting. Namun,
visualisasi data (55) adalah keterampilan yang sama pentingnya. Anda harus dapat mempresentasikan hasil pekerjaan Anda dalam format yang dapat dimengerti oleh anggota tim atau klien. Dalam hal alat visualisasi data, pengusaha lebih suka
Tableau (54).
Tren umum
Dalam lowongan, kami juga menemukan istilah seperti
AWS (86),
Docker (36), serta
Kubernetes (24). Dapat disimpulkan bahwa tren umum dari bidang pengembangan perangkat lunak secara perlahan bermigrasi ke bidang Ilmu Data.
Pendapat ahli
Daftar teknologi ini benar-benar mencerminkan keadaan sebenarnya dalam dunia Ilmu Data. Namun, tidak ada hal yang kurang penting daripada menulis kode. Ini adalah kemampuan untuk menafsirkan hasil pekerjaan mereka dengan benar, serta memvisualisasikan dan menyajikannya dalam bentuk yang dapat dimengerti. Itu semua tergantung pada audiens - jika Anda berbicara tentang prestasi Anda kepada kandidat sains, berbicara bahasa mereka, tetapi jika Anda menyajikan hasilnya kepada pelanggan, dia tidak akan peduli dengan kode - hanya hasil yang telah Anda capai.
Carla Gentry
Data Scientist, pemilik
Solusi AnalitikLinkedIn |
TwitterGrafik ini menunjukkan tren saat ini di bidang Ilmu Data, tetapi agak sulit untuk memprediksi masa depan berdasarkan itu. Saya cenderung percaya bahwa popularitas R akan menurun (seperti popularitas MATLAB), sementara popularitas Python hanya akan tumbuh. Hadoop dan Big Data juga masuk dalam daftar inersia: Hadoop akan segera menghilang (tidak ada yang serius berinvestasi dalam teknologi ini lagi), dan Big Data telah berhenti menjadi tren yang meningkat. Masa depan Scala tidak sepenuhnya jelas: Google secara resmi mendukung Kotlin, yang jauh lebih mudah dipelajari. Saya juga skeptis tentang masa depan TensorFlow: komunitas ilmiah lebih suka PyTorch, dan pengaruh komunitas ilmiah di bidang Ilmu Data jauh lebih tinggi daripada di semua bidang lainnya. (Ini adalah pendapat pribadi saya, yang mungkin tidak sesuai dengan pendapat Gartner).
Andrey Burkov,
Direktur Pembelajaran Mesin di Gartner,
penulis
Buku Pembelajaran Mesin Hundred-Page .
LinkedInPyTorch adalah kekuatan pendorong di belakang pembelajaran yang diperkuat, serta kerangka kerja yang kuat untuk eksekusi kode paralel pada beberapa GPU (yang tidak dapat dikatakan tentang TensorFlow). PyTorch juga membantu membangun grafik dinamis yang efektif ketika bekerja dengan jaringan saraf berulang. TensorFlow beroperasi dengan grafik statis dan lebih sulit untuk dipelajari, tetapi digunakan oleh lebih banyak pengembang dan peneliti. Namun, PyTorch lebih dekat ke Python dalam hal kode debug dan pustaka untuk visualisasi data (matplotlib, seaborn). Sebagian besar alat debug kode Python dapat digunakan untuk men-debug kode PyTorch. TensorFlow juga memiliki alat debugging sendiri - tfdbg.
Ganapati Pulipaka,
Kepala Ilmuwan Data di Accenture,
Pemenang 50 Penghargaan Pemimpin Teknologi.
LinkedIn |
TwitterMenurut pendapat saya, bekerja dan berkarir dalam Ilmu Data bukanlah hal yang sama. Untuk bekerja, Anda memerlukan seperangkat keterampilan di atas, tetapi untuk membangun karier yang sukses dalam Ilmu Data, keterampilan yang paling penting adalah kemampuan untuk belajar. Ilmu Data adalah bidang yang berubah-ubah, dan Anda harus belajar untuk menguasai teknologi, alat, dan pendekatan baru untuk mengikuti perkembangan zaman. Terus-menerus menimbulkan tantangan baru dan berusaha untuk tidak "puas dengan sedikit."
Lon Riesberg
Pendiri / Kurator
Data Elixir ,
ex-nasa.
Twitter |
LinkedInIlmu Data adalah bidang yang serba cepat dan kompleks di mana pengetahuan dasar sama pentingnya dengan pengalaman dengan alat-alat tertentu. Kami harap artikel ini membantu Anda menentukan keterampilan apa yang diperlukan untuk menjadi spesialis yang lebih dicari di bidang Ilmu Data pada tahun 2019. Semoga Sukses!
Artikel ini ditulis oleh tim CV Compiler , alat untuk meningkatkan resume untuk ilmu data dan profesional TI lainnya.