Rencana leveling untuk Insinyur Data profesi

Selama delapan tahun terakhir, saya telah bekerja sebagai manajer proyek (saya tidak menulis kode di tempat kerja), yang secara alami memengaruhi backend teknologi saya. Saya memutuskan untuk mengurangi backlog teknologi saya dan mendapatkan profesi sebagai insinyur data. Keterampilan inti seorang insinyur data adalah kemampuan untuk merancang, membangun, dan memelihara gudang data.

Saya membuat rencana pelatihan, saya pikir itu akan berguna tidak hanya untuk saya. Rencana ini difokuskan pada kursus belajar mandiri. Prioritas diberikan untuk kursus gratis dalam bahasa Rusia.

Bagian:

  • Algoritma dan struktur data. Bagian kunci. Jika Anda mempelajarinya, semua yang lain akan berhasil. Penting untuk membantu Anda menulis kode dan menggunakan struktur dan algoritma dasar.
  • Database dan gudang data, Business Intelligence. Kami beralih dari algoritma ke penyimpanan dan pemrosesan data.
  • Hadoop dan Big Data. Ketika database tidak termasuk dalam hard drive, atau ketika data perlu dianalisis, tetapi Excel tidak dapat lagi memuatnya, data besar dimulai. Menurut pendapat saya, transisi ke bagian ini diperlukan hanya setelah mempelajari dua yang sebelumnya.

Algoritma dan struktur data


Dalam rencana saya, saya termasuk belajar Python, mengulangi dasar-dasar matematika dan algoritma.


Database dan Gudang, Kecerdasan Bisnis



Topik yang terkait dengan membangun gudang data, ETL, kubus OLAP sangat bergantung pada alat, jadi saya tidak memberikan tautan ke kursus dalam dokumen ini. Dianjurkan untuk mempelajari sistem seperti itu ketika bekerja pada proyek tertentu di perusahaan tertentu. Untuk pengantar ETL, Anda dapat mencoba Talend atau Airflow .

Menurut pendapat saya, penting untuk mempelajari metodologi modern untuk mendesain data warehouse Data Vault link 1 , link 2 . Dan cara terbaik untuk mempelajarinya adalah dengan mengambil dan menerapkannya dengan contoh sederhana. GitHub memiliki beberapa contoh penerapan tautan Data Vault. Buku Gudang Data Modern: Memodelkan Gudang Data Agile dengan Gudang Data oleh Hans Hultgren.

Untuk membiasakan diri dengan alat-alat Business Intelligence untuk pengguna akhir, Anda dapat menggunakan desainer laporan, dasbor, mini data warehouse Power BI Desktop gratis. Materi pelatihan: tautan 1 , tautan 2 .

Hadoop dan data besar



Kesimpulan


Tidak semua yang Anda pelajari ternyata diterapkan di tempat kerja. Oleh karena itu, proyek kelulusan diperlukan di mana Anda mencoba menerapkan pengetahuan baru.

Tidak ada topik yang berkaitan dengan analisis data dan Pembelajaran Mesin, seperti ini lebih berlaku untuk profesi Data Scientist. Juga, tidak ada topik yang terkait dengan AWS, awan Azure. topik-topik ini sangat tergantung platform.

Pertanyaan untuk komunitas:
Seberapa memadai rencana pemompaan saya? Apa yang harus dihapus atau ditambahkan?
Proyek apa yang Anda rekomendasikan sebagai tesis?

Source: https://habr.com/ru/post/id472622/


All Articles