Durante los 煤ltimos ocho a帽os, he estado trabajando como gerente de proyecto (no escribo c贸digo en el trabajo), lo que naturalmente afecta negativamente a mi backend de tecnolog铆a. Decid铆 reducir mi retraso tecnol贸gico y obtener la profesi贸n de ingeniero de datos. La habilidad principal de un ingeniero de datos es la capacidad de dise帽ar, construir y mantener almacenes de datos.
Hice un plan de entrenamiento, creo que ser谩 煤til no solo para m铆. El plan se centra en cursos de autoaprendizaje. Se da prioridad a los cursos gratuitos en ruso.
Secciones:
- Algoritmos y estructuras de datos. Secci贸n clave Si lo estudias, todo lo dem谩s funcionar谩. Es importante tener la mano escribiendo c贸digo y usando estructuras y algoritmos b谩sicos.
- Bases de datos y almacenes de datos, Business Intelligence. Pasamos de los algoritmos al almacenamiento y procesamiento de datos.
- Hadoop y Big Data. Cuando la base de datos no est谩 incluida en el disco duro, o cuando los datos necesitan ser analizados, pero Excel ya no puede cargarlos, comienzan los datos grandes. En mi opini贸n, la transici贸n a esta secci贸n es necesaria solo despu茅s de un estudio exhaustivo de los dos anteriores.
Algoritmos y estructuras de datos.
En mi plan, inclu铆 aprender Python, repitiendo los conceptos b谩sicos de matem谩ticas y algoritmos.
Bases de datos y almacenes, Business Intelligence
Los temas relacionados con la construcci贸n de almacenes de datos, ETL, cubos OLAP dependen en gran medida de las herramientas, por lo que no doy enlaces a cursos en este documento. Es recomendable estudiar dichos sistemas cuando se trabaja en un proyecto espec铆fico en una empresa en particular. Para una introducci贸n a ETL, puede probar
Talend o
Airflow .
En mi opini贸n, es importante estudiar la metodolog铆a moderna para dise帽ar almacenes de datos Data Vault
enlace 1 ,
enlace 2 . Y la mejor manera de aprenderlo es tomarlo e implementarlo con un simple ejemplo. GitHub tiene varios ejemplos de implementaci贸n del
enlace Data Vault. Libro de Data Warehouse moderno: modelando el Data Warehouse 谩gil con Data Vault por Hans Hultgren.
Para familiarizarse con las herramientas de Business Intelligence para usuarios finales, puede utilizar el dise帽ador gratuito de informes, paneles, mini almacenes de datos Power BI Desktop. Materiales de capacitaci贸n:
enlace 1 ,
enlace 2 .
Hadoop y Big Data
Conclusi贸n
No todo lo que estudias se aplica en el trabajo. Por lo tanto, se necesita un proyecto de graduaci贸n en el que intente aplicar nuevos conocimientos.
No hay temas relacionados con el an谩lisis de datos y el aprendizaje autom谩tico, como Esto se aplica m谩s a la profesi贸n de Data Scientist. Adem谩s, no hay temas relacionados con AWS, nubes de Azure. Estos temas dependen mucho de la plataforma.
Preguntas a la comunidad:
驴Qu茅 tan adecuado es mi plan de bombeo? 驴Qu茅 eliminar o agregar?
驴Qu茅 proyecto me recomiendan como tesis?