Sin los 3 años recomendados de experiencia práctica.
En previsión del inicio de clases en el curso de
Ingeniero de datos , queremos compartir con ustedes una traducción de una historia muy interesante que probablemente sea útil para futuros ingenieros. Vamos!
Google Hoody: uso. Expresión facial de trabajo seria: presente. Fotos de la versión en video de este artículo en YouTube .Nota Este artículo trata sobre el examen de certificación de Google Cloud Professional Data Engineer hasta el 29 de marzo de 2019. Ha habido algunos cambios después de esta fecha. Los incluí en la sección "Avanzado".
Entonces, ¿quieres una nueva sudadera con capucha, como en mi portada? ¿O planea obtener un certificado de
ingeniero de datos profesional de Google Cloud y se pregunta cómo hacerlo?
En los últimos meses, he tomado cursos junto con el uso de Google Cloud para prepararme para el examen de un ingeniero de datos profesional. Entonces traté de pasarlo y lo pasé. Y unas semanas después me entregaron mi sudadera con capucha. El certificado llegó más rápido.
Este artículo enumerará algunas cosas que quizás desee aprender y los pasos que tomé para obtener mi certificado de Ingeniero de datos profesional de Google Cloud.
¿Por qué le gustaría calificar para el ingeniero de datos profesional de Google Cloud?
Los datos están en todas partes. Y se requiere conocimiento sobre cómo crear sistemas que puedan procesar y usar datos. Google Cloud proporciona la infraestructura para construir estos sistemas.
Es posible que ya tenga las habilidades para usar Google Cloud, pero ¿cómo se lo demuestra a su futuro empleador o cliente? Hay dos formas: una cartera de proyectos o certificación.
El certificado le dice a los posibles clientes y empleadores: "Tengo las habilidades e hice el esfuerzo para obtener la acreditación".
Una breve descripción de Google resume.
Demuestre su capacidad para diseñar y construir sistemas de procesamiento de datos, así como para crear modelos de aprendizaje automático en Google Cloud Platform.Si aún no tiene las habilidades, familiarizarse con los materiales de capacitación para la certificación implica que aprenderá todo sobre cómo crear sistemas de procesamiento de datos de clase mundial en Google Cloud.
¿A quién le gustaría calificar para Google Cloud Professional Data Engineer?
Viste los números. La nube está creciendo. Ya está aquí y no va a ir a ningún lado. Si no has visto los números, créeme, la nube está creciendo.
Si ya es especialista en datos, ingeniero de datos, analista de datos, ingeniero de aprendizaje automático o está buscando oportunidades de carrera en el mundo de los datos, la certificación de Ingeniero de datos profesional de Google Cloud es para usted.
La capacidad de usar la computación en la nube se está convirtiendo en un requisito para cualquier posición orientada a datos.
¿Necesita un certificado para ser un buen ingeniero de datos / conjunto de datos / ingeniero de aprendizaje automático?
No
Todavía puede usar Google Cloud para trabajar con soluciones de transferencia de datos sin un certificado.
Un certificado es solo una forma de validar las habilidades existentes.
Cuanto cuesta
El examen cuesta $ 200. Si falla, nuevamente tendrá que pagar por un nuevo intento.
Posibles costos asociados con los cursos preparatorios y el uso de la plataforma en sí.
Los costos de la plataforma son tarifas por usar los servicios de Google Cloud. Si es un usuario sofisticado, ya lo sabe. De lo contrario, y solo se está familiarizando con los materiales de capacitación descritos en este artículo, puede crear una nueva cuenta de Google Cloud y cumplir con los límites de 300 dólares que ofrece Google al registrarse.
Pasaremos al costo del curso en un segundo.
¿Por cuánto tiempo es válida la certificación?
2 años Después de eso, deberá volver a realizar el examen.
Y dado que Google Cloud está evolucionando todos los días, es probable que lo que se requiere para el certificado cambie (como descubrí, ya ha cambiado para cuando comencé a escribir este artículo).
¿Qué necesitas para prepararte para el examen?
Google recomienda más de 3 años de experiencia en la industria y más de 1 año de desarrollo y administración de soluciones utilizando GCP para la certificación profesional.
No tenía ninguno de los anteriores.
De fuerza a 6 meses de experiencia relevante. Para compensar la escasez, utilicé una combinación de recursos de capacitación en línea.
¿Qué cursos he tomado?
Si eres como yo y no tienes los requisitos recomendados, puedes tomar algunos de los siguientes cursos para mejorar tus habilidades.
Los siguientes cursos son los que solía preparar para la certificación. Se enumeran en orden de finalización.
He indicado el costo, el momento y la utilidad para aprobar el examen de certificación de cada uno.

Algunos de los excelentes recursos en línea que solía entrenar para el examen. En orden:
Cloud Guru ,
Linux Academy y
Coursera .
Curso de datos de ingeniería en Google Cloud Platform por CourseraCosto : $ 49 por mes (después de una prueba gratuita de 7 días)
Tiempo : 1-2 meses, más de 10 horas por semana
Utilidad : 8/10
La ingeniería de datos de Coursera en Google Cloud Platform es una colaboración con Google Cloud.
Se divide en cinco sub-cursos, cada uno de los cuales lleva aproximadamente 10 horas a la semana de tiempo de estudio.
Si no está familiarizado con el procesamiento de datos en Google Cloud, esta especialización aumentará su nivel de 0 a 1. Pasará una serie de ejercicios prácticos utilizando una plataforma iterativa llamada QwikLabs. Antes de eso, se llevarán a cabo conferencias de profesionales de Google Cloud sobre cómo usar varios servicios como Google BigQuery, Cloud Dataproc, Dataflow y Bigtable.
Presentación de Cloud Guru en Google Cloud PlatformCosto : Gratis
Tiempo : 1 semana, 4-6 horas
Utilidad : 4/10
No considere un puntaje de utilidad bajo como un indicador de inutilidad del curso. Esto está lejos del caso. La única razón por la que obtiene un puntaje más bajo es porque no está enfocado en certificar a un ingeniero de datos profesional (como su nombre lo indica).
Después de completar la especialización de Coursera, tomé este curso como un curso de actualización porque solo usé Google Cloud para algunos casos de usuarios especializados.
Si vino de otro proveedor de servicios en la nube o nunca antes ha usado Google Cloud, es posible que deba tomar este curso. Esta es una gran introducción a Google Cloud Platform en su conjunto.
Ingeniero de datos profesional certificado por Google de Linux AcademyCosto : $ 49 por mes (después de una prueba gratuita de 7 días)
Tiempo : 1–4 semanas, 4+ horas por semana
Utilidad : 10/10
Después de completar el examen y pensar en los cursos que tomé, el
ingeniero de datos profesional certificado de Google Academy de Linux Academy resultó ser el más útil.
El video, así como el
libro electrónico Data Dossier (un excelente recurso de capacitación gratuito que viene con el curso) y los exámenes de práctica han hecho de este curso uno de los mejores recursos de capacitación que he usado.
Incluso lo recomendé como referencia en algunas notas de Slack para el equipo después del examen.
Notas en holgura
- Algunas cosas en el examen no fueron exámenes en Linux Academy, Cloud Guru o Google Cloud Practice (esperado)
- 1 pregunta con un gráfico de puntos de datos sobre qué ecuación debe agruparlos (por ejemplo, cos (X) o X² + Y²)
- Es imprescindible conocer las diferencias entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub / Sub y cómo se pueden usar.
- Dos ejemplos prácticos de estudios de examen fueron exactamente los mismos que en las clases prácticas, aunque no abordé estos estudios en absoluto durante el examen (las preguntas dieron suficiente comprensión).
- Conocer la sintaxis básica de las consultas SQL es muy útil, especialmente para las preguntas de BigQuery.
- Los exámenes de práctica proporcionados por Linux Academy y GCP son muy similares en estilo a las preguntas del examen, y los examinaré varias veces y los usaré para descubrir sus debilidades.
- Un pequeño consejo para ayudar con Dataproc: “ Dataproc el cocodrilo y Hadoop el elefante planean encender un fuego y cocinar una colmena de cerdos ” {El cocodrilo Dataproc y el elefante Hadoop planean hacer un fuego ( Spark - spark, spark a fire - fire) cocinar un enjambre ( colmena ) de cerdos ( cerdo )} (Dataproc se ocupa de Hadoop, Spark, Hive y Pig)
- “El flujo de datos es un rayo de luz que fluye” {El flujo de datos es el rayo de luz actual} (El flujo de datos trata con el haz de Apache)
- "Todos en todo el mundo pueden relacionarse con una llave inglesa lavada con ACID bien hecha " {Cualquier persona en todo el mundo podría tratar con ácido limpiado ( ACID ) con una llave inglesa} (Cloud Spanner es una base de datos diseñada para elevar una nube con scratch, compatible con ACID y disponible en todo el mundo)
- Conocer los nombres de variantes clásicas de bases de datos relacionales y no relacionales (por ejemplo, MongoDB, Cassandra) puede ser útil.
- Los roles de IAM varían ligeramente para cada servicio, pero es útil comprender cómo separar a los usuarios de poder ver datos sin perder la capacidad de diseñar flujos de trabajo (por ejemplo, el rol de Dataflow Worker puede diseñar flujos de trabajo pero no ver datos)
Esto es probablemente suficiente por ahora. Es probable que los kilómetros difieran de un examen a otro. El curso de la Academia Linux proporcionará el 80% del conocimiento.1 minuto de videos de Google CloudCosto : Gratis
Tiempo : 1-2 horas
Utilidad : 5/10
Han sido recomendados en los foros de Cloud Guru. Muchos de ellos no estaban relacionados con la certificación de Ingeniero de datos profesional, sin embargo, seleccioné algunos de ellos que son adecuados.
Algunos servicios pueden parecer difíciles de completar, así que fue agradable escuchar cómo se describe un servicio en particular en un minuto.
Preparación para el examen de ingeniero de datos profesional en la nubeCosto : $ 49 por certificado o gratis (sin certificado)
Tiempo : 1-2 semanas, más de 6 horas por semana
Utilidad : N / A
Encontré este recurso el día antes del examen programado. No lo terminé debido a limitaciones de tiempo, de ahí la falta de una calificación de utilidad.
Sin embargo, a juzgar por la página de descripción general del curso, parece un gran recurso para reunir todo lo que ha aprendido sobre Ingeniería de datos en Google Cloud y resaltar cualquier debilidad.
Aconsejé este curso como un recurso para uno de mis colegas que se está preparando para la certificación.
Hoja de trucos de Google Data Engineering Meverica LinaCosto : Gratis
Hora : N / A
Utilidad : N / A
Este fue otro recurso que encontré después del examen. En mi opinión, es integral, pero al mismo tiempo conciso. Además, es gratis. Se puede usar para leer entre exámenes prácticos o incluso después de la certificación para actualizar el conocimiento.
¿Qué hice después del curso?
Al acercarme al final del curso, reservé un examen con una semana de anticipación.
Tener una fecha límite es una gran motivación para reforzar lo que has aprendido.
Hice exámenes prácticos de Linux Academy y Google Cloud varias veces hasta que pude completarlos con un 95% de precisión cada vez.
Tome el examen de práctica de Linux Academy más del 90% por primera vez.Las pruebas de cada plataforma son similares, pero descubrí que, al ordenar las preguntas que respondía incorrectamente constantemente y al escribir por qué las entendía mal, ayudó a reforzar mis debilidades.
El examen que aprobé utilizó dos ejemplos de proyectos de investigación para desarrollar sistemas de procesamiento de datos en Google Cloud como tema (esto ha cambiado desde el 29 de marzo de 2019). Y estuvo con múltiples opciones todo el tiempo.
Me tomó alrededor de 2 horas. Y fue aproximadamente un 20% más difícil que cualquiera de los exámenes que aprobé.
No puedo expresar el valor de los exámenes prácticos lo suficiente.
¿Qué cambiaría si fuera otra vez?
Más exámenes de práctica. Más conocimiento práctico.
Por supuesto, siempre hay más entrenamiento que podrías hacer.
Los requisitos recomendados indican más de 3 años de uso de GCP. Pero no tenía esto, así que tuve que lidiar con lo que tenía.
Opcional
El examen se actualizó el 29 de marzo. Los materiales presentados en este artículo aún proporcionan una buena base, pero es importante tener en cuenta algunos cambios.
Varias secciones del Examen de ingeniero de datos profesional de Google Cloud ( versión 1 )- Diseño de sistemas de procesamiento de datos
- Creación y soporte de estructuras y bases de datos.
- Análisis de datos y conectividad de aprendizaje automático
- Modelado de procesos de negocio para análisis y optimización.
- Aseguramiento de confiabilidad
- Visualización de datos y soporte de políticas
- Diseño para seguridad y cumplimiento
Varias secciones del examen de ingeniero de datos de Google Cloud Professional (
versión 2 )
- Diseño de sistemas de procesamiento de datos
- Construcción y operación de sistemas de procesamiento de datos.
- Operacionalización de modelos de aprendizaje automático (la mayoría de los cambios se han producido aquí) [NUEVO]
- Soluciones de aseguramiento de calidad
La versión 2 fusionó las secciones 1, 2, 4 y 6 de la versión 1 en 1 y 2. También fusionó las secciones 5 y 7 de la versión 1 en la sección 4. Y la sección 3 de la versión 2 se amplió para cubrir todas las nuevas funciones de aprendizaje automático de Google Cloud.
Dado que estos cambios ocurrieron recientemente, muchos materiales de capacitación no tuvieron la oportunidad de actualizarse.
Sin embargo, la familiarización con los materiales de este artículo debería ser suficiente para cubrir el 70% de lo que necesita. Combinaría esto con algunas de sus propias investigaciones sobre las siguientes preguntas (se presentaron en la segunda versión del examen).
Como puede ver, la última actualización del examen se centró en las funciones de ML en Google Cloud.
29/04/2019 actualización : un mensaje del profesor del curso de la Academia Linux, Matthew Ulasein.
Solo como referencia, planeamos actualizar el curso de Ingeniero de Datos en Linux Academy para reflejar nuevas direcciones que comenzarán en algún lugar a mediados / finales de mayo.
Después del examen
Cuando aprueba el examen, solo obtendrá un resultado exitoso o negativo. Te aconsejo que te esfuerces por al menos el 70%, así que apunté a un mínimo del 90% en los exámenes prácticos.
Después de completar esto, recibirá un código de canje por correo electrónico junto con el certificado oficial de ingeniero de datos profesional de Google Cloud. Felicidades
Puede usar el código de canje en la tienda exclusiva de Google Cloud Professional Data Engineer, que está repleta de swag (
SWAG ). Hay camisetas, mochilas y sudaderas con capucha (pueden diferir de lo que estará disponible para cuando llegue allí). Elegí una sudadera con capucha.
Ahora que está certificado, puede demostrar su conjunto de habilidades (oficialmente) y volver a lo que mejor sabe hacer: diseñar.
Nos vemos en dos años para pasar por la recertificación.
PD: Si tiene alguna pregunta o desea aclarar algo, puede encontrarme en
Twitter y
LinkedIn .
YouTube también tiene una versión en video de este artículo.
PPS: muchas gracias a todos los maravillosos maestros en todos los cursos anteriores y a
Max Kelsen por proporcionar recursos y tiempo para estudiar y prepararse para el examen.
Y todos los que quieran aprender más sobre el programa del curso, las características del formato en línea, las habilidades, las competencias y las perspectivas que esperan a los graduados después del entrenamiento, los invitamos a
la jornada de puertas abiertas , que se llevará a cabo hoy a las 20.00.