Comment j'ai réussi l'examen de certification Google Cloud Professional Data Engineer

Sans 3 ans d'expérience pratique recommandés


En prévision du début des cours du cours Data Engineer , nous souhaitons partager avec vous une traduction d'une histoire très intéressante qui sera probablement utile aux futurs ingénieurs. C'est parti!


Sweat à capuche Google: Porter. Expression faciale sérieuse de travail: présente. Photos de la version vidéo de cet article sur YouTube .
Remarque Cet article concerne l'examen de certification Google Cloud Professional Data Engineer jusqu'au 29 mars 2019. Il y a eu quelques changements après cette date. Je les ai inclus dans la section "Avancé".

Alors, tu veux un nouveau sweat à capuche, comme sur ma couverture? Ou envisagez-vous d'obtenir un certificat Google Cloud Professional Data Engineer et vous vous demandez comment le faire.

Au cours des derniers mois, j'ai suivi des cours et utilisé Google Cloud pour préparer l'examen d'un ingénieur de données professionnel. Ensuite, j'ai essayé de le passer et de le passer. Et quelques semaines plus tard, mon sweat à capuche a été livré. Le certificat est venu plus vite.

Cet article répertorie certaines choses que vous voudrez peut-être apprendre et les étapes que j'ai suivies pour obtenir mon certificat Google Cloud Professional Data Engineer.

Pourquoi voudriez-vous vous qualifier pour Google Cloud Professional Data Engineer?


Les données sont partout. Et la connaissance de la façon de créer des systèmes capables de traiter et d'utiliser des données est demandée. Google Cloud fournit l'infrastructure pour la construction de ces systèmes.

Vous avez peut-être déjà les compétences nécessaires pour utiliser Google Cloud, mais comment le démontrez-vous à votre futur employeur ou client? Il y a deux façons: un portefeuille de projets ou une certification.

Le certificat dit aux clients et employeurs potentiels: "J'ai les compétences et j'ai fait un effort pour obtenir l'accréditation."

Une brève description de Google résume.

Démontrez vos compétences dans la conception et la création de systèmes de traitement des données, ainsi que dans la création de modèles d'apprentissage automatique sur Google Cloud Platform.

Si vous n'avez pas encore les compétences, vous familiariser avec le matériel de formation à la certification signifie que vous apprendrez tout sur la façon de créer des systèmes de traitement de données de classe mondiale dans Google Cloud.

Qui souhaite se qualifier pour Google Cloud Professional Data Engineer?


Vous avez vu les chiffres. Le cloud se développe. Il est déjà là et n'ira nulle part. Si vous n'avez pas vu les chiffres, croyez-moi, le cloud se développe.

Si vous êtes déjà un spécialiste des données, un ingénieur des données, un analyste des données, un ingénieur en apprentissage automatique ou à la recherche d'opportunités de carrière dans le monde des données, la certification Google Cloud Professional Data Engineer est faite pour vous.

La capacité à utiliser le cloud computing devient une exigence pour tout poste orienté données.

Avez-vous besoin d'un certificat pour être un bon ingénieur de données / ensemble de données / ingénieur en apprentissage automatique?


Non.

Vous pouvez toujours utiliser Google Cloud pour travailler avec des solutions de transfert de données sans certificat.

Un certificat n'est qu'un moyen de valider les compétences existantes.

Combien cela coûte-t-il?


L'examen coûte 200 $. Si vous échouez, vous devrez à nouveau payer pour une nouvelle tentative.

Coûts possibles associés aux cours préparatoires et à l'utilisation de la plateforme elle-même.

Les coûts de plate-forme sont des frais d'utilisation des services Google Cloud. Si vous êtes un utilisateur averti, vous en êtes déjà conscient. Sinon, et vous ne vous familiarisez qu'avec les supports de formation décrits dans cet article, vous pouvez créer un nouveau compte Google Cloud et respecter les limites de 300 dollars que Google propose lors de l'inscription.

Nous allons passer au coût du cours dans une seconde.

Quelle est la durée de la certification?


2 ans Après cela, vous devrez repasser l'examen.

Et puisque Google Cloud se développe tous les jours, il est probable que ce qui est requis pour le certificat changera (comme je l'ai découvert, il a déjà changé au moment où j'ai commencé à écrire cet article).

De quoi avez-vous besoin pour vous préparer à l'examen?


Google recommande plus de 3 ans d'expérience dans l'industrie et plus d'un an de développement et de gestion de solutions utilisant GCP pour la certification professionnelle.

Je n'avais rien de ce qui précède.

De la force à 6 mois d'expérience pertinente. Pour compenser la pénurie, j'ai utilisé une combinaison de ressources de formation en ligne.

Quels cours ai-je suivis?


Si vous êtes comme moi et que vous n'avez pas d'exigences recommandées, vous pouvez suivre certains des cours suivants pour améliorer vos compétences.

Les cours suivants sont ce que j'ai utilisé pour préparer la certification. Ils sont répertoriés par ordre d'achèvement.

J'ai indiqué le coût, le calendrier et l'utilité de réussir l'examen de certification pour chacun.



Quelques-unes des excellentes ressources en ligne que j'ai utilisées pour me former à l'examen. Dans l'ordre: Cloud Guru , Linux Academy et Coursera .

Données d'ingénierie de cours sur Google Cloud Platform par Coursera

Coût : 49 $ par mois (après un essai gratuit de 7 jours)
Durée : 1-2 mois, 10+ heures par semaine
Utilité : 8/10

L'ingénierie des données de Coursera sur Google Cloud Platform est une collaboration avec Google Cloud.

Il est divisé en cinq sous-cours, dont chacun prend environ 10 heures par semaine d'étude.

Si vous n'êtes pas familier avec le traitement des données dans Google Cloud, cette spécialisation augmentera votre niveau de 0 à 1. Vous passerez une série d'exercices pratiques en utilisant une plateforme itérative appelée QwikLabs. Avant cela, des conférences par des praticiens de Google Cloud sur la façon d'utiliser divers services tels que Google BigQuery, Cloud Dataproc, Dataflow et Bigtable seront organisées.

Présentation de Cloud Guru sur la plateforme Google Cloud

Coût : gratuit
Durée : 1 semaine, 4-6 heures
Utilité : 4/10

Ne considérez pas un faible score d'utilité comme un indicateur de l'inutilité du cours. C'est loin d'être le cas. La seule raison pour laquelle il obtient un score inférieur est parce qu'il ne se concentre pas sur la certification d'un ingénieur de données professionnel (comme son nom l'indique).

Après avoir terminé la spécialisation Coursera, j'ai suivi ce cours comme un cours de perfectionnement car je n'ai utilisé Google Cloud que pour quelques cas d'utilisateurs spécialisés.

Si vous venez d'un autre fournisseur de services cloud ou n'avez jamais utilisé Google Cloud auparavant, vous devrez peut-être suivre ce cours. Il s'agit d'une excellente introduction à Google Cloud Platform dans son ensemble.

Ingénieur de données professionnel certifié Google de la Linux Academy

Coût : 49 $ par mois (après un essai gratuit de 7 jours)
Durée : 1 à 4 semaines, plus de 4 heures par semaine
Utilité : 10/10

Après avoir terminé l'examen et réfléchi aux cours que j'ai suivis, l' ingénieur de données professionnel certifié Google Academy de la Linux Academy s'est avéré être le plus utile.

La vidéo, ainsi que l' e-book Data Dossier (une excellente ressource de formation gratuite fournie avec le cours) et les examens pratiques ont fait de ce cours l'une des meilleures ressources de formation que j'ai jamais utilisées.

Je l'ai même recommandé comme référence dans certaines notes Slack pour l'équipe après l'examen.

Notes dans Slack


  • Certaines choses à l'examen n'étaient pas des examens ni à Linux Academy, ni à Cloud Guru, ni à Google Cloud Practice (prévu)
  • 1 question avec un graphique de points de données sur quelle équation vous devez les regrouper (par exemple, cos (X) ou X² + Y²)
  • Connaître les différences entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub / Sub et comment ils peuvent être utilisés est un must.
  • Deux exemples pratiques d'études d'examen étaient exactement les mêmes que dans les cours pratiques, même si je n'ai pas abordé ces études du tout pendant l'examen (les questions ont donné une compréhension suffisante).
  • La connaissance de la syntaxe de base des requêtes SQL est très utile, en particulier pour les questions BigQuery.
  • Les examens pratiques fournis par Linux Academy et GCP sont très similaires dans le style aux questions d'examen, et je vais les parcourir plusieurs fois et les utiliser pour découvrir vos faiblesses.
  • Un petit conseil pour aider Dataproc: « Dataproc le croc et Hadoop l'éléphant prévoient d'allumer un feu et de cuire une ruche de porcs » {Le crocodile Dataproc et l'éléphant Hadoop prévoient de faire un feu ( Spark - étincelle, allume un feu - faites un feu) et faire cuire un essaim ( Ruche ) de porcs ( Porc )} (Dataproc traite Hadoop, Spark, Hive et Pig)
  • « Dataflow est un faisceau de lumière qui coule» { Dataflow est le faisceau de lumière actuel} (Dataflow traite du faisceau Apache)
  • «Tout le monde dans le monde peut s'identifier à une clé à laver ACID bien faite » {N'importe qui dans le monde peut traiter avec un nettoyant à l'acide ( ACID ) avec une clé} (Cloud Spanner est une base de données conçue pour élever un nuage avec scratch, compatible avec ACID et disponible dans le monde entier)
  • Connaître les noms des variantes classiques des bases de données relationnelles et non relationnelles (par exemple, MongoDB, Cassandra) peut être utile.
  • Les rôles IAM varient légèrement pour chaque service, mais il est utile de comprendre comment séparer les utilisateurs de la possibilité de voir les données sans perdre la possibilité de concevoir des workflows (par exemple, le rôle Dataflow Worker peut concevoir des workflows sans voir les données)

C'est probablement suffisant pour l'instant. Les kilomètres peuvent différer d'un examen à l'autre. Le cours Linux Academy fournira 80% des connaissances.

Vidéos Google Cloud d'une minute

Coût : gratuit
Durée : 1-2 heures
Utilité : 5/10

Ils ont été recommandés sur les forums Cloud Guru. Beaucoup d'entre eux n'étaient pas liés à la certification Professional Data Engineer, mais j'ai sélectionné certains d'entre eux qui conviennent.

Certains services peuvent sembler difficiles à terminer le cours, il était donc agréable d'écouter comment un service particulier est décrit en une minute.

Préparation à l'examen Cloud Professional Data Engineer

Coût : 49 $ par certificat ou gratuit (sans certificat)
Durée : 1-2 semaines, 6+ heures par semaine
Utilité : N / A

J'ai trouvé cette ressource la veille de l'examen prévu. Je ne l'ai pas terminé en raison de contraintes de temps, d'où l'absence d'une note d'utilité.

Cependant, à en juger par la page de présentation du cours, cela semble être une excellente ressource pour rassembler tout ce que vous avez appris sur l'ingénierie des données sur Google Cloud et mettre en évidence les faiblesses.

J'ai conseillé ce cours comme ressource à l'un de mes collègues qui se prépare à la certification.

Aide-mémoire Google Data Engineering Meverica Lina

Coût : gratuit
Temps : N / A
Utilité : N / A

C'était une autre ressource que j'ai rencontrée après l'examen. À mon avis, il est complet, mais en même temps concis. De plus, c'est gratuit. Il peut être utilisé pour la lecture entre les examens pratiques ou même après la certification pour rafraîchir les connaissances.

Qu'est-ce que j'ai fait après le cours?


En m'approchant de la fin du cours, j'ai réservé un examen avec un préavis d'une semaine.
Avoir une date limite est une grande motivation pour renforcer ce que vous avez appris.

J'ai passé plusieurs examens pratiques de Linux Academy et de Google Cloud jusqu'à ce que je puisse les compléter avec une précision de 95% + à chaque fois.


Passez l'examen de pratique de la Linux Academy à plus de 90% pour la première fois.

Les tests de chaque plate-forme sont similaires, mais j'ai trouvé qu'en triant les questions auxquelles je répondais constamment de manière incorrecte et en écrivant pourquoi je les avais mal compris, j'ai aidé à resserrer mes faiblesses.

L'examen que j'ai réussi a utilisé deux exemples de projets de recherche pour développer des systèmes de traitement des données dans Google Cloud comme sujet (cela a changé depuis le 29 mars 2019). Et il avait tout le temps des choix multiples.

Cela m'a pris environ 2 heures. Et c'était environ 20% plus difficile que tous les examens que j'ai passés.

Je ne peux pas exprimer suffisamment la valeur des examens pratiques.

Que changerais-je si j'y retournais?


Plus d'examens de pratique. Plus de connaissances pratiques.

Bien sûr, il y a toujours plus de formation que vous pourriez faire.

Les exigences recommandées indiquent plus de 3 ans d'utilisation de GCP. Mais je n'avais pas ça, donc j'ai dû faire face à ce que j'avais.

En option


L'examen a été mis à jour le 29 mars. Les documents présentés dans cet article fournissent toujours une bonne base, mais il est important de noter certains changements.

Différentes sections de l'examen Google Cloud Professional Data Engineer ( version 1 )

  1. Conception de systèmes de traitement de données
  2. Création et support de structures et bases de données.
  3. Connectivité d'analyse de données et d'apprentissage automatique
  4. Modélisation des processus métier pour l'analyse et l'optimisation
  5. Assurance de fiabilité
  6. Visualisation des données et support des politiques
  7. Conception pour la sécurité et la conformité

Différentes sections de l'examen Google Cloud Professional Data Engineer ( version 2 )

  1. Conception de systèmes de traitement de données
  2. Construction et exploitation de systèmes informatiques
  3. Opérationnalisation des modèles d'apprentissage automatique (la plupart des changements se sont produits ici) [NOUVEAU]
  4. Solutions d'assurance qualité

La version 2 a fusionné les sections 1, 2, 4 et 6 de la version 1 en 1 et 2. Elle a également fusionné les sections 5 et 7 de la version 1 en section 4. Et la section 3 de la version 2 a été étendue pour couvrir toutes les nouvelles fonctionnalités d'apprentissage automatique de Google Cloud.

Depuis que ces changements se sont produits récemment, de nombreux supports de formation n'ont pas eu la possibilité de se mettre à jour.

Cependant, une familiarisation avec les matériaux de cet article devrait suffire pour couvrir 70% de ce dont vous avez besoin. Je combinerais cela avec certaines de vos propres recherches sur les questions suivantes (elles ont été présentées dans la deuxième version de l'examen).


Comme vous pouvez le voir, la dernière mise à jour de l'examen s'est concentrée sur les fonctionnalités ML dans Google Cloud.

Mise à jour du 29/04/2019 : Un message du professeur de cours de la Linux Academy, Matthew Ulasein.
Juste pour référence, nous prévoyons de mettre à jour le cours d'ingénieur de données à la Linux Academy pour refléter de nouvelles directions qui commenceront quelque part à la mi / fin mai.

Après examen


Lorsque vous réussissez l'examen, vous n'obtiendrez qu'un résultat positif ou négatif. Je vous conseille de viser au moins 70%, donc je visais un minimum de 90% aux examens pratiques.

Après avoir terminé cela, vous recevrez un code d'échange par e-mail avec le certificat officiel Google Cloud Professional Data Engineer. Félicitations!

Vous pouvez utiliser le code de remboursement dans la boutique exclusive Google Cloud Professional Data Engineer, qui regorge de swag ( SWAG ). Il y a des T-shirts, des sacs à dos et des sweats à capuche (ils peuvent différer de ceux qui seront dans l'entrepôt lorsque vous y arriverez). J'ai choisi un sweat à capuche.

Maintenant que vous êtes certifié, vous pouvez démontrer (officiellement) votre ensemble de compétences et revenir à ce que vous faites le mieux, à concevoir.

Rendez-vous dans deux ans pour passer par la recertification.

PS: Si vous avez des questions ou souhaitez clarifier quelque chose, vous pouvez me trouver sur Twitter et LinkedIn . YouTube a également une version vidéo de cet article.
PPS: merci à tous les merveilleux professeurs de tous les cours ci-dessus et à Max Kelsen pour avoir fourni des ressources et du temps pour étudier et préparer l'examen.

Et tous ceux qui veulent en savoir plus sur le programme de cours, les caractéristiques du format en ligne, les compétences, les compétences et les perspectives qui attendent les diplômés après la formation, nous vous invitons à une journée portes ouvertes , qui se tiendra aujourd'hui à 20h00.

Source: https://habr.com/ru/post/fr453706/


All Articles