
Sans trois ans d'expérience pratique recommandés
* Remarque: l' article est consacré à l'examen de certification Google Cloud Professional Data Engineer, qui était valable jusqu'au 29 mars 2019. Après cela, certains changements sont survenus - ils sont décrits dans la section " Avancé " *
Sweat Google: oui. Expression faciale grave: oui. Photos de la version vidéo de cet article sur YouTube .Voulez-vous obtenir un tout nouveau sweat-shirt comme sur ma photo?
Ou peut-être êtes-vous intéressé par le certificat
Google Cloud Professional Data Engineer et essayez-vous de savoir comment l'obtenir?
Au cours des derniers mois, j'ai suivi plusieurs cours et travaillé en parallèle avec Google Cloud pour préparer l'examen de l'ingénieur de données professionnel. Ensuite, je suis allé à l'examen et je l'ai réussi. Quelques semaines plus tard, un sweat-shirt est arrivé - mais le certificat est venu plus vite.
Cet article vous fournira des informations qui pourraient vous être utiles et les étapes que j'ai suivies pour obtenir mon certificat Google Cloud Professional Data Engineer.
Traduit en AlconostPourquoi obtenir un certificat Google Cloud Professional Data Engineer?
Les données nous entourent, elles sont partout. Par conséquent, les experts sont aujourd'hui très recherchés et savent créer des systèmes capables de traiter et d'utiliser les données. Et Google Cloud fournit l'infrastructure pour construire ces systèmes.
Si vous possédez déjà des compétences Google Cloud, comment puis-je les démontrer à un futur employeur ou client? Il y a deux façons de procéder: avoir un portefeuille de projets ou avoir passé la certification.
Le certificat indique aux clients et employeurs potentiels que vous avez certaines compétences et que vous avez fait des efforts pour obtenir leur confirmation officielle.
Cela est indiqué dans la description officielle de l'examen.
Démontrez votre capacité à concevoir et à construire des systèmes de traitement des données et des modèles d'apprentissage automatique sur la plateforme Google Cloud.Si vous ne possédez pas déjà les compétences appropriées, lorsque vous étudierez les supports de formation pour la certification, vous apprendrez tout ce dont vous avez besoin pour créer des systèmes de traitement de données de haut niveau à l'aide de Google Cloud.
Qui a besoin d'un certificat Google Cloud Professional Data Engineer?
Vous avez vu les chiffres - la sphère des technologies cloud se développe, elles sont avec nous depuis longtemps. Si vous n'êtes pas familier avec les statistiques, croyez-le: les «nuages» sont en hausse.
Si vous travaillez déjà en tant que spécialiste du traitement ou de l'analyse des données, ingénieur en apprentissage automatique ou si vous souhaitez vous lancer dans l'industrie du traitement des données, la certification Google Cloud Professional Data Engineer est ce dont vous avez besoin.
La capacité à utiliser les technologies cloud devient une exigence obligatoire pour tous les professionnels travaillant avec des données.
Ai-je besoin d'un certificat pour être un professionnel du traitement, de l'analyse de données ou de l'apprentissage automatique?
Non.
Vous pouvez utiliser Google Cloud pour travailler avec des solutions de traitement des données sans certificat.
Un certificat n'est qu'un moyen de confirmer vos compétences existantes.
Combien cela coûte-t-il?
Le coût de réussite à l'examen est de 200 $. Si vous échouez, vous devrez payer à nouveau.
De plus, vous devrez dépenser de l'argent pour des cours préparatoires et utiliser la plateforme elle-même.
Le coût de la collaboration avec la plate-forme correspond aux frais d'utilisation des services Google Cloud. Si vous êtes son utilisateur actif, vous en êtes bien conscient. Si vous êtes un débutant et que vous commencez tout juste à étudier les supports de formation décrits dans cet article, vous pouvez créer un compte Google Cloud et faire tout ce dont vous avez besoin, en respectant les 300 $ que Google crédite sur votre compte lors de votre inscription.
Nous allons passer au coût des cours littéralement en un instant.
Quelle est la durée de validité du certificat?
Deux ans. Après cette période, l'examen doit être repris.
Et puisque Google Cloud évolue constamment, il est probable que les exigences de certification changeront également (cela s'est produit juste au moment où j'ai commencé à écrire l'article).
De quoi avez-vous besoin pour vous préparer à l'examen?
Pour la certification professionnelle, Google recommande d'avoir plus de trois ans d'expérience dans l'industrie et plus d'un an dans le développement et la gestion de solutions utilisant GCP.
Je n'avais rien de tout cela.
L'expérience correspondante était d'environ six mois dans chaque cas.
Pour combler le vide, j'ai utilisé plusieurs ressources de formation en ligne.
Quels cours ai-je suivis?
Si votre cas est similaire au mien et que vous ne remplissez pas les conditions recommandées, alors pour améliorer votre propre niveau, vous pouvez suivre certains cours parmi les suivants.
Je les ai utilisés pour préparer la certification. Ils sont classés par ordre de passage.
Pour chacun, j'ai indiqué le coût, le calendrier et l'utilité pour réussir l'examen de certification.

Certaines des ressources d'apprentissage en ligne intéressantes que j'ai utilisées pour améliorer mes compétences avant l'examen sont en règle:
un gourou du cloud ,
Linux Academy ,
Coursera .
Coût: 49 $ par mois (après un essai gratuit de 7 jours).
Durée: 1-2 mois, plus de 10 heures par semaine.
Utilité: 8 sur 10.
L'ingénierie des données de cours
sur Google Cloud Platform Specilization sur Coursera a été développée en collaboration avec Google Cloud.
Il est divisé en cinq cours imbriqués, dont chacun représente environ 10 heures de temps d'étude par semaine.
Si vous n'êtes pas familier avec le traitement des données sur Google Cloud, cette spécialisation vous donnera simplement les compétences dont vous avez besoin. Vous devez effectuer une série d'exercices pratiques à l'aide d'une plate-forme itérative appelée QwikLabs. Avant cela, il y aura des conférences par des spécialistes utilisant Google Cloud sur la façon d'utiliser divers services, tels que Google BigQuery, Cloud Dataproc, Dataflow et Bigtable.
Coût: gratuit.
Durée: 1 semaine, 4-6 heures.
Utilité: 4 sur 10.
Une faible cote d'utilité ne signifie pas que le cours est généralement inutile - ce n'est pas du tout le cas. La seule raison pour laquelle la note est si basse est qu'elle n'est pas axée sur la certification Professional Data Engineer (comme son nom l'indique).
Je l'ai parcouru pour rafraîchir mes connaissances après avoir terminé la spécialisation Coursera, car j'ai utilisé Google Cloud dans certains cas limités.
Si vous avez déjà travaillé avec un autre fournisseur de services cloud ou n'avez jamais utilisé Google Cloud, ce cours peut vous être utile: il s'agit d'une excellente introduction à la plateforme Google Cloud dans son ensemble.
Coût: 49 $ par mois (après un essai gratuit de 7 jours).
Durée: 1 à 4 semaines, plus de 4 heures par semaine.
Utilité: 10 sur 10.
Après avoir réussi l'examen et réfléchi aux cours, je peux dire que l'ingénieur de données professionnel certifié Google de la Linux Academy a été le plus utile.
Des didacticiels vidéo, ainsi que l'
e-book Data Dossier (une excellente ressource de formation gratuite fournie avec le cours) et des examens pratiques font de ce cours l'un des meilleurs que j'ai jamais terminé.
Je l'ai même recommandé comme référence dans les notes de Slack pour l'équipe après l'examen.
Notes dans Slack
- Certaines questions sur l'examen n'étaient pas abordées dans le cours Linux Academy, ni dans A Cloud Guru, ni dans les examens Google Cloud Practice (ce qui était normal).
- Dans une question, il y avait un graphique des points de données. Il a été demandé par quelle équation ils peuvent être regroupés (par exemple, cos (X) ou X² + Y²).
- Vous devez connaître les différences entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub / Sub et comprendre comment vous pouvez les utiliser.
- Deux exemples spécifiques à l'examen sont les mêmes que ceux de la formation, bien que pendant l'examen je ne les ai pas lus du tout (les questions elles-mêmes étaient suffisantes pour répondre).
- Il est utile de connaître la syntaxe de base des requêtes SQL, en particulier pour les questions BigQuery.
- Les examens pratiques dans les cours Linux Academy et GCP sont très similaires dans le style aux questions de l'examen - ils doivent être passés plusieurs fois pour trouver leurs propres faiblesses.
- Gardez à l' esprit que Dataproc fonctionne avec Hadoop , Spark , Hive et Pigs .
- Dataflow fonctionne avec Apache Beam .
- Cloud Spanner est une base de données développée à l'origine pour le cloud, elle est compatible avec ACID et fonctionne partout dans le monde.
- Il est utile de connaître les noms des «anciens» - les équivalents des bases de données relationnelles et non relationnelles (par exemple, MongoDB, Cassandra).
- Les rôles des services IAM sont légèrement différents, mais il serait intéressant de comprendre comment diviser la capacité des utilisateurs à voir les données et à concevoir des workflows (par exemple, vous pouvez concevoir des workflows dans le rôle de Dataflow Worker, mais vous ne pouvez pas voir les données).
Jusqu'à présent, cela suffit peut-être. Chaque examen se déroulera à sa manière. Le cours Linux Academy fournira 80% des connaissances requises.Coût: gratuit.
Durée: 1-2 heures.
Utilité: 5 sur 10.
Ces vidéos ont été recommandées sur les forums A Cloud Guru. Beaucoup d'entre eux ne sont pas liés à la certification Professional Data Engineer, j'ai donc simplement choisi ceux avec le nom des services dans lesquels je pensais qu'ils étaient familiers.
Pendant le cours, certains services peuvent sembler compliqués, il était donc agréable de voir comment un service particulier était décrit en quelques minutes.
Coût: 49 $ par certificat ou gratuit (sans certificat).
Durée: 1-2 semaines, plus de six heures par semaine.
Utilité: non évalué.
J'ai trouvé cette ressource la veille de la date d'examen fixée. Il n'y avait pas assez de temps pour passer par là - d'où l'absence d'une cote de service.
Cependant, en regardant la page de présentation du cours, je peux dire que c'est une excellente ressource où vous pouvez répéter tout ce que vous avez appris sur l'ingénierie des données sur Google Cloud et trouver vos points faibles.
J'ai parlé de ce cours à un de mes collègues qui se prépare à la certification.
Coût: gratuit.
Heure: inconnue.
Utilité: non évalué.
Une autre ressource que j'ai rencontrée après l'examen. Il semble complet, mais le résumé est assez bref. De plus, c'est gratuit. Vous pouvez le contacter entre les examens de formation et même après la certification - pour rafraîchir vos connaissances.
Qu'est-ce que j'ai fait après le cours?
À la fin des cours, j'ai réservé un examen avec un préavis d'une semaine.
La présence d'un délai est une excellente motivation pour réaliser un audit de ce qui est appris.
J'ai passé plusieurs fois les examens de formation Linux Academy et Google Cloud jusqu'à ce que je commence à gagner régulièrement plus de 95%.
Le premier examen de formation réussi de la Linux Academy avec un score de plus de 90%.Les tests pour chaque plate-forme sont similaires; J'ai écrit et trié des questions dans lesquelles je me trompais constamment - cela a aidé à éliminer les faiblesses.
Lors de l'examen proprement dit, le sujet était le développement de systèmes de traitement de données dans Google Cloud à l'aide de deux exemples (le contenu de l'examen a changé depuis le 29 mars 2019). L'examen complet comportait des questions à choix multiples.
La réussite de l'examen a pris deux heures, il m'a semblé environ 20% plus difficile que les examens de formation familiers.
Cependant, ce dernier est une ressource très précieuse.
Que changerais-je si je repassais l'examen?
Plus d'examens de pratique. Plus de connaissances pratiques.
Bien sûr, vous pouvez toujours vous préparer encore mieux.
Les exigences recommandées indiquent plus de trois ans d'expérience avec GCP, ce que je n'avais pas - j'ai donc dû faire face à ce qui était.
En option
L'examen a été mis à jour le 29 mars. Les matériaux de l'article fourniront toujours une bonne base de préparation, mais il est important de noter certains changements.
Sections d'examen Google Cloud Professional Data Engineer ( version 1 )
- Conception de systèmes informatiques.
- Création et maintenance de structures de données et de bases de données.
- Connectivité d'analyse de données et d'apprentissage automatique.
- Modélisation des processus métier pour l'analyse et l'optimisation.
- Assurer la fiabilité.
- Visualisation des données et aide à la décision.
- Conception axée sur la sécurité et la conformité.
Sections d'examen Google Cloud Professional Data Engineer ( version 2 )
- Conception de systèmes informatiques.
- Construction et exploitation de systèmes informatiques.
- Fonctionnement des modèles d'apprentissage automatique (la plupart des changements se sont produits ici) [NOUVEAU] .
- Solutions d'assurance qualité.
Dans la version 2, les sections 1, 2, 4 et 6 de la version 1 sont combinées en sections 1 et 2, les sections 5 et 7 en section 4. La section 3 de la version 2 a été étendue pour couvrir désormais toutes les nouvelles fonctionnalités d'apprentissage automatique de Google Cloud.
Ces changements ont eu lieu récemment, de sorte que de nombreux supports de formation n'ont pas eu le temps de se mettre à jour.
Cependant, si vous utilisez les matériaux de l'article, cela devrait suffire pour couvrir 70% des connaissances nécessaires. Je me familiariserais également avec les sujets suivants (ils sont apparus dans la deuxième version de l'examen):
Comme vous pouvez le voir, la mise à jour de l'examen est principalement liée aux capacités d'apprentissage automatique de Google Cloud.
Mise à jour au 29 avril 2019. J'ai reçu un message d'un professeur de cours de la Linux Academy (Matthew Ulasien).
Juste pour référence: nous prévoyons de mettre à jour le cours Data Engineer à la Linux Academy et d'y refléter de nouveaux objectifs - quelque part entre la mi ou la fin mai.Après examen
Après avoir réussi l'examen, vous obtiendrez le résultat «réussi» ou «non réussi». Lors des examens de formation, il est conseillé de viser un minimum de 70%, donc je visais 90%.
Après avoir réussi l'examen, vous recevrez un code d'activation par e-mail avec le certificat officiel Google Cloud Professional Data Engineer. Félicitations!
Le code d'activation peut être utilisé dans la boutique exclusive Google Cloud Professional Data Engineer, où vous pouvez gagner de l'argent: il y a des t-shirts, des sacs à dos et des pulls molletonnés (au moment de la livraison, quelque chose peut ne pas être disponible). J'ai choisi un sweat-shirt.
Après avoir reçu un certificat, vous pouvez démontrer (officiellement) vos compétences et retourner au travail que vous faites le mieux - construire des systèmes.
Rendez-vous dans deux ans - sur la recertification.
P. S. Merci beaucoup aux merveilleux professeurs des cours ci-dessus et à
Max Kelsen pour avoir fourni des ressources et du temps pour étudier et préparer l'examen.
À propos du traducteurL'article a été traduit par Alconost.
Alconost
localise des jeux , des
applications et des sites dans 70 langues. Traducteurs en langue maternelle, tests linguistiques, plateforme cloud avec API, localisation continue, chefs de projet 24/7, tout format de ressources de chaîne.
Nous réalisons également
des vidéos de publicité et de formation - pour les sites qui vendent, présentent des images, de la publicité, des formations, des teasers, des explicateurs, des bandes-annonces pour Google Play et l'App Store.
→
En savoir plus