Como passei no exame de certificação do Google Cloud Professional Data Engineer

Sem 3 anos de experiência prática recomendada


Antecipando o início das aulas no curso de Data Engineer , queremos compartilhar com você a tradução de uma história muito interessante que provavelmente será útil para futuros engenheiros. Vamos lá!


Google Hoody: vestindo. Expressão facial de trabalho séria: presente. Fotos da versão em vídeo deste artigo no YouTube .
Nota Este artigo é sobre o exame de certificação do Google Cloud Professional Data Engineer até 29 de março de 2019. Houve algumas alterações após essa data. Incluí-os na seção "Avançado".

Então, você quer um capuz novo, como na minha capa? Ou você está planejando obter um certificado do Google Cloud Professional Data Engineer e está pensando em como fazê-lo.

Nos últimos meses, participei de cursos junto com o Google Cloud para me preparar para o exame de um engenheiro de dados profissional. Então eu tentei passar e passar. E algumas semanas depois, meu moletom foi entregue. O certificado veio mais rápido.

Este artigo lista algumas coisas que você pode querer aprender e as etapas que eu segui para obter meu certificado de engenheiro de dados do Google Cloud Professional.

Por que você gostaria de se qualificar para o Google Cloud Professional Data Engineer?


Os dados estão em toda parte. E o conhecimento de como criar sistemas que podem processar e usar dados está em demanda. O Google Cloud fornece a infraestrutura para a construção desses sistemas.

Você já deve ter as habilidades necessárias para usar o Google Cloud, mas como demonstrar isso para seu futuro empregador ou cliente? Existem duas maneiras: um portfólio de projetos ou certificação.

O certificado diz aos potenciais clientes e empregadores: "Eu tenho as habilidades e fiz um esforço para obter o credenciamento".

Uma breve descrição do Google resume.

Demonstre suas habilidades em projetar e criar sistemas de processamento de dados, bem como criar modelos de aprendizado de máquina no Google Cloud Platform.

Se você ainda não possui as habilidades necessárias, familiarizar-se com os materiais de treinamento para certificação significa que aprenderá tudo sobre como criar sistemas de processamento de dados de classe mundial no Google Cloud.

Quem gostaria de se qualificar para o Google Cloud Professional Data Engineer?


Você viu os números. A nuvem está crescendo. Já está aqui e não vai a lugar nenhum. Se você ainda não viu os números, acredite, a nuvem está crescendo.

Se você já é especialista em dados, engenheiro de dados, analista de dados, engenheiro de aprendizado de máquina ou está procurando uma carreira no mundo dos dados, a certificação do Google Cloud Professional Data Engineer é para você.

A capacidade de usar a computação em nuvem está se tornando um requisito para qualquer posição orientada a dados.

Você precisa de um certificado para ser um bom engenheiro de dados / conjunto de dados / engenheiro de aprendizado de máquina?


Não.

Você ainda pode usar o Google Cloud para trabalhar com soluções de transferência de dados sem certificado.

Um certificado é apenas uma maneira de validar as habilidades existentes.

Quanto custa?


O exame custa US $ 200. Se você falhar, terá que pagar novamente por uma nova tentativa.

Possíveis custos associados a cursos preparatórios e ao uso da própria plataforma.

Os custos da plataforma são taxas pelo uso dos serviços do Google Cloud. Se você é um usuário sofisticado, já está ciente disso. Caso contrário, e você está familiarizando-se com os materiais de treinamento descritos neste artigo, é possível criar uma nova conta do Google Cloud e atingir os limites de 300 dólares que o Google oferece ao se registrar.

Passaremos para o custo do curso em um segundo.

Por quanto tempo a certificação é válida?


2 anos Depois disso, você precisará fazer o exame novamente.

E como o Google Cloud está desenvolvendo todos os dias, é provável que o que é necessário para o certificado mude (como eu descobri, ele já mudou quando comecei a escrever este artigo).

O que você precisa para se preparar para o exame?


O Google recomenda mais de 3 anos de experiência no setor e mais de 1 ano no desenvolvimento e gerenciamento de soluções usando o GCP para certificação profissional.

Eu não tinha nenhuma das opções acima.

De força a 6 meses de experiência relevante. Para compensar a escassez, usei uma combinação de recursos de treinamento on-line.

Quais cursos eu fiz?


Se você é como eu e não tem os requisitos recomendados, pode seguir alguns dos cursos a seguir para melhorar suas habilidades.

Os cursos a seguir são o que eu costumava preparar para a certificação. Eles são listados em ordem de conclusão.

Indiquei o custo, o prazo e a utilidade para passar no exame de certificação de cada um.



Alguns dos excelentes recursos on-line que eu costumava treinar para o exame. Em ordem: Cloud Guru , Linux Academy e Coursera .

Dados de engenharia do curso no Google Cloud Platform da Coursera

Custo : US $ 49 por mês (após uma avaliação gratuita de 7 dias)
Tempo : 1-2 meses, mais de 10 horas por semana
Utilidade : 8/10

A engenharia de dados da Coursera no Google Cloud Platform é uma colaboração com o Google Cloud.

É dividido em cinco sub-cursos, cada um dos quais leva cerca de 10 horas por semana de tempo de estudo.

Se você não estiver familiarizado com o processamento de dados no Google Cloud, essa especialização aumentará seu nível de 0 para 1. Você passará uma série de exercícios práticos usando uma plataforma iterativa chamada QwikLabs. Antes disso, serão realizadas palestras dos profissionais do Google Cloud sobre como usar vários serviços, como Google BigQuery, Cloud Dataproc, Dataflow e Bigtable.

Apresentando o Cloud Guru na Google Cloud Platform

Custo : Grátis
Tempo : 1 semana, 4-6 horas
Utilidade : 4/10

Não considere uma pontuação baixa na utilidade como um indicador da inutilidade do curso. Isso está longe de ser o caso. A única razão pela qual ele obtém uma pontuação mais baixa é porque ele não está focado em certificar um engenheiro de dados profissional (como o nome indica).

Depois de concluir a especialização do Coursera, fiz este curso como um curso de atualização, porque usei o Google Cloud apenas em alguns casos de usuários especializados.

Se você veio de outro provedor de serviços em nuvem ou nunca usou o Google Cloud antes, pode ser necessário fazer este curso. Esta é uma ótima introdução ao Google Cloud Platform como um todo.

Engenheiro de dados profissional certificado pelo Google da Linux Academy

Custo : US $ 49 por mês (após uma avaliação gratuita de 7 dias)
Tempo : 1 a 4 semanas, mais de 4 horas por semana
Utilidade : 10/10

Depois de concluir o exame e pensar nos cursos que fiz, o Engenheiro de Dados Profissional Certificado da Google Academy da Linux Academy acabou sendo o mais útil.

O vídeo, assim como o e-book do Dossiê de Dados (um excelente recurso de treinamento gratuito que acompanha o curso) e os exames práticos fizeram deste curso um dos melhores recursos de treinamento que já usei.

Até o recomendei como referência em algumas anotações do Slack para a equipe após o exame.

Notas no Slack


  • Algumas coisas no exame não foram na Linux Academy, no Cloud Guru ou no Google Cloud Practice (esperado)
  • 1 pergunta com um gráfico de pontos de dados sobre qual equação você deve agrupá-los (por exemplo, cos (X) ou X² + Y²)
  • É essencial conhecer as diferenças entre Dataflow, Dataproc, Datastore, Bigtable, BigQuery, Pub / Sub e como elas podem ser usadas.
  • Dois exemplos de trabalho de estudos para exames eram exatamente os mesmos das aulas práticas, embora eu não tenha abordado esses estudos durante o exame (as perguntas forneceram compreensão suficiente).
  • Conhecer a sintaxe básica das consultas SQL é muito útil, especialmente para perguntas do BigQuery.
  • Os exames práticos fornecidos pela Linux Academy e pelo GCP são muito semelhantes em estilo às perguntas do exame, e eu trabalharei em cada um deles várias vezes e os utilizarei para descobrir suas fraquezas.
  • Uma pequena dica para ajudar o Dataproc: “ Dataproc o crocodilo e Hadoop o elefante planejam acender uma fogueira e cozinhar uma colméia de porcos ” {O crocodilo Dataproc e o elefante Hadoop planejam acender uma fogueira ( Spark - faísca, acenda um fogo - acenda um fogo) e cozinhar um enxame ( Hive ) de porcos ( Porco )} (Dataproc lida com Hadoop, Spark, Hive e Porco)
  • “O fluxo de dados é um feixe de luz que flui” { Dataflow é o feixe de luz atual} (o fluxo de dados trata do Apache Beam)
  • “Todos em todo o mundo podem se relacionar com uma chave inglesa lavada com ACID bem feita ” {Qualquer pessoa no mundo pode lidar com ácido limpo ( ACID ) com uma chave inglesa} (Cloud Spanner é um banco de dados projetado para levantar uma nuvem com scratch, compatível com ACID e disponível em todo o mundo)
  • Conhecer os nomes das versões clássicas de bancos de dados relacionais e não relacionais (por exemplo, MongoDB, Cassandra) pode ser útil.
  • As funções do IAM variam um pouco para cada serviço, mas é útil entender como separar os usuários de poderem ver dados sem perder a capacidade de projetar fluxos de trabalho (por exemplo, a função Trabalhador de Fluxo de Dados pode projetar fluxos de trabalho, mas não ver dados)

Provavelmente é o suficiente por enquanto. É provável que os quilômetros sejam diferentes de exame para exame. O curso da Linux Academy fornecerá 80% do conhecimento.

1 minuto em vídeos do Google Cloud

Custo : Grátis
Tempo : 1-2 horas
Utilidade : 5/10

Eles foram recomendados nos fóruns do Cloud Guru. Muitos deles não estavam relacionados à certificação do Professional Data Engineer, no entanto, selecionei alguns deles que são adequados.

Alguns serviços podem parecer difíceis de concluir o curso, por isso foi bom ouvir como um serviço específico é descrito em um minuto.

Preparação para o exame de engenheiro de dados profissional em nuvem

Custo : US $ 49 por certificado ou gratuito (sem certificado)
Tempo : 1-2 semanas, mais de 6 horas por semana
Utilidade : N / A

Encontrei esse recurso no dia anterior ao exame agendado. Não terminei devido a restrições de tempo, daí a falta de uma classificação de utilidade.

No entanto, a julgar pela página de visão geral do curso, parece um ótimo recurso para reunir tudo o que você aprendeu sobre Engenharia de Dados no Google Cloud e destacar quaisquer pontos fracos.

Aconselhei este curso como um recurso para um dos meus colegas que está se preparando para a certificação.

Folha de dicas da Engenharia de dados do Google Meverica Lina

Custo : Grátis
Tempo : N / A
Utilidade : N / A

Esse foi outro recurso que me deparei após o exame. Na minha opinião, é abrangente, mas ao mesmo tempo conciso. Além disso, é grátis. Pode ser usado para leitura entre exames práticos ou mesmo após a certificação para atualizar o conhecimento.

O que eu fiz depois do curso?


Aproximando-me do final do curso, reservei um exame com uma semana de antecedência.
Ter um prazo é uma grande motivação para reforçar o que você aprendeu.

Fiz vários exames práticos da Linux Academy e do Google Cloud várias vezes até conseguir completá-los com precisão de 95% +.


Faça o exame prático da Linux Academy mais de 90% pela primeira vez.

Os testes de cada plataforma são semelhantes, mas descobri que, analisando as perguntas que respondia constantemente incorretamente e anotando por que as entendi mal, ajudou a diminuir minhas fraquezas.

O exame no qual eu passei usou dois exemplos de projetos de pesquisa para o desenvolvimento de sistemas de processamento de dados no Google Cloud como tópico (isso mudou desde 29 de março de 2019). E ele estava com várias opções o tempo todo.

Demorei cerca de 2 horas. E foi cerca de 20% mais difícil do que qualquer um dos exames que eu passei.

Não posso expressar o valor dos exames práticos o suficiente.

O que eu mudaria se eu fosse novamente?


Mais exames práticos. Mais conhecimento prático.

Claro, sempre há mais treinamento que você poderia fazer.

Os requisitos recomendados indicam mais de 3 anos de uso do GCP. Mas eu não tinha isso, então tive que lidar com o que tinha.

Opcional


O exame foi atualizado em 29 de março. Os materiais apresentados neste artigo ainda fornecem uma boa base, mas é importante observar algumas alterações.

Várias seções do exame do engenheiro de dados do Google Cloud Professional ( versão 1 )

  1. Projeto de Sistemas de Processamento de Dados
  2. Criação e suporte de estruturas e bancos de dados.
  3. Análise de dados e conectividade de aprendizado de máquina
  4. Modelagem de processos de negócios para análise e otimização
  5. Garantia de confiabilidade
  6. Visualização de dados e suporte a políticas
  7. Design para segurança e conformidade

Várias seções do exame do engenheiro de dados do Google Cloud Professional ( versão 2 )

  1. Projeto de Sistemas de Processamento de Dados
  2. Construção e operação de sistemas de processamento de dados
  3. Operacionalização de modelos de aprendizado de máquina (a maioria das alterações ocorreu aqui) [NEW]
  4. Soluções de garantia de qualidade

A versão 2 mesclou as seções 1, 2, 4 e 6 da versão 1 nas 1 e 2. Ele também mesclou as seções 5 e 7 da versão 1 na seção 4. E a seção 3 da versão 2 foi expandida para cobrir todos os novos recursos de aprendizado de máquina do Google Cloud.

Como essas mudanças ocorreram recentemente, muitos materiais de treinamento não tiveram a oportunidade de atualizar.

No entanto, a familiarização com os materiais deste artigo deve ser suficiente para cobrir 70% do que você precisa. Eu combinaria isso com algumas de suas próprias pesquisas sobre as seguintes perguntas (elas foram apresentadas na segunda versão do exame).


Como você pode ver, a atualização mais recente do exame focou nos recursos de ML no Google Cloud.

Atualização em 29/04/2019 : Uma mensagem do professor do curso da Linux Academy, Matthew Ulasein.
Apenas para referência, planejamos atualizar o curso Data Engineer da Linux Academy para refletir novas direções que começarão em algum lugar no meio / final de maio.

Após o exame


Quando você passa no exame, você obtém apenas um resultado positivo ou negativo. Aconselho que você se esforce por pelo menos 70%, por isso busquei no mínimo 90% em exames práticos.

Após concluir isso, você receberá um código de resgate por e-mail, juntamente com o certificado oficial de engenheiro de dados do Google Cloud Professional. Parabéns!

Você pode usar o código de resgate na loja exclusiva do Google Cloud Professional Data Engineer, repleta de ganhos ( SWAG ). Existem camisetas, mochilas e moletons (eles podem diferir do que estará no armazém quando você chegar lá). Eu escolhi um capuz.

Agora que você é certificado, pode demonstrar (oficialmente) seu conjunto de habilidades e retornar ao que faz melhor, para projetar.

Vejo você em dois anos para passar pela recertificação.

PS: Se você tiver alguma dúvida ou quiser esclarecer alguma coisa, pode me encontrar no Twitter e no LinkedIn . O YouTube também tem uma versão em vídeo deste artigo.
PPS: muito obrigado a todos os professores maravilhosos em todos os cursos acima e a Max Kelsen por fornecer recursos e tempo para estudar e se preparar para o exame.

E todo mundo que quiser aprender mais sobre o programa do curso, recursos do formato on-line, habilidades, competências e perspectivas que aguardam os graduados após o treinamento, convidamos você a abrir o dia , que será realizado hoje às 20h00.

Source: https://habr.com/ru/post/pt453706/


All Articles