Impressões Exame 70-475 (Design and Implement Big Data Analytics Solutions)

Olá Pessoal,

Hoje (22/01/16) realizei o exame 70-475 da Microsoft (Design and Implement Big Data Analytics Solutions), o exame ainda é Beta, ou seja, não sei se fui bem sucedido ainda!! Esse exame não faz parte ainda de nenhuma trilha (MCSA, MCSE, etc.), acredito que isso vá mudar no seu lançamento.

OBS: Todos que realizam um exame de certificação Microsoft precisam aceitar um termo de NDA (Non-Disclosure Agreement), portanto, não esperem que eu coloque as perguntas aqui, serão apenas impressões do exame que realizei.

Segundo o site da prova 70-475, o exame é composto de 4 áreas:

  • Design big data batch processing and interactive solutions (20-25%)

Ingest data for batch and interactive processing, design and provision compute clusters, design for data security, design for batch processing, design interactive queries for big data.

  • Design big data real-time processing solutions (25-30%)

Ingest data for real-time processing, design and provision compute resources, design for lambda architecture, design for real-time processing.

  • Design machine-learning solutions (25-30%)

Create and manage experiments, determine when to pre-process or train inside Machine Learning Studio, select input/output types, apply custom processing steps with R and Python, publish web services.

  • Operationalize end-to-end cloud analytics solutions (25-30%)

Create a data factory, orchestrate data processing activities in a data-driven workflow, monitor and manage the data factory, move, transform, and analyze data.

E realmente o exame é composto por tudo isso! Na minha prova foram 43 questões de múltipla escolha e mais 3 estudos de caso com 6 questões cada, bem parecida com as provas para o MCSE.

Durante o ano passado e o começo desse ano eu tive estudando bastante as soluções Azure HDInsight e Azure Machine Learning, isso me ajudou a responder boa parte das perguntas, StreamInsight e Apache Spark eu estudei um pouco menos e tive algumas dificuldades para responder, ADF (Azure Data Factory) eu não tinha estudado nada e acho que foi aí que tive problemas!!

O que eu quero dizer é que essa certificação prevê que a pessoa tenha um profundo conhecimento de todas as ferramentas de Big Data da Microsoft, as questões não se limitam em demonstrar que a pessoa conhece todas as soluções de Big Data e pode escolher a melhor solução a se implantar, e sim que saiba implementar qualquer solução desse tipo. Isso eu achei um pouco exagerado no exame.

O exame cobra que o profissional consiga desenhar e implementar uma solução de Big Data end-to-end utilizando os recursos da Microsoft, não somente o processamento do dado no Hadoop por exemplo, e sim como fazer com que o dado chegue até a nuvem, como é processado e como tratar esse resultado.

Um ponto que não gostei foi do exame cobrar questões relativas a linguagens que não necessariamente são utilizadas, por exemplo, com o Machine Learning você pode utilizar as linguagens R e/ou Python, o HDInsight Spark pode-se utilizar as linguagens Java, Scala, etc. Se você estudou Machine Learning com R, você não precisa de Python, e vice-versa, então não acho legal fazer questões baseadas em uma linguagem específica e sim questões mais genéricas baseada na tecnologia que utiliza uma ou outra linguagem.

Uma coisa que achei boa é que uma grande parte das questões relacionadas às tecnologias que tenho estudado (HDInsight e Machine Learning) eu consegui responder, muitas vezes lembrando de Lab’s previamente realizados, então acredito que ela está refletindo bem a realidade com questões justas.

Muitas questões envolvendo o uso do Powershell para o uso dessas tecnologias, não esqueçam dele!!

Então a minha dica principal é estudar e fazer labs das tecnologias abaixo:

  • Azure HDInsight (Hadoop, HBASE, Storm e Spark)
  • Azure Machine Learning
  • Azure StreamInsight
  • Azure Data Factory
  • Azure Event Hub
  • Azure IOT Hub
  • Azure Blob Storage

Alguns cursos, disponíveis gratuitamente (paga só se precisar de certificado) no site edX.org que fiz e recomendo:

Esse eu não fiz ainda, começa em 31/03/2016, mas já estou inscrito!

Como demanda pra mim ficou estudar melhor o Azure Data Factory, Event Hub, StreamInsight e Spark!!

Bons estudos!

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s