Propósito da posição
Entrar na Nestlé significa que você está se juntando à maior empresa de alimentos e bebidas do mundo.
Em nosso núcleo, temos um ambiente diverso e inclusivo, com pessoas apaixonadas, movidas pelo propósito de melhorar a qualidade de vida e contribuir para um futuro mais saudável.
Estamos buscando uma pessoa para atuar como Engenheiro de Dados, que será responsável pela coleta, processamento e integridade de dados, desenvolvimento e otimização de pipelines, além de colaborar em projetos multidisciplinares, promovendo a eficácia e qualidade das operações de engenharia de dados.
O dia a dia...
Otimizar o desempenho das consultas PySpark e SQL, tendo em conta o volume de dados, a complexidade das consultas e os recursos do sistema.
Aplicar conhecimentos sobre conceitos e ferramentas de pipeline de dados para implementar tarefas de transformação, limpeza e agregação de dados.
Centralizar e garantir a integridade de diferentes fontes de dados;
Seguir as melhores práticas de desenvolvimento de pipelines de dados, incluindo controle de versões, testes e documentação exaustiva.
Desenvolver boas práticas de estruturação de bases de dados, assegurando performance e qualidade dos dados.
Capacidade de demonstrar e pensar estrategicamente sobre negócios, produtos e contribuir para resolução e desafios técnicos;
Aplicar competências de programação em Python, PySpark, Scala e SQL para manipular e transformar dados de forma eficaz.
Colaborar nas estratégias de potencialização de cultura Data Driven na Nestlé.
Contribuir para o desenvolvimento de programas de governança e democratização de dados;
O que vai contribuir para o seu sucesso?
Experiência de trabalho com tecnologias de big data, banco de dados e armazenamento/processamento de dados em nuvem, análise e modelagem de dados;
Habilidades em comunicação verbal são essenciais, bem como a capacidade de trabalhar de forma eficaz compartilhando proativamente e buscando contextos para colaborar em diferentes times;
Experiência em tecnologias, serviços de dados e conceitos de Big Data (Spark, Hadoop, Hive, MapReduce) e múltiplas linguagens (Python);
Experiência nas ferramentas de engenharia de dados da Azure (Databricks, Azure Data Factory, Storage Account, Analysis Services, etc);
Conhecimento sólido em PySpark ou em uma das principais linguagens de programação, e ser apaixonado(a) por escrever código limpo;
Habilidades em DevOps e CI/CD (Git);
Entendimento do ciclo de vida dos dados e conceitos, como linhagem, governança, privacidade, retenção, anonimização;
#J-18808-Ljbffr