Python
- Spark
- Administração de bases de dados SQL e NoSQL, ex:
( MySQL, Cassandra, Elastic Search )
- Modelagem e Arquitetura de bancos de dados SQL- Modelagem e Arquitetura de bancos de dados colunares ( Hbase, Cassandra )
- Administração de ambiente Hadoop ( Cloudera, Amazon EMR, Google Dataproc )
- Ferramentas ETL, ex:
( Nifi, CDAP, Streamsets, InformC!tica, Azure Data Factory )
- Mais de 5 anos de experiência com soluções de Data & Analytics
- Em uma das 3 soluções de Cloud Computing:
( AWS, GCP, Azure )
- Ingestão de Dados
- Organização de zonas de Dados ( RAW, TRUSTED, REFINED )
- Construção de Dashboards Analíticos ( Power BI, Google Data Studio, Tableau, Metabase, Grafana )
- Experiência em sistemas operacionaisLinux ( Instalação, Configuração )
- Experiência em pelo menos um ferramenta de orquestração ( Apache Oozie, Apache Airflow )
- Experiência em pelo menos um projeto com DevOps
- Desenvolvimento ETL com o framework Spark ( PySpark )
- Conhecimentos avançados em SQL para exploração, tratamento e preparação de dados;
- Comunicação entre time técnico Rox e Cliente como ponto focal de projetos
- Liderança técnica do time DIFERENCIAL:
- Certificação Azure Fundamentals 900- Certificação Azure Data Engineer
- Azure Data Lake Storage; Azure DataBricks; Azure Data Factory; Azure Machine Learning, Azure Data Explorer, Event Hubs, Synapse Analytics (antigo SQL DW);
- Perfil Hands On;
- Domínio de técnicas de processos de ETL/Modelagem dimensional; O QUE IREMOS AVALIAR:
- Experiência com desenvolvimento de Data Lakes em Cloud;
- Conhecimento de plataformas Big Data em ambiente de nuvem e banco de dados tradicionais (e.g., Azure, Cosmos DB); Habilidades Obrigatórias Shell ScriptSQL Habilidades Desejáveis A vaga aceita trabalho remoto?
Sim