Ensino superior completo em Ciência da Computação, Sistemas de Informação, Análise e Desenvolvimento de Sistemas ou áreas correlatas; Mínimo de 3 anos de experiência atuando na engenharia de dados ou atividades afins. Conhecimento em plataformas de Cloud Computing (Azure, AWS e/ou GCP) Domínio de linguagem SQL, arquitetura de dados, modelo de dados relacionais e não-relacionais; Conhecimento de bancos de dados relacionais (Oracle e SQL Server) e NoSQL (MongoDB, Cosmos DB e Cassandra); Experiência com Big Data, Spark e ecossistema Hadoop Conhecimento de linguagens de programação (preferencialmente Python, Scala e/ou R). Conhecimento em Shell Scripts e Linux Inglês avançado; Conhecimento em diferentes arquiteturas tradicionais de armazenamento de dados, Data Lake e Data Warehouse. Conhecimento em ferramentas de ETL/ELT (Apache Airflow, NiFi, Data Factory, Glue, ODI, entre outras); Conhecimento de plataformas de Data Preparation (Alteryx, Microsoft Power Query, Talend, entre outras); Conhecimento em plataformas de Data Visualization (Power BI, MicroStrategy, Tableau, Qlik, entre outras); Construir pipelines de dados que possam suportar soluções de AA/AI, traduzindo as necessidades do negócio em ambiente Cloud e On Premises.
; Preparar os dados como parte de um processo ETL/ELT Integrar diferentes fontes de dados, garantindo a segurança, governança e a alta disponibilidade; Garantir a curadoria dos dados e respeito à LGPD; Construir, otimizar e executar scripts de atualização de dados de forma performática; Garantir as melhores práticas de modelagem e persistência de dados; Conhecer o modelo/regras de negócio para garantir a governança da informação, bem como a definição da estratégia de construção dos pipelines de dados; Estruturar e manter o ambiente de Data Lake e promover a definição de padrões para a arquitetura Medallion; Arquitetar soluções de grande escala, trabalhando com Big Data e Data Streaming; Atualizar-se constantemente com relação às melhores práticas para garantir a segurança dos dados; Gerir o correto versionamento do código-fonte com Git.