O que você precisa ter:Graduação completa na área de computação (Ciência da Computação, Sistemas de Informação, Engenharia de Computação, Engenharia de Controle e Automação, etc.
);Python contemporâneo avançado;Linux básico;Noções de Design de APIs em microsserviços;Noções de backend em Python (FastAPI, Flask, SQLAlchemy, etc.
);Habilidade para trabalhar em projetos multidisciplinares, colaborando com designers, desenvolvedores web, cientistas de dados, analistas de dados, gerentes de projeto e stakeholders;Inglês intermediário (leitura e escrita);Domínio das seguintes tecnologias/ferramentas em nível intermediário:-ETL/ELT e Data Warehousing-SQL-Git-Transformação de dados com Python (Pandas, Polars, PySpark, Regex, etc.
)-Orquestração de dados no Databricks-Computação em nuvem (preferencialmente Azure)-Orquestração de dados (preferencialmente Azure DataFactory)-Modelagem de dados (normalização e denormalização, modelagem dimensional, definição de chaves e índices, etc.
)-Visualização e análise de dados com Python (Matplotlib, Plotly, SciPy, Scikit, etc.
)-Pacote Office-Estatística descritiva-DevOps (Azure DevOps, CI/CD)-Docker O que seria legal saber:Mestrado e/ou Doutorado na área de Computação;SQL avançado;Noções básicas de desenvolvimento em arquitetura distribuída (Hadoop, Spark, MapReduce, etc.
);Noções básicas de criptografia;Noções básicas de Application Security;PowerBI;Experiência prévia com métodos ágeis (Scrum, Kanban);Noções de Testes Unitários;Noções básicas de Design Patterns (Factory, Strategy, etc.
);Noções de Clean Code;Estatística inferencial;Machine Learning;Certificações relacionadas.Gerar e manter código para extrair, transformar, agregar, limpar, integrar, validar, filtrar, anonimizar e carregar os dados de sistemas de origem para o formato adequado para utilização por modelos de inteligência artificial, de acordo com os requisitos pré-estabelecidos em conjunto com os Cientistas de Dados;Acompanhar a execução e realizar manutenções do fluxo de orquestração de dados;Projetar, propor e desenvolver melhorias e otimizações nos sistemas de transformação e orquestração de dados;Garantir a qualidade e segurança dos dados entregues e dos códigos relacionados;Dimensionar, especificar e orçamentar recursos computacionais em nuvem (pública ou privada) necessários para a transformação e orquestração dos dados;Auxiliar no Feature Engineering junto aos Cientistas de Dados;Comunicar com setores relacionados à entrega de dados e ao projeto de inteligência artificial como um todo;Gerar documentação;Participar das reuniões necessárias com os diversos times envolvidos;Elaborar status-report periódicos.