O que procuramos?
Atribuições principais:
Prover guia técnico e mentor técnico a outros engenheiros;
Participar do desenvolvimento e manutenção da infraestrutura Cloud;
Colaborar nas decisões técnicas envolvendo arquitetura e infraestrutura (dimensionamento de carga, distribuição de carga, estratégias para cache, etc.);
Ser responsável por monitoramento e observabilidade dentro dos clusters e parcialmente nas aplicações também (uso de recursos das máquinas, gargalos de desempenho, análises preditivas de custo, etc.);
Estar em rotação on-call para raros incidentes de indisponibilidade ou manipulação de serviço;
Identificar e ajudar a solucionar problemas de desempenho e segurança;
Identificar oportunidades de melhorias e realizar a implementação de automatizações;
Elevar o nível dos sistemas de forma sustentável, por mecanismos de automação, soluções para que se tornem performáticos, escaláveis e disponíveis;
Disseminar conhecimento sobre as melhores práticas do SRE;
Planejar e direcionar a mudança de cultura através da Reabilidade do Sistema, incluindo: uso de padrões de arquitetura, gerenciamento de capacidade, sobre estrutura de nuvem utilizada pelos desenvolvedores;
Zelar pela manutenção dos serviços produtivos, medindo e monitorando a disponibilidade, latência e integridade geral do sistema;
Envolver-se no desenvolvimento de seus pares em um ambiente de aprendizagem colaborativa (trabalho em par, revisão de código, palestras internas, etc).
Requisitos:
Experiência sólida com AWS;
Proficiência em Kubernetes e na gestão de clusters de contêineres;
Habilidade em automação de infraestrutura usando ferramentas como Terraform, Ansible ou similares;
Experiência com pipelines de CI/CD (Jenkins, GitLab CI, etc.);
Conhecimento em monitoramento e observabilidade (Prometheus, Grafana, ELK stack, etc.);
Habilidade para solucionar problemas complexos e trabalhar sob pressão;
Boa comunicação e capacidade de trabalho em equipe.
Diferenciais:
Certificações AWS (AWS Certified Solutions Architect, AWS Certified DevOps Engineer, etc.);
Experiência com outras ferramentas de containerização e orquestração (Docker, OpenShift);
Conhecimento em linguagens de script (Python, Bash, entre outros).
Localidade da posição:Esta é uma posição Anywhere Office, você irá atuar % remoto.
Se identificou? Então, #VemSerMeta!
#J-18808-Ljbffr