Estamos buscando um Especialista de Confiabilidade de Sites (SRE) Nível 2 para integrar nosso time de engenharia e operações. O profissional será responsável por garantir a estabilidade, disponibilidade e performance das plataformas e serviços da empresa, atuando proativamente na resolução de incidentes, otimização da infraestrutura e automação de processos. Este papel é essencial para assegurar a continuidade dos negócios e o crescimento sustentável dos nossos serviços. Responsabilidade: Monitorar a infraestrutura e serviços críticos, garantindo alta disponibilidade e o cumprimento dos SLAs definidos; Realizar a resolução de incidentes de nível 2, identificando a causa raiz e propondo soluções para mitigar problemas futuros; Implementar e manter scripts de automação e monitoramento contínuo; Colaborar com equipes de desenvolvimento e operações para melhorar a confiabilidade dos sistemas e acelerar o ciclo de entrega; Participar de projetos de otimização de infraestrutura e modernização de sistemas legados; Propor melhorias nos processos e ferramentas usadas pela equipe para garantir maior eficiência e estabilidade. Requisitos : Formação Acadêmica: Graduação em Ciência da Computação, Engenharia da Computação ou áreas correlatas; Experiência em operações de TI, DevOps ou SRE em ambientes de alta disponibilidade; Experiência com monitoramento e observabilidade (Prometheus, Grafana, Nagios, etc.); Conhecimento em automação de infraestrutura com ferramentas como Ansible, Terraform ou Puppet; Experiência com sistemas operacionais Linux/Unix; Habilidade em linguagens de script como Python, Bash ou Shell; Experiência com contêineres (Docker, Kubernetes); Certificações: Certificação em AWS, Azure, Google Cloud, ou outra relevante em serviços de nuvem. Requisitos desejáveis: Experiência no setor de varejo; Conhecimento em bancos de dados relacionais, como SQL; Familiaridade com metodologias ágeis (Scrum, Kanban); Certificações adicionais em áreas como segurança ou redes.