Estamos em busca de um(a) profissional experiente para se juntar à nossa equipe como Especialista SRE para entender as necessidades dos clientes internos criando e desenvolvendo as melhores soluções. Seu papel será auxiliar na implementação e manutenção de estratégias de confiabilidade e disponibilidade de sistemas, garantindo a eficiência e eficácia das operações de tecnologia da empresa. Além disso, trabalhará em estreita colaboração com as equipes de desenvolvimento e operações para otimizar a infraestrutura, automatizar processos e monitorar a saúde dos serviços. Aqui você será responsável por: - Garantir a implementação e manutenção de estratégias de confiabilidade e disponibilidade de sistemas. - Realizar diagnósticos e solucionar problemas em ambientes de produção. - Agir proativamente para resolver incidentes e evitar interrupções no serviço. - Trabalhar na construção de post-mortem. - Desenvolver e Implementar automação de processos e monitoramento de sistemas. - Definir, criar e analisar métricas dos serviços e aplicações da stack de infraestrutura e das aplicações. - Contribuir e disseminar a cultura de SRE e outras atividades relacionadas. - Participar de reuniões para alinhar estratégias e metas de SRE. É essencial que você tenha: - 8 anos de experiência em Cloud Pública (GCP, AWS, Azure). - 8 anos de experiência com ferramentas de monitoração e práticas de observabilidade (por exemplo, Grafana, Prometheus, Sentry). - 8 anos de experiência com ferramentas de automação como IaC (Terraform, Ansible, Juju). - 8 anos de experiência em arquiteturas de micro serviços em ambientes cloud. - 3 anos de experiência com shell scripting e linguagens de programação (Bash, Shell, Python e Go). - 3 anos de experiência com criação de SLI/SLO - Forte atuação com metodologias ágeis (Scrum/Kanban) - Experiência com API gateway (Kong Gateway) - 3 anos de experiência com serviços de mensageria - Experiência com ambiente Openstack e Rancher - Experiência com CI/CD (Jenkins, GitLab CI). - Inglês avançado. Será um diferencial se você: - Já ter atuando em times de desenvolvimento - Tiver experiência com bancos de dados relacionais e não-relacionais - Tiver experiência com ambientes Incus, LXC e LXD Na Magalu Cloud, temos grande autonomia e responsabilidade, somos multidisciplinares, auto gerenciáveis e com pouca burocracia no nosso cotidiano. Buscamos romper as barreiras que diminuem nossa capacidade de agregar valor ao negócio. Fazemos entregas frequentes e agimos rapidamente ao encontrar problemas; nosso ritmo é acelerado, mas temos tranquilidade e equilíbrio para planejar e executar nossas tarefas com qualidade.