Somos a Squad OPX e estamos em busca de um(a) profissional experiente para se juntar à nossa equipe como DevOps SRE Especialista para construir e suportar produtos internos que facilitam e organizam o desenvolvimento da Magalu Cloud. Aqui você será responsável por: Gerenciar e operar infra-estruturas Kubernetes e diretamente em VMs. Colaborar com as equipes de desenvolvimento para resolver problemas de infraestrutura e aplicativos. Monitorar a saúde do sistema, solucionar problemas e responder a incidentes para manter a disponibilidade do serviço. Apoiar usuários dos produtos com orientações de uso e investigação de erros, usando log e ferramentas de monitoramento. Automatizar tarefas repetitivas e criar scripts para tarefas de infraestrutura. Definir e implementar estratégias de recuperação do ambiente em caso de desastre. Realizar revisões de código com olhar crítico, fornecendo feedbacks construtivos, de forma a garantir padronização e qualidade estabelecida entre o time. Analisar e elaborar arquitetura em sistemas distribuídos e/ou monolíticos, além de transcrever requisitos em projetos técnicos. Avaliar novas arquiteturas e tecnologias para evolução da estrutura existente. Documentar arquiteturas propostas por meio de Design Doc, Diagramas de sequência, entre outros. Sugerir mudanças que aumentem a qualidade dos produtos e a agilidade dos times. Projetar e implementar pipelines de CI/CD. Promover e implementar práticas recomendadas de DevOps e SRE na organização. Mentorear e treinar membros menos experientes do time para entregas de alta qualidade. Analisar e investigar possíveis fragilidades que comprometem a segurança cibernética da organização assim como recomendar ou desenvolver mitigações. Definir requisitos de segurança para novas soluções. Manter-se informado sobre as últimas ameaças cibernéticas, técnicas de ataque e melhores práticas de segurança, além de acompanhar as atualizações de regulamentações e conformidade. Acompanhar painel de monitoração do ambiente, propor e conduzir ações corretivas. Investigar incidentes e identificar a causa raiz. Criar gráficos e relatórios dinâmicos para suporte a tomada de decisão, e identificação de pontos de melhorias. Propor e avaliar roadmap de soluções a serem implantadas. Zelar e acompanhar os indicadores e prazos. É essencial que você tenha: Experiência Técnica Conhecimento e experiência prática com Kubernetes e VMs. Experiência com ferramentas de CI/CD, como Jenkins, GitLab, CircleCI ou semelhantes. Experiência em monitoramento, logging e alertas em ambientes Kubernetes. Conhecimento em conceitos e práticas de DevOps e SRE. Experiência em infraestrutura como código, como Terraform ou Ansible. Experiência com Docker ou outras tecnologias de contêineres. Banco de dados relacionais (Postgresql) e não relacionais (Elasticsearch, Kibana, Memcached, Redis, Mongo). Configuração de ferramentas de logging e habilidade de interpretação. Configuração de ferramentas de monitoramento e observabilidade (Prometheus e Grafana) para investigação e solução de problemas. Definir escopos de monitoramento e alertas importantes para sustentação do ambiente. Utilização plena de Linux Ubuntu. Ambientes de cloud (GCP, AWS ou Azure). Testes unitários, testes de integração e testes end-2-end. Experiência em arquitetura com resiliência, escalabilidade, elasticidade, processos síncronos, assíncronos, mensageria e sistemas em tempo real, com alto volume de transações. Experiência em Segurança em Cloud (AWS, Azure, GCP), DevSecOps, API's, Containers, Microsserviços e Criptografia. Segurança de Rede: Conhecimento em tecnologias de segurança de rede (Firewall, IPS, Anti-DDoS, etc.). Conhecimentos em Arquitetura de Redes. Mentalidade e comportamentos esperados Mente aberta para contribuições internas e externas na solução que você estiver trabalhando. Disposição e habilidade para trabalho cooperativo com colegas de diferentes níveis técnicos. Habilidade de colaborar efetivamente com outros membros da equipe e participar de projetos conjuntos. Ter interesse, vontade e proatividade em aprender e estar sempre em busca de evolução técnica dentro e fora do time. Comunicação aberta, humanizada, clara e objetiva. Pensamento de melhoria contínua. Receber e dar feedback de forma contínua e familiaridade com metodologias ágeis e trabalho em equipes multidisciplinares. Será um diferencial se você tiver: Conhecimento em linguagens de programação, como Python ou Go, é altamente desejável. Familiaridade com práticas de teste e segurança em ambientes DevOps. Contribuições em projetos open source. Experiência em instrumentação de código de produtos para metrificação, observabilidade e troubleshooting. Experiência em design e implementação de arquiteturas em contextos de cloud e Kubernetes. Idioma Inglês técnico ou intermediário Disponibilidade para viagens nacionais, se morar fora de SP (cerca de 4x no ano). Como é o ambiente de trabalho? Na Magalu Cloud, temos grande autonomia e responsabilidade, somos multidisciplinares, auto gerenciáveis e com pouca burocracia no nosso cotidiano. Buscamos romper as barreiras que diminuem nossa capacidade de agregar valor ao negócio. Fazemos entregas frequentes e agimos rapidamente ao encontrar problemas; nosso ritmo é acelerado, mas temos tranquilidade e equilíbrio para planejar e executar nossas tarefas com qualidade.