Como Site Reliability Engineer (SRE) com foco em monitoramento e observabilidade, utilizando o Datadog, sua missão será garantir a excelência operacional de sistemas de infraestrutura.
Sua atuação será essencial para proporcionar suporte ágil às equipes de desenvolvimento e clientes, implementando práticas de DevOps assegurando a excelência operacional.Responsabilidades:Implementar e configurar monitoramento avançado com Datadog, garantindo visibilidade em tempo real da performance e saúde dos sistemas;Definir e acompanhar métricas e alertas, integrando o Datadog a outras ferramentas e fluxos de trabalho para otimizar o tempo de resposta a incidentes e assegurar a estabilidade dos serviços em produção;Colaborar diretamente com cliente e equipe interna para atender demandas;Gerenciar Código Fonte (Git), garantindo boas práticas de versionamento e colaboração na equipe;Projetar e manter arquiteturas baseadas em contêineres (Docker, Kubernetes), garantindo alta disponibilidade e escalabilidade;Projetar e manter pipelines de CI/CD eficazes, automatizando testes, integração e implantação contínua;Selecionar, implementar e manter ferramentas de CI/CD alinhadas com os requisitos do projeto;Projetar, implantar e manter serviços em nuvem em plataformas como AWS;Configurar proxies e equilibradores de carga para otimizar o desempenho e a resiliência;Implementar e manter soluções de monitoramento e logging para garantir a visibilidade operacional;Participar com troubleshooting de networking (triagem, packet loss e roteamento);Desenvolver scripts e automações usando linguagens como bash e PowerShell.Requisitos:Experiência com monitoramento e observabilidade usando Datadog;Conhecimento em monitoramento (Prometheus, Kibana, Grafana, Elasticsearch);Experiência com sistemas distribuídos (arquiteturas, micro-serviços, alta disponibilidade, eleições);Administração de containers;Experiência em serviços em nuvem;Conhecimento em proxies e load balancing (Nginx, HAProxy, Envoy);Experiência em logging (Splunk, SysLog, ELK Stack, Linux Journal, grep);Versionamento de código;Experiência com CI/CD;Conhecimento em Linux (bash, debugging);Networking (triagem, packet loss, routing);Conhecimento em linguagens como bash e PowerShell.O que mais você encontra aqui:Liberdade com responsabilidade: Trabalhamos de forma 100% remota, permitindo que você atue de qualquer lugar (anywhere office).Cultura de Desenvolvimento: Avaliação de desempenho, plano de desenvolvimento individual (PDI), Programa Investindo em Você, Programa de Desenvolvimento de Talentos.Saúde e Qualidade de Vida: Programa de Saúde e Bem-Estar, plano de saúde, plano odontológico, equilíbrio entre vida pessoal e profissional, desafios de saúde e prática esportiva.Programa Dividir para Multiplicar: Trabalhamos de forma colaborativa e dividimos os lucros!Day Off de Aniversário: Escolha um dia no mês do seu aniversário para aproveitar, comemorar e descansar.Auxílio Equipamento/Home Office.Vale Flexível: Benefício para gastos diários.Programa de Indicação Premiada: Indique pessoas incríveis para trabalhar conosco e ganhe $$.Seguro de Vida: Proteção e segurança para você e sua família.Conheça a Evoluum:Conduzimos a transformação digital de empresas, atuando com squad as a service, outsourcing, discovery, consultorias de arquitetura de software e soluções especializadas em nuvem.
Potencializamos o crescimento e a inovação, tornando a jornada para o futuro tecnológico uma experiência descomplicada e eficiente para nossos clientes.Aqui na Evoluum prezamos pela liberdade de ser você e todas as nossas vagas são destinadas a todas as pessoas.
Valorizamos as diferenças de todas as identidades de gênero, origem, crença, religião, orientação sexual e afetiva, deficiência, raça, etnia, idade, condição de saúde e/ou social, nacionalidade, corpo e quaisquer atributos intrínsecos à pluralidade humana.
Buscamos pessoas que acreditam no valor da liberdade e da confiança, que tenham empatia e respeitam as diferenças, que sejam colaborativas e estejam prontas para evoluir.
#J-18808-Ljbffr