O que buscamos:Estamos em busca de uma pessoa que atue com Site Reliability Engineering (SRE) para atuação híbrida (Centro de São Paulo) .Responsabilidades:Responsável pela disciplina de observabilidade do time de Operações de TI do cliente.Definição de Níveis de Serviço e Indicadores de níveis de serviço.Eliminação de "Toils" e melhoria contínua.Expansão das práticas SRE.Capacidade de liderar sala de crise em momento de troubleshooting.Avaliar a maturidade, definir estratégias de otimização, ajustes de resultados de processos e mensuração de dados.Acompanhar métricas e indicadores técnicos e de negócios, focar na disponibilidade, resiliência e desempenho dos serviços de TI.Manutenção proativa, troubleshooting, análise de causas raiz e solução de problemas.Projetos de modernização e jornadas para a nuvem.Experiência em seguradora e produtos bancários.Atuação em projetos e desenho de arquitetura voltado a observabilidade.Conhecimento em instrumentar nas ferramentas Grafana, AppDynamics, Dynatrace, ELK e Zabbix.Conhecimento em análise de log e cenários de conectividade e/ou integração entre aplicações e parceiros.Conhecimento na ferramenta Jira.Experiência com troubleshooting em ferramentas de APM.Contato diário com tecnologias de nuvem, principalmente AWS, GCP e Azure.Trabalhar na otimização de custos e performance dos serviços.Trabalhar diariamente para garantir a confiabilidade e segurança dos serviços.Diferencial: Conhecimento na ferramenta GitLab e Google Workspace.Descrição comportamental:Procuramos uma pessoa que:Goste de trabalhar em equipe e seja colaborativa em suas atribuições.Tenha coragem para se desafiar e ir além, abraçando novas oportunidades de crescimento.Transforme ideias em soluções criativas e busque qualidade em toda sua rotina.Tenha habilidades de resolução de problemas .Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo .Tenha interesse em lidar com situações adversas e inovadoras no âmbito tecnológico.#J-18808-Ljbffr