Formação em TI, computação ou áreas correlatas; Experiência anterior; Vivência em operações de missão crítica ou operação de TI; Comunicação Ascendente; Metodologias ITIL, em especial Gerenciamento de Eventos, Incidentes, Problemas ou Mudanças; Disponibilidade para trabalhar em jornadas eventuais nos turnos noite, madrugada ou finais de semana; Ter atuado em ambientes aderentes a práticas de SRE ou DevOps; *_Será considerado diferencial:_* Habilidade de liberar os times técnicos nas discussões para determinar causa raiz (RCA), casuística das ocorrências do evento, fatores preponderantes e secundários, elaborar planos de ataque e mitigação da causa, identificar oportunidades adjacentes; Experiência nos mercados de telecomunicações ou financeiro; Experiência em Gestão de Incidentes e Problemas de ambientes complexos e de alta demanda ; Inglês ou espanhol em nível avançado; Especialização ou MBA em áreas relacionadas a TI ou Gestão; Conhecimento da plataforma Service Now; Certificações em metodologias ou tecnologia correlatas. Colaborar na construção de processos de Operação, Monitoração e Incidentes Críticos baseado em governança ITIL e na disciplina SRE; Adotar, entender e utilizar as prática de SRE; Adotar, entender e executar OKRs e KPIs; Garantir a adoção dos processos, procedimentos e automações; Garantir a conformidade dos controles operacionais conforme políticas e normas previstas; Acionamento tempestivo das equipes necessárias para atuação nas salas de crise; Comunicação executiva sobre andamento das salas de crise; Tomada de decisão em benefício da melhor solução, no menor tempo e com menor impacto aos serviços e clientes; Orquestrar nas salas de crise (war-rooms), aplicando conhecimentos e práticas para resolução de problemas com objetivo de encontrar a melhor solução no menor tempo possível, muitas vezes direcionando no envolvendo das equipes técnicas de suporte infraestrutura, suporte aplicação, desenvolvedores, arquitetos e fornecedores de infra e software; Apoiar no desenvolvimento de modelos de análise de dados para detecção de falhas recorrentes; Apoiar no desenvolvimento de processos que eliminem ou minimizem as ocorrências de falhas, evitem seus impactos, reduzam custos e aumentem a satisfação dos clientes com os serviços, além de garantir analise e geração de planos de ação dos post-mortems, sua cobrança e execução; Apoiar na implantação dos processos de incidentes e problemas junto as times internos e fornecedores de infraestrutura e serviços de TI, mantendo alinhamento técnico e execução das atividades de RCA / Post-mortem;