Atividades do dia a dia:Realizar o atendimento de incidentes de Infraestrutura Cloud e aplicação.
Com base na análise de Logs, Traces e Métricas das aplicações, utilizando ferramentas de Observabilidade;Realizar o troubleshooting e solução de incidentes de infraestrutura em Cloud (Azure), Microserviços, Nodes, PODS, EKS, Kubernets;Desenvolver automações para solução de incidentes em primeiro nível visando a redução dos tempos de solução (MTTR);Analisar a performance e falhas de aplicações, e identificar origem a de erros/falhas que possam afetar os produtos;Tratar incidentes envolvendo APIS e aplicações;Executar, validar e acompanhar a execução de esteira de mudanças;Criar e aperfeiçoar monitorias de aplicações e infraestrutura, definir thresholds e criar alertas;Criar e Executar Queries em bancos de dados.Requisitos para a posição:Conhecimento em Ferramentas de Observabilidade, como Datadog, Grafana, Loki, Zabbix, Prometheus.Conhecimento intermediários em cloud e seus componentes (rede, vm, banco, etc) preferencialmente Azure;Conhecimento em ferramentas do linux como awk, sed e/ou grep;Conhecimentos de estruturas de APIS, Postman, Swagger, Insomnia, troubleshooting, leitura de logs, versionamento e segurança;Conhecimentos em Docker, Kubernetes, esteira CI/CD e Pipeline;Experiência em Gestão de incidentes de alto impacto, análise e troubleshooting em camadas de infraestrutura e aplicação;Conhecimento em protocolos TCP e e Fluência em Sistema Operacional Linux;Conhecimentos em Linguagem SQL.Diferenciais:Conhecimento em scripts bash/shell;Conhecimento em uma linguagem de programação orientada a objetos (C#, kotlin, Java..);Experiência em mercados financeiros em meios de pagamentos e mensageria ISO 8583;Conhecimentos em Rotinas Batch, Control-M e Connect Direct.Mais detalhes sobre a posição:Modelo hibrido em Alphaville/Barueri-SP;Horário das 18h00 ás 06h00 (12x36) e de sábado das 09h00 ás 19h00.