Atividades do dia a dia:
Realizar o atendimento de incidentes de Infraestrutura Cloud e aplicação. Com base na análise de Logs, Traces e Métricas das aplicações, utilizando ferramentas de Observabilidade;
Realizar o troubleshooting e solução de incidentes de infraestrutura em Cloud (Azure), Microserviços, Nodes, PODS, EKS, Kubernets;
Desenvolver automações para solução de incidentes em primeiro nível visando a redução dos tempos de solução (MTTR);
Analisar a performance e falhas de aplicações, e identificar origem a de erros/falhas que possam afetar os produtos;
Tratar incidentes envolvendo APIS e aplicações;
Executar, validar e acompanhar a execução de esteira de mudanças;
Criar e aperfeiçoar monitorias de aplicações e infraestrutura, definir thresholds e criar alertas;
Criar e Executar Queries em bancos de dados.Requisitos para a posição:
Conhecimento em Ferramentas de Observabilidade, como Datadog, Grafana, Loki, Zabbix, Prometheus.
Conhecimento intermediários em cloud e seus componentes (rede, vm, banco, etc) preferencialmente Azure;
Conhecimento em ferramentas do linux como awk, sed e/ou grep;
Conhecimentos de estruturas de APIS, Postman, Swagger, Insomnia, troubleshooting, leitura de logs, versionamento e segurança;
Conhecimentos em Docker, Kubernetes, esteira CI/CD e Pipeline;
Experiência em Gestão de incidentes de alto impacto, análise e troubleshooting em camadas de infraestrutura e aplicação;
Conhecimento em protocolos TCP ee Fluência em Sistema Operacional Linux;
Conhecimentos em Linguagem SQL.Diferenciais:
Conhecimento em scripts bash/shell;
Conhecimento em uma linguagem de programação orientada a objetos (C#, kotlin, Java..);
Experiência em mercados financeiros em meios de pagamentos e mensageria ISO 8583;
Conhecimentos em Rotinas Batch, Control-M e Connect Direct.Mais detalhes sobre a posição:
Modelo hibrido em Alphaville/Barueri-SP;
Horário das 18h00 ás 06h00 (12x36) e de sábado das 09h00 ás 19h00.