Atividades do dia a dia: Realizar o atendimento de incidentes de Infraestrutura Cloud e aplicação.
Com base na análise de Logs, Traces e Métricas das aplicações, utilizando ferramentas de Observabilidade; Realizar o troubleshooting e solução de incidentes de infraestrutura em Cloud (Azure), Microserviços, Nodes, PODS, EKS, Kubernets; Desenvolver automações para solução de incidentes em primeiro nível visando a redução dos tempos de solução (MTTR); Analisar a performance e falhas de aplicações, e identificar origem a de erros/falhas que possam afetar os produtos; Tratar incidentes envolvendo APIS e aplicações; Executar, validar e acompanhar a execução de esteira de mudanças; Criar e aperfeiçoar monitorias de aplicações e infraestrutura, definir thresholds e criar alertas; Criar e Executar Queries em bancos de dados.
Requisitos para a posição: Conhecimento em Ferramentas de Observabilidade, como Datadog, Grafana, Loki, Zabbix, Prometheus.
Conhecimento intermediários em cloud e seus componentes (rede, vm, banco, etc) preferencialmente Azure; Conhecimento em ferramentas do linux como awk, sed e/ou grep; Conhecimentos de estruturas de APIS, Postman, Swagger, Insomnia, troubleshooting, leitura de logs, versionamento e segurança; Conhecimentos em Docker, Kubernetes, esteira CI/CD e Pipeline; Experiência em Gestão de incidentes de alto impacto, análise e troubleshooting em camadas de infraestrutura e aplicação; Conhecimento em protocolos TCP e HTTP e Fluência em Sistema Operacional Linux; Conhecimentos em Linguagem SQL.
Diferenciais: Conhecimento em scripts bash/shell; Conhecimento em uma linguagem de programação orientada a objetos (C#, kotlin, Java..); Experiência em mercados financeiros em meios de pagamentos e mensageria ISO 8583; Conhecimentos em Rotinas Batch, Control-M e Connect Direct.
Mais detalhes sobre a posição: Modelo hibrido em Alphaville/Barueri-SP; Horário das 18h00 ás 06h00 (12x36) e de sábado das 09h00 ás 19h00.