Bora fazer parte de um time brilhante em uma Fintech que veio pra transformar o futuro da Educação no Brasil?
No isaac, operamos com um time enxuto de Site Reliability Engineering (SRE) que lidera nossa estratégia de Platform Engineering, priorizando a autonomia das equipes de desenvolvimento. Estamos focados em alavancar a produtividade das pessoas e a resiliência dos serviços, apoiando dezenas de pessoas desenvolvedoras, engenheiras de dados e cientistas de dados. O time de SRE é fundamental para nosso sucesso.
Para fortalecer nosso time, estamos em busca de uma pessoa SRE Sênior com expertise em automação de processos de infraestrutura e engenharia, com foco em Developer Experience.
No isaac, você terá a oportunidade de:
Fazer a diferença real: Você terá um impacto direto na produtividade e na autonomia das equipes de desenvolvimento, ajudando-as a criar e manter produtos e serviços excepcionais.
Trabalhar com tecnologias de ponta: Você terá a oportunidade de trabalhar com as mais recentes tecnologias em nuvem, como Kubernetes, GCP, Helm, Datadog, Terraform, Humanitec e cast.ai
Aprender e crescer: Você estará em um ambiente de aprendizado contínuo, cercado por pessoas talentosas e apaixonadas pelo que fazem.
Fazer parte de uma equipe incrível: Você se juntará a uma equipe pequena, mas de alto desempenho, de SREs experientes e apaixonados pelo seu trabalho.
Responsabilidades:
Criar abstrações e prover serviços de infraestrutura em nuvem que ajudem os times a reduzir a carga cognitiva e a fricção na criação e manutenção de produtos e serviços, aumentando sua autonomia e diminuindo o toil.
Avançar nossa plataforma Cloud com Infraestrutura como Código (IaC) usando Terraform e Kubernetes como base.
Gerenciar e otimizar os componentes usados pelas equipes em seus pipelines de Continuous Integration.
Administrar clusters Kubernetes rodando em GKE.
Colaborar com os times de desenvolvimento para definir a arquitetura por meio de RFCs.
Trabalhar em conjunto com as equipes de engenharia para desenvolver soluções em conjunto.
Diagnosticar problemas de arquitetura e em serviços mantidos pela equipe de SRE.
Contribuir na definição de estratégias de monitoramento e observabilidade dos sistemas, SLIs e SLOs.
Gerenciar incidentes de infraestrutura e prestar suporte às equipes de engenharia durante incidentes em suas aplicações.
Requisitos:
4+ anos de experiência como SRE, DevOps, Production Engineer ou Platform Engineer.
Proficiência em tecnologias de nuvem, preferencialmente GCP.
Experiência sólida em Terraform.
Ampla experiência em Kubernetes (GKE é um diferencial).
Conhecimento de Helm e/ou Kustomize.
Habilidade em pelo menos uma linguagem de programação (preferencialmente Go ou Python).
Conhecimento sólido em redes e protocolos, armazenamento, computação e CDN.
Compreensão dos princípios de segurança de aplicações e ambientes em nuvem.
Experiência em observabilidade.
Experiência em administração de sistemas Linux e bancos de dados (PostgreSQL e Redis).
Experiência em criação de pipelines de Integração Contínua/Integração Contínua e Entrega Contínua (CI/CD).
Experiência em monitoramento, observabilidade e registro de infraestrutura e serviços (Conhecimento de Datadog é um diferencial).
Será um diferencial se você tiver:
Ter trabalhado previamente em times de Plataforma
Ter experiência em startups
Ter experiência prévia como software engineer
#J-18808-Ljbffr