Job description
Objetivo do Cargo
Um especialista de Engenharia de Confiabilidade do Site (SRE) desempenha um papel crucial/vital para garantir o bom funcionamento de sistemas/infra e serviços de software, e na ponte entre o desenvolvimento e as operações, garantindo que os sistemas não sejam apenas funcionais, mas também confiáveis e escaláveis.
Main responsibilities
Como será o seu dia a dia ?
Manter e otimizar a infraestrutura em cloud AWS, garantindo alta disponibilidade, escalabilidade e desempenho das aplicações.
Monitorar e gerenciar a saúde e o desempenho das aplicações WEB/APIs, implementando soluções proativas para identificar e resolver problemas.
Trabalhar em estreita colaboração com as equipes de desenvolvimento para implementar práticas de engenharia de confiabilidade em todo o ciclo de vida do desenvolvimento.
Automatizar processos operacionais e de infraestrutura usando ferramentas como Terraform, CloudFormation ou Ansible.
Configurar e gerenciar sistemas de monitoramento e alerta para garantir a visibilidade completa do ambiente de produção.
Colaborar com as equipes de segurança para implementar e manter as melhores práticas de segurança na infraestrutura e nas aplicações.
Realizar testes de carga e stress para identificar e resolver gargalos de desempenho.
Participar na definição da arquitetura de sistemas e na escolha de tecnologias para garantir a escalabilidade e resiliência das aplicações.
Responder a incidentes críticos, realizando análise de causa raiz e implementando soluções permanentes.
Promover uma cultura de melhoria contínua e colaboração entre as equipes de desenvolvimento e operações.
Compreender a interação e relacionamento entre as operações de negócios e sistemas.
Requirements and skills
Pré-Requisitos
Mínimo diploma de bacharel em ciência da computação, tecnologia da informação ou áreas afins.
Certificações relevantes.
Familiaridade com plataformas de cloud, como Microsoft Azure, AWS, Google Cloud Platform.
Proficiência em linguagens de programação como Python, Java, .Net ou outras comumente usadas em desenvolvimento e automação de software.
Experiência com tecnologias de conteinerização como Docker e ferramentas de orquestração como Kubernetes (K8S, AKS, EKS, GKS, Rancher).
Conhecimento de ferramentas de infraestrutura como código (IaC), exemplo: Terraform.
Compreensão de conceitos de rede, incluindo TCP/IP, DNS, HTTP, etc.
Compreensão dos conceitos de segurança, todas as camadas.
Capacidade de solucionar problemas complexos em toda a pilha de tecnologia, desde o código do aplicativo até a infraestrutura.
Uso/conhecimento de Ferramental (ou similares) tais como: Docker, GIT, Jenkins, Ansible, Terraform, Prometheus/Grafana, DataDog, SonarQube, OpenLens entre outras.
Ter espírito colaborativo, habilidade de organização e liderança.
Ser bom comunicador, zelando pela transparência e efetividade da comunicação.
Resolução de problemas: Análise de questões técnicas complexas, da identificação das causas raízes e da implementação de soluções eficazes para prevenir a recorrência.
Adaptabilidade: A capacidade de adaptação a ambientes e tecnologias em rápida mudança.
Inglês avançado.
Additional information
Sobre a oportunidade
Contratação CLT - Híbrido
Local: Centro de Guarulhos/SP
Horário de trabalho comercial de segunda à sexta-feira.
O que você vai encontrar aqui:
Vale-Refeição;
Vale-Transporte ou Vale Combustível para atender melhor sua necessidade;
Assistência Médica Amil (Opcional após 90 dias, para você e seus dependentes, subsidiada por você e pela RB);
Assistência Odontológica Amil (Opcional para você e seus dependentes);
Seguro de Vida em grupo;
Gympass/Wellhub - parceria com academias e estúdios para cuidar de sua saúde física;
Zenklub - parceria online com diversos profissionais para cuidar de sua saúde mental;
Férias & Co - parceria de viagens com descontos para hospedagens e passagens aéreas.
#J-18808-Ljbffr