Quem somos nós Com um catálogo abrangente de serviços integrados e especializados, a Orbbi atende às demandas operacionais e de segurança dos clientes, disponibilizando uma variedade de ferramentas que centralizam informações e infraestrutura de TI, simplificando a gestão e aprimorando o desempenho empresarial.
Responsabilidades e Atribuições: - Monitorar proativamente a infraestrutura de TI e os serviços, identificando e respondendo a alertas e incidentes em tempo real.
- Realizar troubleshooting avançado para diagnosticar e resolver problemas de infraestrutura, aplicações e redes.
- Participar da gestão e escalabilidade da infraestrutura, implementando e mantendo soluções de alta disponibilidade e tolerância a falhas.
- Documentar procedimentos, soluções e análises de causa raiz (RCA) para garantir a padronização e disseminação do conhecimento.
- Colaborar com outras equipes (desenvolvimento, segurança, redes) para garantir a integração e funcionamento adequado dos serviços de TI.
- Participar de projetos de melhoria contínua e otimização da infraestrutura, propondo e implementando soluções inovadoras.
- Trabalhar em regime de plantão, garantindo o suporte 24x7 aos serviços de TI.
Manter-se atualizado sobre as últimas tecnologias e tendências da área de ITOps.
Para Este Desafio, é Necessário: **Linux:** * Profundo conhecimento em administração de sistemas Linux (CentOS, Ubuntu, etc.).
* Experiência com troubleshooting, configuração e otimização de servidores Linux.
* Conhecimento em shell scripting (Bash, Python) para automação de tarefas.
* **AWS (Amazon Web Services):** * Experiência prática com serviços AWS como EC2, VPC, S3, IAM, RDS, CloudWatch e outros.
* Conhecimento em arquitetura de soluções na nuvem, melhores práticas de segurança e escalabilidade.
* Capacidade de diagnosticar e resolver problemas em ambientes AWS.
* **Redes:** * Sólido conhecimento em TCP/IP, DNS, DHCP, roteamento e protocolos de rede.
* Experiência em troubleshooting de problemas de conectividade e desempenho de rede.
* Familiaridade com ferramentas de análise de rede (tcpdump, Wireshark, etc.).
* **Troubleshooting:** * Habilidade em identificar, diagnosticar e resolver problemas técnicos complexos.
*Capacidade de realizar análise de causa raiz (RCA) e implementar ações corretivas.
* Experiência com ferramentas de diagnóstico e monitoramento de sistemas e aplicações.
* **Monitoramento e Observabilidade:** * Profundo conhecimento em ferramentas de monitoramento e observabilidade (Prometheus, Grafana, Zabbix, ELK Stack, Datadog, etc.).
* Capacidade de configurar dashboards e alertas para monitorar a saúde e o desempenho dos serviços.
* Conhecimento em métricas, logs e traces para análise de problemas e tendências.
* **Documentação:** * Excelente capacidade de documentar procedimentos, soluções, análises de causa raiz e projetos.
* Habilidade em criar documentos claros, concisos e organizados.
* Conhecimento em ferramentas de documentação (Confluence, Wiki, etc.).
* **Escalabilidade:** * Conhecimento e experiência em implementação de serviços escaláveis em ambiente de nuvem.
* Habilidade em implementar soluções de alta disponibilidade, balanceamento de carga, tolerância a falhas e replicação.
Informações Importantes: -Modelo de trabalho Remoto -Modelo de Contrato PJ.