Especialista em Confiabilidade de TI - SRE

CLT, São Paulo Hybrid

Sobre a Computécnica:

A Computécnica é uma empresa apaixonada por tecnologia, com mais de 40 anos de experiência no mercado. Somos parceiros Microsoft e certificados ISO 9001, o que nos garante qualidade e excelência no atendimento ao nosso cliente. Oferecemos capacitações e treinamentos para que nossos funcionários estejam sempre atualizados com as mais recentes tecnologias e tendências. Se você gosta de desafios, quer trabalhar com grandes empresas, atuar com as mais recentes tecnologias e fazer parte de uma equipe apaixonada por tecnologia, a CPT é o seu lugar!

Atividades:

  • Garantir a confiabilidade, disponibilidade e resiliência dos sistemas e infraestruturas tecnológicas da operadora, promovendo a continuidade operacional e a eficiência dos serviços digitais por meio da aplicação de práticas de engenharia de confiabilidade, automação, monitoramento e gestão estruturada de crises e incidentes.
  • Projetar, evoluir e sustentar arquiteturas com alta confiabilidade e disponibilidade, atuando de forma proativa na identificação de riscos e na prevenção de falhas.
  • Definir e monitorar indicadores como SLOs, SLIs e SLAs, garantindo alinhamento com os requisitos de negócio.
  • Liderar a análise de causa raiz de incidentes e propor melhorias estruturais.
  • Desenhar e implementar soluções de automação para processos críticos de infraestrutura, promovendo padronização, rastreabilidade e eficiência operacional.
  • Disseminar a cultura de Infrastructure as Code (IaC) e apoiar tecnicamente times na adoção de boas práticas. Identificar oportunidades de automação de tarefas repetitivas e processos operacionais.
  • Desenvolver e manter scripts, ferramentas e frameworks de automação utilizando diversas linguagens e tecnologias.
  • Otimizar processos de deploy, configuração e gerenciamento de infraestrutura.
  • Arquitetar e manter sistemas de monitoramento e observabilidade robustos, assegurando detecção precoce de anomalias e visibilidade em tempo real da saúde do ambiente.
  • Criar e evoluir painéis e alertas integrados ao fluxo de resposta a incidentes.
  • Projetar e implementar soluções de escalabilidade horizontal e vertical.
  • Realizar testes de carga e performance para identificar gargalos e garantir a resiliência dos sistemas.
  • Atuar como referência técnica na resposta a incidentes e gestão de crises, coordenando ações entre áreas e apoiando a comunicação com stakeholders.
  • Conduzir post-mortems estruturados, promovendo a cultura de melhoria contínua.
  • Representar a área tecnicamente em interações com fornecedores estratégicos, validando SLAs, métricas e entregáveis.
  • Apoiar a definição de requisitos técnicos em processos de contratação e revisão contratual.
  • Liderar análises de capacidade e planejamento de crescimento do ambiente, propondo soluções escaláveis e resilientes.
  • Realizar testes de carga e validar arquitetura para garantir performance sob demanda.
  • Atuar como elo técnico entre times de desenvolvimento, operações, segurança e negócio, influenciando decisões de arquitetura com foco em confiabilidade.
  • Compartilhar conhecimento e fomentar a adoção de práticas de engenharia de confiabilidade em toda a organização.
  • Cumprir o regulamento interno, os requisitos dos sistemas de gestão da qualidade, as regulamentações da ANS e as normas de saúde, higiene e segurança do trabalho, utilizando EPI’s/EPC’s sempre que necessário.
  • Executar outras atividades compatíveis com o escopo do cargo, conforme orientação da liderança.
  •  
Requirements
  • Superior em Ciências de Computação, Sistemas de Informação ou outros equivalentes na área de Tecnologia de Informação, desejável Cursos de Especialização ou MBA em áreas afins.
  • Experiência em ambientes de TI críticos com operação 24 x 7 para atendimento às necessidades de negócio;
  • Gestão de qualidade e disponibilidade através de provedores de serviços;
  • Soluções Cloud e As-a-Services.
  • Gestão de Fornecedores e prestadores de serviço.