SR SRE (Site Reliability Engineer)

PJ, São Paulo Remote

Estamos em busca de um SR SRE para atuar em um de nosso grandes clientes: uma plataforma global de “bare metal cloud” que une desempenho de hardware dedicado com automação de nuvem. Nossa missão é tornar a Internet mais rápida e segura, oferecendo servidores físicos altamente performáticos, com baixa latência, provisionamento automatizado e presença global. 

Requirements
  • Projetar, construir e manter sistemas confiáveis, escaláveis e auto-recuperáveis que suportam nossa plataforma global de servidores bare metal
    Garantir visibilidade e observabilidade (monitoramento, logging, métricas) para serviços críticos;
  • Definir e operar práticas de alta disponibilidade, recuperação de desastres e escalabilidade;
  • Automatizar processos operacionais usando infraestrutura como código, ferramentas de automação e runbooks;
  • Investigar incidentes, realizar root cause analysis (RCA) e propor melhorias contínuas;
  • Trabalhar em estreita colaboração com times de infraestrutura, redes, produto e engenharia para alinhar os requisitos operacionais com a estratégia de produto;
  • Contribuir para a cultura de confiabilidade, compartilhando conhecimento e boas práticas.

Requisitos técnicos

  • Experiência sólida como Site Reliability Engineer, com foco em sistemas distribuídos, alta disponibilidade e escalabilidade;
  • Profundo conhecimento em ferramentas de observabilidade (monitoramento, alertas, tracing);
  • Experiência com automação: IaC (Terraform, Ansible ou similares), scripts, pipelines de CI/CD;
  • Experiência com sistemas de containerização, orquestração e/ou virtualização (opcional, dependendo do setup interno);
  • Forte entendimento de redes, racks, servidores dedicados / bare metal;
  • Experiência com análise de incidentes, definição de SLIs/SLOs e cultura de SRE;
  • Boa comunicação (documentação, runbooks, apresentação de incidentes);
  • Inglês fluente (para trabalhar com times distribuídos e ler documentação técnica).

Diferenciais (não obrigatório, mas valorizado)

  • Experiência com provedores bare metal ou infraestrutura física;
  • Conhecimento de proxys de rede, BGP, automação de rede
    Experiência com cloud-native ou híbrido (bare metal + nuvem pública);
  • Histórico com grandes cargas de trabalho (telecom, streaming, IA).
Benefits
  • Remuneração competitiva;
  • Bônus anual;
  • Seguro saúde + plano odontológico (cobertura para dependentes);
  • 4 semanas de férias pagas por ano + feriados nacionais;
  • Flexibilidade de horário
  • Auxílio para coworking (em cidades que tiverem esse benefício);
  • Apoio para desenvolvimento profissional: aulas de inglês, certificações técnicas.