Nosso cliente é uma startup promissora no mercado de IA Generativa, com soluções para médias e grandes empresas B2B. Fundada em 2024, já possui um backlog robusto e desafios reais de escala, integração e entrega, com presença forte nos EUA.
Buscamos um SRE Sênior "mão na massa" e autônomo para liderar a construção e operação de uma plataforma AI Native.
É essencial ter sólida experiência em sistemas resilientes, escaláveis, observáveis e seguros, e paixão por aplicar IA em diagnósticos e automação.
Você garantirá a disponibilidade, performance, custo-eficiência e segurança, sendo a força motriz na infraestrutura e confiabilidade dos serviços de IA e microsserviços.
🚀 O que Esperamos de você (Responsabilidades):
- Infraestrutura & Orquestração: Projetar infraestrutura cloud/on-prem, e liderar operações
- Docker/Kubernetes (otimizando autoscaling, rollouts, segurança).
- CI/CD & Observabilidade: Desenvolver pipelines confiáveis (Git/gates/automações) e implementar observabilidade fim a fim (SLOs/SLIs/SLAs, logs/métricas/tracing).
- Arquitetura: Operar microsserviços (service mesh, padrões de resiliência) e administrar dados críticos (PostgreSQL HA/tuning).
- Segurança: Gestão de segredos, políticas de acesso, supply chain security e hardening.
- Automação/IaC/GitOps: Implementar Infra como Código e GitOps (Terraform/Helm/ArgoCD).
- Incidentes & IA: Conduzir incident response e postmortems com melhoria contínua baseada em dados e IA.
- Colaboração: Alinhamento com Eng, Produto, Data e ML.