Sobre a Finaya
Somos uma fintech de infraestrutura (Fintech as a Service) — construímos a base bancária que outras empresas usam pra criar seus produtos financeiros.
Você vai trabalhar sustentando e evoluindo a infraestrutura que roda apps de banco, carteiras digitais e soluções de pagamento usadas por milhões de pessoas.
Aqui, indisponibilidade não é “bug”. É dinheiro parado.
O que procuramos
- Não queremos alguém que só mantenha servidor rodando
- Queremos alguém que pense observabilidade como produto
- Que olhe um dashboard e questione se ele realmente conta a história certa
- Que refine alertas até reduzir ruído e aumentar precisão
- Que saiba atuar em incidentes com calma e método
- Que use IA (Copilot, Claude, ChatGPT etc.) para acelerar troubleshooting, análise e automações
- Que participe da evolução da arquitetura — não só reaja a problema
Não é pra você se...
- Vê observabilidade como “instalar ferramenta e pronto”
- Só reage quando o alerta dispara
- Acha que monitoramento é responsabilidade exclusiva de DevOps
- Não gosta de conversar com dev sobre instrumentação
- Não documenta decisões, runbooks ou aprendizados
- Prefere zona de conforto a melhoria contínua
Responsabilidades
🔎 Observabilidade & Monitoramento (50%)
- Evoluir estratégia de observabilidade (métricas, logs e traces distribuídos)
- Trabalhar com stacks como Datadog, Grafana/Prometheus/Loki, New Relic, Elastic, Signoz ou similares
- Implementar e evoluir instrumentação com OpenTelemetry
- Criar dashboards que façam sentido para negócio e troubleshooting
- Refinar alertas existentes (reduzir ruído, melhorar precisão, definir SLOs e error budgets)
- Ajudar times a entender latência por endpoint, falhas por serviço e gargalos reais
☸️ Infraestrutura & Plataforma (30%)
- Atuar em ambiente Kubernetes
- Apoiar times na evolução de arquitetura distribuída
- Melhorar pipelines de telemetria
- Automatizar rotinas operacionais
- Garantir resiliência e alta disponibilidade
🚨 Incident Response & Confiabilidade (20%)
- Liderar ou participar ativamente de incident response
- Criar e evoluir runbooks
- Conduzir postmortems estruturados
- Trabalhar com mentalidade de melhoria contínua (não busca culpado, busca causa raiz)
- Contribuir para maturidade de SRE e confiabilidade
Requisitos
✅ Obrigatório
- Experiência prática com pelo menos uma stack de observabilidade relevante (Datadog, Grafana stack,New Relic, Elastic, Signoz etc.)
- Conhecimento sólido dos 3 pilares: métricas, logs e traces distribuídos
- Experiência com Kubernetes em ambiente real
- Já ter participado de incident response na prática
- Experiência refinando alertas e estruturando dashboards úteis
- Boa comunicação com times de desenvolvimento
- Ownership real — não espera problema virar crise
⭐ Diferencial
- Experiência em fintech ou ambiente regulado
- Experiência com OpenTelemetry Collector e pipelines de telemetria
- Conhecimento em AIOps ou anomaly detection
- Experiência definindo SLOs e error budgets
- Ter estruturado estratégia de observabilidade do zero
Como trabalhamos
- Squads por produto/cliente — você não é “infra isolada”
- Sem cultura de blame — postmortem é aprendizado
- Deploy frequente
- Ambiente de alta responsabilidade (produto financeiro)
- Ferramentas: GitHub, Notion, Slack, Cursor/Claude
- Híbrido — frequência a combinar. Onboarding mais próximo do time
- Aqui DevOps não é suporte. É parte da engenharia do produto.
O que oferecemos
- $$$ competitivo
- Flexibilidade de horário
- Ambiente com alto impacto técnico
- Crescimento junto com a empresa
- Espaço real para estruturar observabilidade, automações e ferramentas de forma madura