Consultor de Observabilidade
100% remoto
Experiência sólida com Datadog ou Elasticsearch, atuando em implementação, administração, sustentação e evolução da plataforma.
Domínio em configuração e operação da ferramenta, incluindo:
gestão de agentes e coletores;
políticas de retenção;
tuning de performance;
consumo/licenciamento;
organização e governança da plataforma.
Experiência com instrumentação de aplicações.
Conhecimento prático em OpenTelemetry, telemetria distribuída e observabilidade moderna.
Capacidade de análise e correlação de métricas, logs e traces.
Vivência com troubleshooting avançado, investigação de incidentes, profiling, tracing e análise de causa raiz.
Experiência na construção de dashboards, alertas, consultas, notebooks e workflows dentro da ferramenta.
Conhecimento em integrações via APIs, webhooks e conectores nativos, incluindo cenários com ITSM/CMDB e ferramentas de monitoração.
Experiência com ambientes cloud e aplicações distribuídas.
Vivência com Kubernetes/EKS e monitoramento/instrumentação de workloads em containers.
Conhecimento de práticas ágeis, como Scrum e Kanban.
Desejáveis:
Domínio avançado na ferramenta Datadog ou Elasticsearch.
Experiência em ambientes com alta volumetria de dados, múltiplos serviços e arquitetura distribuída.
Vivência em operações 24x7 e cenários com requisitos elevados de disponibilidade e resiliência.
Experiência no suporte a aplicações críticas para o negócio, preferencialmente em segmentos com alta exigência operacional, como varejo, financeiro, logística ou e-commerce.
Conhecimento em observabilidade aplicada a microsserviços, APIs, mensageria e ambientes híbridos/cloud.
Vivência com integração entre observabilidade e processos de incident management/problem management.
Experiência com automação de observabilidade como código.