Brasil | 100% Remoto
Contratante: Avantti Tecnologia
Modelo de contratação: CLT (não flexível)
Duração: 12 meses (podendo ser prorrogado)
Sobre a Avantti Tecnologia
A Avantti Tecnologia é uma consultoria especializada em soluções digitais, serviços de tecnologia e alocação estratégica de profissionais de alta performance para projetos nacionais e internacionais. Atuamos conectando talentos a desafios complexos em ambientes inovadores, com foco em excelência técnica e entrega de valor.
Sobre a Oportunidade
Buscamos um(a) Especialista em Observability para atuar como referência técnica na definição, evolução e governança da estratégia de observabilidade, com foco em Datadog ou Elasticsearch.
Essa posição exige forte atuação em ambientes distribuídos, alta volumetria de dados e aplicações críticas, garantindo visibilidade, performance e confiabilidade dos serviços.
Principais Responsabilidades
1. Estratégia e Governança de Observabilidade
Definir e evoluir a estratégia de observabilidade corporativa
Atuar como referência técnica da plataforma
Promover boas práticas, padrões e governança
Apoiar times técnicos (infra, dev, arquitetura e operações)
Conduzir treinamentos e ações de disseminação de conhecimento
2. Administração e Otimização da Plataforma
Configurar, administrar e evoluir a plataforma (Datadog ou Elasticsearch)
Gerenciar agentes, coletores, pipelines e integrações
Controlar retenção, consumo, licenciamento e custos
Definir padrões de tagging, naming e organização
Garantir escalabilidade, performance e disponibilidade
3. Instrumentação e Telemetria
Implementar instrumentação automática e manual
Trabalhar com OpenTelemetry, SDKs e collectors
Coletar e correlacionar métricas, logs e traces
Mapear dependências entre serviços
Apoiar adoção de telemetria orientada a produtos
4. Performance e Troubleshooting
Analisar performance (latência, throughput, erros, disponibilidade)
Atuar com distributed tracing, profiling e RCA
Investigar incidentes complexos em ambientes distribuídos
Identificar gargalos e degradação de serviços
5. Dashboards, Alertas e Workflows
Criar dashboards operacionais e executivos
Construir alertas inteligentes e acionáveis
Implementar detecção de anomalias
Desenvolver notebooks e análises guiadas
Criar automações para resposta operacional
6. Integrações e Automação
Integrar com ferramentas como CMDB, ITSM, ServiceNow, CI/CD e APIs
Automatizar onboarding de serviços e observabilidade como código
Apoiar observabilidade em Kubernetes e cloud
Evoluir o ecossistema de observabilidade
7. Comunicação e Suporte à Decisão
Traduzir dados técnicos em insights claros
Apoiar decisões estratégicas com base em dados
Contribuir com melhoria contínua e confiabilidade
Interagir com stakeholders técnicos e executivos
Requisitos Obrigatórios
Experiência sólida com Datadog ou Elasticsearch
Forte atuação em implementação, administração e evolução da plataforma
Domínio em:Gestão de agentes e coletores
Políticas de retenção
Tuning de performance
Gestão de consumo/licenciamento
Governança da plataforma
Experiência com instrumentação (automática e manual)
Conhecimento prático em OpenTelemetry e observabilidade moderna
Capacidade de correlação entre métricas, logs e traces
Experiência com troubleshooting avançado e RCA
Criação de dashboards, alertas, consultas e workflows
Experiência com integrações via APIs/webhooks
Vivência com ambientes cloud e aplicações distribuídas
Experiência com Kubernetes/EKS
Conhecimento em metodologias ágeis (Scrum/Kanban)
Boa comunicação e perfil analítico
Diferenciais
Experiência em ambientes de grande porte e missão crítica
Domínio avançado em Datadog ou Elasticsearch
Atuação em ambientes de alta volumetria e arquitetura distribuída
Experiência em operações 24x7
Vivência em setores como financeiro, varejo, logística ou e-commerce
Conhecimento em microsserviços, APIs e mensageria
Experiência com incident/problem management
Automação de observabilidade como código
Atuação como referência técnica / mentor
Perfil Comportamental
Visão analítica e orientada a dados
Proatividade e senso de dono
Capacidade de influenciar tecnicamente
Comunicação clara com diferentes níveis
Foco em melhoria contínua e excelência operacional