[BF] ARQUITETO DE MONITORAMENTO (SRE)

São Paulo On-site

Ouvir, criar e inspirar a transformação digital dos nossos clientes é o que nos motiva.

De pessoas para pessoas 😍

Acreditamos que, mais do que tecnologia, a transformação digital é sobre como as pessoas conduzem as mudanças nas empresas. E por entender isso, o fator humano é o que nos faz evoluir e modernizar processos.

Não é somente mais uma oportunidade... e sim um convite para você fazer parte dessa história. 

Na iblue Consulting você vai trabalhar com uma equipe multidisciplinar, que é responsável por alavancar o crescimento do negócio através das nossas pessoas. 🚀

Buscamos profissionais com os seguintes valores que corroboram com os nossos valores:

Cuidado com as pessoas
Responsabilidade
Ética
Excelência e Resultados
Cliente no ​​​​​​​centro

Requirements

Estamos em busca de um ARQUITETO DE MONITORAMENTO com perfil SRE para liderar tecnicamente a observabilidade da organização. A pessoa será referência na adoção e consolidação do DataDog (infraestrutura e APM), com capacidade de participar ativamente da fundação da solução (arquitetura, padrões, integrações, governança, custos e cultura), em coexistência com Zabbix onde ainda for necessário.

É imprescindível experiência no segmento financeiro, com sensibilidade a: alta disponibilidade, risco operacional, segurança da informação, auditoria e tratamento adequado de dados em ferramentas de monitoramento.

Requisitos Obrigatórios

  • Experiência sólida com DataDog: infraestrutura e APM em ambientes corporativos de missão crítica.
    Capacidade de participar da fundação do DataDog: desenho inicial, integrações, padrões, governança e rollout multi-time.
  • Experiência prática com Zabbix.
  • Experiência em instituição financeira ou organização equivalente em rigor (disponibilidade, risco, auditoria, segregação).
  • APM e boas práticas em .NET (8 e 10) e Node.
  • Forte conhecimento de AWS: EKS, ECS, Lambda, API Gateway, SQS, SNS e S3 no contexto de observabilidade.
  • Experiência com front-end (Angular e React) para RUM e/ou monitoração de erros de aplicação.
  • Familiaridade com React Native.
  • Conhecimento de Windows Server / IIS e cargas WCF/Web Services em EC2.
  • Capacidade de definir observabilidade para VB6 e legados sem APM nativo (métricas, logs, sintéticos).
  • SRE/DevOps: CI/CD, containers, nuvem, confiabilidade; comunicação clara com times de desenvolvimento e infra.

Diferenciais Relevantes

  • OpenTelemetry e padronização multi-runtime.
  • IaC (Terraform) para configuração repetível de integrações.
  • Certificações: DataDog e/ou AWS.
  • Experiência em migração para DataDog ou convivência prolongada entre ferramentas.

Formação Acadêmica (graduação em)

  • Engenharia da Computação;
  • Ciência da Computação;
  • Sistemas de Informação;
  • Ou áreas correlatas com forte base em infraestrutura e desenvolvimento.

Principais Responsabilidades

  • Definir arquitetura de monitoramento e observabilidade (métricas, logs, traces, dashboards, alertas, SLIs/SLOs quando aplicável).
  • Conduzir a implantação e maturidade do DataDog: organização de contas/time, tags, integrações, agents, políticas de retenção, finops e otimização de custo.
  • Estabelecer padrões de APM e instrumentação para aplicações modernas (.NET, Node, frontends e mobile), com correlação entre trace, log e métrica.
  • Definir estratégia de RUM (Angular/React) e abordagem para React Native, respeitando privacidade e requisitos do setor financeiro.
  • Desenhar observabilidade para AWS em profundidade: EKS, ECS, Lambda, API Gateway, SQS, SNS, S3 (buckets), incluindo integração com DataDog e visão de filas, DLQs, latência e falhas.
  • Cobrir legado em EC2 Windows: Windows Services, IIS, WCF, Web Services (SOAP/ASMX) — combinando APM .NET quando aplicável com métricas de SO/IIS, logs e health checks.
  • Definir modelo de observabilidade para executáveis VB6 virtualizados (tipicamente host/processo, logs, métricas customizadas e checks sintéticos nas bordas; APM distribuído completo costuma ser limitado nesse stack).
  • Manter visão integrada com Zabbix.
  • Desenhar estratégia de alertas (severidade, ruído, escalação, runbooks) e apoiar post-mortems com base em dados.
  • Atuar com Segurança, Infra, Cloud e Desenvolvimento para garantir que monitoramento não exponha dados sensíveis e atenda políticas corporativas.
  • Documentar arquitetura, guias e onboarding; multiplicar boas práticas nas squads.

 

Escopo Técnico (ambientes e tecnologias a monitorar)

Aplicações e APM

  • .NET: serviços e APIs em .NET 8 e .NET 10 (APM, dependências, erros, performance).
  • Node.js: serviços e integrações com APM e rastreamento de dependências.
  • Front-end web: Angular e React (RUM, erros de browser, performance e jornadas críticas).
  • Mobile: React Native (estabilidade, erros e experiência do usuário, conforme estratégia e políticas adotadas).

AWS (foco especial)

  • EKS e ECS: saúde de cluster, workloads, recursos, métricas e logs integrados.
  • Lambda e API Gateway: latência, erros, throttling, cold start, integração com traces quando houver.
  • SQS e SNS: profundidade de fila, idade de mensagem, consumo/publicação, DLQ, falhas.
  • S3: métricas operacionais e alertas conforme necessidade (uso, anomalias, políticas internas).

Legado Windows (EC2)

  • Windows Services e sites em IIS (disponibilidade, application pools, filas, erros, recursos).
  • WCF e Web Services legados — visibilidade via APM onde suportado, complementada por logs e métricas de plataforma.
  • VB6 em ambiente virtualizado — monitoramento operacional por processo/host, logs e métricas/adapters; definição clara do que é observável versus o que exige instrumentação indireta.

Zabbix

  • Operação ou desenho de integração com Zabbix (templates, triggers, discovery ou transição planejada para DataDog), alinhado à estratégia de ferramentas.
Benefits

O que você terá do lado azul 🚀💙

CLT 👇

Programa de Saúde e Bem-Estar 🧘‍♀️🧘‍♂️

  • Plano de Saúde SulAmerica para você (cobertura nacional, enfermaria e com coparticipação);
  • Plano de academia TotalPass.

Para apoiar o seu dia a dia 😁

  • Notebook de última geração;
  • Vale Transporte;
  • Vale Refeição: R$ 770,00 (média 22 dias úteis/mês). Você pode escolher incluir os valores no VR ou no cartão Flash para você utilizar do jeito que você quiser;
  • Bônus por indicação de candidatos;
  • Convênio Financeira Creditas.

Para sua carreira🚀

  • Avaliação de desempenho anual com PDI – Plano de Desenvolvimento Individual;
  • Treinamentos na iblue Academy;
  • Treinamento na Udemy;
  • Certificações (AWS, Microsoft; IBM e H20);
  • Parcerias educacionais (com possibilidade de ajuda de custo atrelado a sua avaliação de desempenho);
  • Trilha de carreira estruturada Y (você pode escolher o caminho da gestão ou especialista).

COOPERATIVA 👇

Programa de Saúde e Bem-Estar 🧘‍♀️🧘‍♂️

  • Pacotes de benefícios oferecidos pela cooperativa que você poderá escolher de acordo com a sua necessidade;
  • Descanso remunerado de 15 dias, após 12º. mês.

Para apoiar o seu dia a dia 😁

  • Notebook de última geração;
    Bônus por indicação de candidatos.

Para sua carreira🚀

  • Treinamentos na iblue Academy;
  • Treinamento na Udemy;
  • Certificações (AWS, Microsoft; IBM e H20).

 

PJ 👇

Para apoiar o seu dia a dia 😁

  • Notebook de última geração;
  • Bônus por indicação de candidatos.

Para sua carreira🚀

  • Treinamentos na iblue Academy;
  • Treinamento na Udemy; 
  • Certificações (AWS, Microsoft; IBM e H20).