Engenheiro de Dados Pleno

Barueri Hybrid

Se você busca estar em um time que combina alta performance, espírito inovador e cultura de parceria, essa vaga foi feita para você! 💙

Requirements

A área de Dados & IA da YSSY industrializa a inteligência dos nossos clientes: desenvolvemos pipelines
robustos, plataformas analíticas escaláveis e soluções de IA — da POC à produção. Atuamos com
governança de dados, DataOps, MLOps e hiperautomação para setores que exigem confiabilidade e
rastreabilidade em cada camada do dado.
Buscamos um(a) Engenheiro(a) de Dados Pleno para reforçar nosso time técnico. A pessoa contratada
atuará no desenvolvimento e manutenção de pipelines de dados em ambientes cloud e multicloud,
colaborando em projetos para clientes de diferentes setores e escalas — com impacto direto nos
resultados do negócio.

 

🎯 Principais responsabilidades:

  • Projetar, desenvolver e manter pipelines de dados (batch e streaming) usando ferramentas como
    Apache Spark, Airflow, dbt ou equivalentes.
  • Implementar e gerir arquiteturas de dados em nuvem (Azure, AWS ou GCP): Data Lakes, Data
    Warehouses e Lakehouses.
  • Garantir qualidade, rastreabilidade e governança dos dados ao longo de toda a cadeia de
    processamento.
  • Integrar fontes heterogêneas de dados — APIs, bancos relacionais, NoSQL e arquivos flat — com foco
    em confiabilidade e desempenho.
  • Colaborar com cientistas de dados e engenheiros de ML para disponibilizar dados prontos para
    modelagem preditiva e generativa.
  • Apoiar a implantação de práticas de DataOps: versionamento de pipelines, testes automatizados e
    observabilidade de dados.
  • Participar de discovery técnico com clientes, contribuindo para a definição de arquiteturas e
    roadmap de dados.
  • Documentar soluções, padrões e decisões de arquitetura de forma clara e objetiva.
  • Atuar em ambientes regulados (financeiro, saúde, energia), respeitando requisitos de compliance e
    segurança da informação.

🧩 O que esperamos de você:

  • Projetar, desenvolver e manter pipelines de dados (batch e streaming) usando ferramentas como
    Apache Spark, Airflow, dbt ou equivalentes.
  • Implementar e gerir arquiteturas de dados em nuvem (Azure, AWS ou GCP): Data Lakes, Data
    Warehouses e Lakehouses.
  • Garantir qualidade, rastreabilidade e governança dos dados ao longo de toda a cadeia de
    processamento.
  • Integrar fontes heterogêneas de dados — APIs, bancos relacionais, NoSQL e arquivos flat — com foco
    em confiabilidade e desempenho.
  • Colaborar com cientistas de dados e engenheiros de ML para disponibilizar dados prontos para
    modelagem preditiva e generativa.
  • Apoiar a implantação de práticas de DataOps: versionamento de pipelines, testes automatizados e
    observabilidade de dados.
  • Participar de discovery técnico com clientes, contribuindo para a definição de arquiteturas e
    roadmap de dados.
  • Documentar soluções, padrões e decisões de arquitetura de forma clara e objetiva.
  • Atuar em ambientes regulados (financeiro, saúde, energia), respeitando requisitos de compliance e
    segurança da informação.

✨ Diferenciais:

  • Orientado a resultado: foco em entregar valor mensurável ao cliente, não apenas código
    funcionando.
  • Comunicação clara: capacidade de traduzir decisões técnicas para interlocutores de negócio.
  • Comprometimento com qualidade e conformidade, especialmente em ambientes críticos e regulados.
  • Colaborativo e proativo: disposição para compartilhar conhecimento e apoiar o crescimento do time.
    Adaptabilidade para transitar entre diferentes tecnologias, clientes e contextos de projeto.
Benefits

💙 O que oferecemos:

🍽️ BIZ (cartão flexível)
🩺 Plano de Saúde Alice
😁 Plano Odontológico Amil (opcional)
🛡️ Seguro de Vida
🚌 Vale-transporte
💪 Wellhub (Gympass)
👶 Auxílio-creche para mamães e papais
🧠 Apoio Pass