Se você busca estar em um time que combina alta performance, espírito inovador e cultura de parceria, essa vaga foi feita para você! 💙
A área de Dados & IA da YSSY industrializa a inteligência dos nossos clientes: desenvolvemos pipelines
robustos, plataformas analíticas escaláveis e soluções de IA — da POC à produção. Atuamos com
governança de dados, DataOps, MLOps e hiperautomação para setores que exigem confiabilidade e
rastreabilidade em cada camada do dado.
Buscamos um(a) Engenheiro(a) de Dados Pleno para reforçar nosso time técnico. A pessoa contratada
atuará no desenvolvimento e manutenção de pipelines de dados em ambientes cloud e multicloud,
colaborando em projetos para clientes de diferentes setores e escalas — com impacto direto nos
resultados do negócio.
🎯 Principais responsabilidades:
- Projetar, desenvolver e manter pipelines de dados (batch e streaming) usando ferramentas como
Apache Spark, Airflow, dbt ou equivalentes.
- Implementar e gerir arquiteturas de dados em nuvem (Azure, AWS ou GCP): Data Lakes, Data
Warehouses e Lakehouses.
- Garantir qualidade, rastreabilidade e governança dos dados ao longo de toda a cadeia de
processamento.
- Integrar fontes heterogêneas de dados — APIs, bancos relacionais, NoSQL e arquivos flat — com foco
em confiabilidade e desempenho.
- Colaborar com cientistas de dados e engenheiros de ML para disponibilizar dados prontos para
modelagem preditiva e generativa.
- Apoiar a implantação de práticas de DataOps: versionamento de pipelines, testes automatizados e
observabilidade de dados.
- Participar de discovery técnico com clientes, contribuindo para a definição de arquiteturas e
roadmap de dados.
- Documentar soluções, padrões e decisões de arquitetura de forma clara e objetiva.
- Atuar em ambientes regulados (financeiro, saúde, energia), respeitando requisitos de compliance e
segurança da informação.
🧩 O que esperamos de você:
- Projetar, desenvolver e manter pipelines de dados (batch e streaming) usando ferramentas como
Apache Spark, Airflow, dbt ou equivalentes.
- Implementar e gerir arquiteturas de dados em nuvem (Azure, AWS ou GCP): Data Lakes, Data
Warehouses e Lakehouses.
- Garantir qualidade, rastreabilidade e governança dos dados ao longo de toda a cadeia de
processamento.
- Integrar fontes heterogêneas de dados — APIs, bancos relacionais, NoSQL e arquivos flat — com foco
em confiabilidade e desempenho.
- Colaborar com cientistas de dados e engenheiros de ML para disponibilizar dados prontos para
modelagem preditiva e generativa.
- Apoiar a implantação de práticas de DataOps: versionamento de pipelines, testes automatizados e
observabilidade de dados.
- Participar de discovery técnico com clientes, contribuindo para a definição de arquiteturas e
roadmap de dados.
- Documentar soluções, padrões e decisões de arquitetura de forma clara e objetiva.
- Atuar em ambientes regulados (financeiro, saúde, energia), respeitando requisitos de compliance e
segurança da informação.
✨ Diferenciais:
- Orientado a resultado: foco em entregar valor mensurável ao cliente, não apenas código
funcionando.
- Comunicação clara: capacidade de traduzir decisões técnicas para interlocutores de negócio.
- Comprometimento com qualidade e conformidade, especialmente em ambientes críticos e regulados.
- Colaborativo e proativo: disposição para compartilhar conhecimento e apoiar o crescimento do time.
Adaptabilidade para transitar entre diferentes tecnologias, clientes e contextos de projeto.