Desenvolver scripts e automações em Python / PySpark / SQL para modernizar processos legados (gestão de bases, regras e motor de alertas), reduzindo esforço manual e aumentando rastreabilidade.
Desenvolver modelos de Machine Learning end-to-end: scoping, exploração, criação de features, seleção /avaliação / interpretação de modelos, deploy em produção, monitoramento e retreinamento.
Trabalhar com grandes volumes de dados em ambientes distribuídos (Spark), com foco em performance e qualidade de dados.
Requirements
Requisitos
Experiência comprovada como Data Scientist, e iniciativas de IA/ML end‑to‑end, desde a fase de ideação e scoping até a implementação e operação em produção;
Forte domínio de Python aplicado a Data Science, automação e desenvolvimento de pipelines;
Experiência prática com pipelines de ML, versionamento de modelos/artefatos e reprodutibilidade;
Vivência com monitoramento de modelos e gestão de drift;
Experiência com dados em larga escala e ambientes distribuídos (PySpark);
Inglês Intermediário
Diferenciais
Experiência prévia em construção de modelo para fraude