Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).
Integrar dados e métricas de avaliação em um fluxo automatizado e auditável.
Modularizar o pipeline para facilitar reuso, testes e manutenção.
Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto.
Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Propor melhorias contínuas na arquitetura de dados e nos processos de validação.
• Experiência com AWS (Glue, S3, SageMaker, Lambda, entre outros);
• Experiência em manipulação de dados e modelagem estatística (Python, SQL, PySpark);
• Experiência sólida em ciência de dados,
• Experiência prática com LLMs
• Experiência com metodologias ágeis;
Desejáveis:
Agentes autônomos
Deploy de modelos em produção
Monitoramento de modelos (drift, custo, performance)
Docker
CI/CD
Cloud (AWS, GCP ou Azure)
Versionamento de modelos e experimentos
Modelo de trabalho: Remoto
Preferencialmente profissionais de São Paulo- SP