Cientista de Dados Sr

Barueri Remote

Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).

Integrar dados e métricas de avaliação em um fluxo automatizado e auditável.

Modularizar o pipeline para facilitar reuso, testes e manutenção.

Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto.

Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.

Propor melhorias contínuas na arquitetura de dados e nos processos de validação.

 

Requirements

• Experiência com AWS (Glue, S3, SageMaker, Lambda, entre outros);

• Experiência em manipulação de dados e modelagem estatística (Python, SQL, PySpark);

• Experiência sólida em ciência de dados,

•  Experiência prática com LLMs

• Experiência com metodologias ágeis;

 

Desejáveis:

Agentes autônomos

Deploy de modelos em produção

Monitoramento de modelos (drift, custo, performance)

Docker

CI/CD

Cloud (AWS, GCP ou Azure)

Versionamento de modelos e experimentos 

 

Modelo de trabalho: Remoto 

Preferencialmente profissionais de São Paulo- SP