Cientista de Dados

Curitiba Remote

Estamos em busca de um(a) Cientista de Dados com foco em Machine Learning para atuar em projetos estratégicos de um cliente do setor de gás, desenvolvendo soluções inovadoras que otimizam operações, previnem incidentes e geram valor para o negócio.

Essa posição é voltada para profissionais com experiência prática no desenvolvimento e implantação de modelos de ML em produção, capazes de trabalhar de ponta a ponta no ciclo de ciência de dados, desde a engenharia de features até o monitoramento e melhoria contínua.

 

Responsabilidades:

Desenvolver, treinar e manter modelos de machine learning em produção.
Construir pipelines de dados e realizar engenharia de features.
Implementar workflows automatizados em Databricks ou plataformas similares.
Monitorar performance, qualidade e drifts dos modelos.
Documentar tecnicamente projetos e soluções.
Colaborar com áreas de negócio para entendimento de requisitos e definição de métricas de sucesso.
Participar de code reviews e atuar como mentor(a) para membros juniores.

 

OPORTUNIDADE PJ, REMOTA, MAS COM DISPONIBILIDADE DE IDAS ESPORÁDICAS A CAMPINAS.

Requirements

Experiência prática com Python (pandas, seaborn, matplotlib, scipy, numpy, scikit-learn, xgboost).
Vivência com PySpark e processamento de dados em larga escala.
Conhecimento sólido em algoritmos de ML (classificação, regressão, séries temporais).
Experiência com MLflow para gestão e tracking de modelos.
Vivência com Databricks ou plataformas similares.
Conhecimento em Git e boas práticas de desenvolvimento.
Formação em Ciência da Computação, Engenharia, Estatística ou áreas correlatas.
Experiência comprovada em projetos de ML/AI em produção.
Diferenciais
Experiência com TensorFlow/Keras e projetos de deep learning;
Conhecimento em visão computacional (OpenCV);
Vivência com otimização matemática (Gurobi, PuLP);
Experiência com Unity Catalog e MLOps;
Conhecimento em estatística aplicada.