Cientista de Dados Sênior (AWS | LLMs | Python)

Barueri Remote

Cientista de Dados Sênior | Data Science & Machine Learning
Brasil | 100% Remoto
Contratante: Avantti Tecnologia
Modelo de contratação: CLT
Duração do projeto: 12 meses  (podendo ser prorrogado)

Sobre a Avantti Tecnologia
A Avantti Tecnologia é uma consultoria especializada em soluções digitais, serviços de tecnologia e alocação estratégica de profissionais de alta performance para projetos nacionais e internacionais.

 
Sobre a oportunidade
Estamos em busca de um(a) Cientista de Dados Sênior para atuar em um ambiente dinâmico e orientado a dados, com foco em construção, validação e monitoramento de modelos em ambiente cloud. Este(a) profissional terá papel estratégico na evolução de pipelines de dados e na maturidade de práticas de Machine Learning em produção.

Requirements

Responsabilidades
Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS)
Integrar dados e métricas em fluxos automatizados, auditáveis e escaláveis
Modularizar pipelines visando reuso, testabilidade e manutenção
Atuar em parceria com times de Data Science, Engenharia de Dados e Produto
Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados
Monitorar performance de modelos (drift, custo, acurácia)
Propor melhorias contínuas na arquitetura de dados e processos de validação
 
Requisitos obrigatórios
Graduação completa em Engenharia, Estatística, Matemática, Análise de Sistemas ou áreas correlatas
Experiência sólida em Ciência de Dados
Experiência com AWS (Glue, S3, SageMaker, Lambda, entre outros)
Forte experiência em manipulação de dados e modelagem estatística
Domínio de Python, SQL e PySpark
Experiência prática com LLMs (Large Language Models)
Vivência com metodologias ágeis
Perfil analítico com forte capacidade de resolução de problemas complexos
Boa comunicação e colaboração em equipe
 
Diferenciais
Experiência com agentes autônomos (AI Agents)
Deploy de modelos em produção (MLOps)
Monitoramento de modelos (data/model drift, custo, performance)
Experiência com Docker
Conhecimento em CI/CD
Experiência com outras clouds (GCP ou Azure)
Versionamento de modelos e experimentos (MLflow ou similares)
 
O que esperamos desse profissional
Visão sistêmica e foco em qualidade de dados e modelos
Proatividade e senso de dono
Capacidade de atuar em ambientes complexos e colaborativos
Orientação a resultados e melhoria contínua