Cientista de Dados Sênior | Hibrido - Fortaleza/CE ou São Paulo/SP | PJ

PJ, Fortaleza Hybrid

Buscamos uma pessoa Cientista de Dados para atuar em uma equipe analítica madura, desenvolvendo soluções de machine learning e grandes modelos de linguagem (LLMs) aplicadas a dados não estruturados e semiestruturados.


A missão será transformar dados textuais em informação acionável para o negócio, por meio de extração, classificação, sumarização, automação de processos e geração de insights.

Principais responsabilidades

  • Trabalhar com dados não estruturados ou semiestruturados (documentos, relatórios, textos livres etc.) para extração de informação, classificação e detecção de padrões.
  • Projetar, desenvolver e implantar modelos de machine learning e soluções baseadas em LLMs para casos de uso reais de negócio (ex.: extração de entidades, sumarização, classificação, análise de risco, automação de fluxos).
  • Construir pipelines de dados e ML ponta a ponta em plataformas escaláveis (ex.: Databricks ou equivalentes), incluindo ingestão, tratamento, feature engineering, modelagem, validação, deploy e monitoramento.
  • Colaborar com áreas de negócio e tecnologia para definição de problemas, métricas de sucesso e mensuração de impacto.
  • Garantir boas práticas de qualidade de dados, governança, privacidade e uso responsável de IA.
  • Comunicar resultados técnicos de forma clara para públicos não técnicos, conectando análises a decisões de negócio.
Requirements

Competências técnicas

  • Formação em áreas quantitativas ou de tecnologia (Computação, Engenharia, Estatística, Matemática, Ciência de Dados ou correlatas).
  • Experiência prática em ciência de dados ou machine learning com projetos em produção.
  • Experiência com LLMs, incluindo uso via APIs, prompt engineering, avaliação de resultados e integração em pipelines.
  • Proficiência em Python (pandas, numpy, scikit-learn, frameworks de ML/LLM) e SQL.
  • Experiência com ambientes de dados em nuvem ou plataformas de processamento distribuído (ex.: Databricks, Spark, Azure, GCP, AWS).
  • Boa comunização e capacidade de traduzir análises em valor para o negócio.


Diferenciais

  • Vivência com MLOps (deploy, monitoramento, versionamento, retraining).
  • Conhecimento em explicabilidade, viés algorítmico e governança de modelos.
  • Experiência com dados sensíveis ou ambientes regulados.
  • Familiaridade com ferramentas de visualização ou arquitetura moderna de dados.
Benefits

13 notas emitidas ao ano
Fornecimento de máquina pela empresa
Descanso remunerado de 30 dias após 12 meses