Buscamos uma pessoa Cientista de Dados para atuar em uma equipe analítica madura, desenvolvendo soluções de machine learning e grandes modelos de linguagem (LLMs) aplicadas a dados não estruturados e semiestruturados.
A missão será transformar dados textuais em informação acionável para o negócio, por meio de extração, classificação, sumarização, automação de processos e geração de insights.
Principais responsabilidades
- Trabalhar com dados não estruturados ou semiestruturados (documentos, relatórios, textos livres etc.) para extração de informação, classificação e detecção de padrões.
- Projetar, desenvolver e implantar modelos de machine learning e soluções baseadas em LLMs para casos de uso reais de negócio (ex.: extração de entidades, sumarização, classificação, análise de risco, automação de fluxos).
- Construir pipelines de dados e ML ponta a ponta em plataformas escaláveis (ex.: Databricks ou equivalentes), incluindo ingestão, tratamento, feature engineering, modelagem, validação, deploy e monitoramento.
- Colaborar com áreas de negócio e tecnologia para definição de problemas, métricas de sucesso e mensuração de impacto.
- Garantir boas práticas de qualidade de dados, governança, privacidade e uso responsável de IA.
- Comunicar resultados técnicos de forma clara para públicos não técnicos, conectando análises a decisões de negócio.