Como Cientista de Dados Sênior você fará parte de uma equipe analítica madura, atuando com projetos de ponta de machine learning e de grandes modelos de linguagem (LLMs) para tratar dados clínicos, operacionais e de beneficiários. A sua missão será transformar dados não estruturados ou semiestruturados (como laudos, prontuários, relatórios) em informação com valor para o negócio, via extração, classificação, detecção e geração de insights.
Principais Responsabilidades
- Trabalhar com dados não estruturados e/ou semiestruturados (por exemplo: laudos médicos, prontuários, relatórios clínicos) para extração de informação, classificação de documentos, detecção de padrões e automação de processos baseados em linguagem.
- Projetar, desenvolver e implantar modelos de machine learning e de LLMs para casos de uso específicos de saúde (ex: extração de entidades de texto, sumarização, classificação, inferência de risco ou condição).
- Utilizar plataformas de dados e ML escaláveis (como Databricks) para construir pipelines: aquisição de dados, limpeza, transformação, engenharia de features, modelagem, validação, implantação, monitoramento e manutenção.
- Colaborar com equipes de negócio, TI, inovação e operações clínicas para entender os desafios, definir hipóteses, selecionar as métricas certas e medir o impacto no negócio.
- Garantir que os modelos e soluções estejam alinhados com boas práticas de qualidade de dados, governança, ética, privacidade e anonimização / pseudonimização (LGPD) de forma apropriada para o contexto de saúde.
- Comunicar de forma clara e eficaz os resultados técnicos para públicos não-técnicos, contando a história dos dados, recomendando mudanças de processos ou novas soluções.