Estamos em busca de um(a) Engenheiro(a) de Dados Pleno-Sênior que usa IA como ferramenta de trabalho real — e que tenha base técnica sólida para navegar sistemas complexos e entregar com qualidade.
Atuação com pipelines de dados de grande escala em health tech, lidando com dados médicos sensíveis, migração de sistemas legados e estruturação de data lake — tudo em um ambiente regulado e com times distribuídos globalmente.
Responsabilidades
Migrar dados de sistemas legados para a arquitetura atual, entendendo sistemas complexos que você nunca viu antes — usando IA para acelerar a compreensão e execução.
Estruturar e manter data lake em AWS (S3), organizando camadas de dados (bronze, silver, gold) com governança e qualidade.
Construir e manter pipelines de dados robustos usando Python e serviços AWS (Step Functions, Kinesis, ECS, Lambda, DynamoDB, etc).
Usar IA de forma intensiva no dia a dia: para escrever transformações, entender sistemas desconhecidos, acelerar debug e criar automações.
Criar automações e workflows com IA para acelerar processos do time (ex: scripts de transformação, validação de dados, geração de documentação).
Elevar o nível de uso de IA no time — compartilhar técnicas, prompts e workflows que funcionam, disseminando essa cultura internamente.
Participar do ciclo completo de desenvolvimento, com autonomia para propor soluções e executar.
Requisitos
4 anos ou mais de experiência em engenharia de dados ou áreas correlatas.
Experiência sólida com Python para construção de pipelines e transformações de dados.
Inglês fluente — comunicação diária com equipes internacionais.
Conforto para atuar em sistemas legados e de alta complexidade, fazendo migração de dados entre plataformas.
Uso avançado de ferramentas de IA para desenvolvimento — não basta conhecer, precisa usar no dia a dia com fluência.
Senso crítico sobre output de IA: saber quando o resultado da IA está errado, incompleto ou inseguro — e corrigir.
Diferenciais
Experiência com migração de sistemas legados e integração de fontes de dados heterogêneas.
Experiência com modelagem de data lake — organização em camadas (bronze/silver/gold), governança e qualidade de dados.
Conhecimento em AWS (S3, Step Functions, DynamoDB, Lambda, ECS, Kinesis ou similares).
Familiaridade com formatos de dados médicos (ex: DICOM).
Experiência com Machine Learning ou Data Science aplicados a pipelines de dados.
Perfil comportamental
Resolver primeiro, entender depois quando necessário. Você entra no problema sem precisar dominar todo o contexto antes. Usa IA para navegar o desconhecido, entrega, e aprofunda onde vale.
Protagonismo acima do perfeccionismo. Prefere uma solução que funciona à arquitetura perfeita que nunca sai do papel.
Conforto com o desconhecido. Sistema legado, stack que você nunca usou, dados sem documentação — você entra, usa as ferramentas que tem (IA inclusa), e resolve.
Iteração rápida. Tenta, ajusta com IA, tenta de novo — sem esperar a solução perfeita antes de começar.
Autonomia. Não espera especificação perfeita. Interpreta o problema, propõe solução, executa.
- Plano de Saúde e Odontológico
- Auxílio Home Office
- Auxílio Alimentação
- Férias Remuneradas
- Day Off no aniversário
- Programa de Saúde e Bem-Estar
- Programa de Desenvolvimento Individual (PDI).