Desenvolver e otimizar pipelines de dados de alta performance.
Projetar soluções escaláveis para processamento de grandes volumes de dados.
Atuar na definição e evolução da arquitetura de dados.
Implementar processos de ETL e integração entre múltiplas fontes de dados.
Trabalhar com sistemas distribuídos e arquiteturas orientadas a eventos.
Garantir qualidade, performance e confiabilidade dos dados.
Integrar plataformas de dados com aplicações e APIs.
Participar de discussões técnicas e apoiar a evolução das melhores práticas de engenharia.
Graduação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
Inglês avançado para comunicação oral e escrita.
Excelente capacidade de comunicação e colaboração entre equipes técnicas e de negócio.
Mínimo de 7 anos de experiência em Tecnologia.
Pelo menos 5 anos de experiência prática como Engenheiro de Dados utilizando Apache Spark.
Conhecimentos Técnicos Mandatórios
Engenharia de Dados
ETL/ELT
Apache Spark
PySpark
Processamento distribuído de dados
Modelagem e integração de dados
Mensageria e Streaming
Apache Kafka
Processamento de eventos em tempo real
Bancos de Dados
Bancos relacionais (SQL)
Bancos NoSQL
Arquitetura e Plataforma
Arquitetura de Sistemas
Sistemas Distribuídos
APIs REST
Cloud Computing
Integração entre aplicações
Perfil Desejado
Forte visão arquitetural e sistêmica.
Capacidade analítica e resolução de problemas complexos.
Perfil hands-on e orientado à qualidade.
Facilidade para atuar em ambientes dinâmicos e colaborativos.
Boa comunicação com times multidisciplinares.
Diferenciais
Experiência com Data Lakes e Lakehouse.
Vivência em ambientes cloud (AWS, Azure ou GCP).
Conhecimento em CI/CD para pipelines de dados.
Experiência com observabilidade e monitoramento de plataformas de dados.
Conhecimento em arquiteturas orientadas a eventos.