Engenheiro de Dados Sênior

CLT, São Paulo Remote

Impactar positivamente bilhões de vidas é nosso propósito e também pode ser o seu! 🚀

 

Fundada em 2010, no Brasil, a Semantix é referência em Big Data, Analytics e Inteligência Artificial. 

 

Somos um time de apaixonados por inovação, com diversas origens e diferentes graus de experiência. O que nos une, é a motivação compartilhada de transformar a experiência de nossos clientes através da cultura data driven.

 

Se você se identificou, a Semantix é seu lugar. 

Estamos ansiosos para ter você como parte do time.

 

Afinal, o futuro se faz juntos. 💜  

Requirements

1) Responsabilidades

Construir e manter pipelines ETL/ELT no Azure Data Factory, integrando fontes como ERP/CRM/APIs/streaming para Lakehouse (Delta Lake) e camadas de consumo.
Desenvolver transformações e jobs no Databricks com Spark (PySpark/Scala) e SQL, garantindo performance, custo e confiabilidade.
Realizar modelagem de dados (bronze/silver/gold) e disponibilizar datasets para consumo em Power BI e/ou DW/Lakehouse.
Atuar como ponte entre engenharia de dados e BI, traduzindo demandas do negócio em soluções analíticas.
Implementar boas práticas de governança (catálogo, ownership, padrões, controles de acesso) e apoiar conformidade com LGPD.
Definir e operar Data Quality, observabilidade e lineage, com monitoramento, alertas e SLAs.
Automatizar infraestrutura e deploys com Terraform e CI/CD.
Documentar soluções, desenhar arquitetura e participar de decisões e estimativas.
 

2) Requisitos obrigatórios

Experiência sênior em Azure com Databricks e Azure Data Factory.
Domínio de Delta Lake/Lakehouse, Spark (PySpark/Scala) e SQL.
Experiência com modelagem para analytics/BI e integração com Power BI.
Vivência com governança/catálogo de dados e controles de acesso (ex.: Unity Catalog e/ou ferramenta de catalogação corporativa).
Experiência com Data Quality/Observabilidade/Lineage e práticas alinhadas à LGPD.
Experiência com Terraform e pipelines de CI/CD.
Soft skills: comunicação com negócio, autonomia e gestão de prioridades.
Inglês avançado (reuniões e documentação) - Será testado em entrevista.
 

3) Diferenciais

Otimização avançada de performance/custos no Databricks.
Experiência com streaming/near real-time (ex.: Kafka/Event Hubs).
Forte bagagem em arquitetura analítica e padrões de modelagem para BI (camada semântica, star schema).
Certificações Azure Data Engineer e/ou Databricks.

Benefits

💰 Salário compatível com o mercado;

🍎 Caju (cartão flexível) com a recarga mensal;

🚑 Plano de Saúde Bradesco;

🦷 Plano Odontológico Bradesco;

👩‍⚕️ Medicina preventiva com Dr. Alper;

💜 Seguro de Vida;

🏋🏽‍♂️ Gympass;

🏞️ SESC;

👶🏼 Auxílio Creche para mamães e papais;

🧠 Learning – área focada no desenvolvimento de hard e soft skills;

📖 Parceria com instituições de ensino para formação técnica, MBA, pós-graduação, certificações, inglês e espanhol;

🚀 Plano de Carreira;

🛒 Desconto em produtos de um portal parceiro.

Ressaltamos que todas as nossas vagas estão abertas a pessoas de todos os perfis e origens, valorizando a diversidade e promovendo um ambiente inclusivo e acolhedor para todos. 💎