Engenheiro de Dados

São Paulo Hybrid

Somos a Apostou.bet 

Aqui você não faz mais um trabalho. Constrói o case que vai marcar sua carreira. 🚀

O mercado brasileiro de entretenimento digital merece mais. Mais velocidade, mais sofisticação, mais obsessão pelo detalhe. A Apostou.bet foi criada para provar que esse padrão é possível — e estamos procurando as pessoas que vão construir isso com a gente.

Somos AI-Native do zero. Sem legado, sem burocracia, sem "é assim que sempre foi feito". Cada decisão parte do princípio de que dá pra fazer melhor — e quem está aqui dentro tem autonomia real para provar isso.

Se você é o tipo de pessoa que transforma feedback em ação, que usa tecnologia pra ampliar o que consegue entregar, e que prefere risco com propósito a conforto sem crescimento — você vai se sentir em casa.

A régua sobe a cada ciclo. O ambiente é exigente, o ritmo é alto, e o aprendizado é acelerado. Em troca, você constrói algo que importa, com pessoas que levam o trabalho a sério — e você é dono do que entrega, de verdade.

O que esperamos de você nessa posição:

  • Projetar e construir do zero a arquitetura de dados da plataforma — data warehouse, data lake ou arquitetura medallion — definindo as camadas raw, staged e curated que sustentarão toda a inteligência do negócio.
  • Desenhar, implementar e manter pipelines de ingestão de dados (batch e streaming) a partir da plataforma NGX, CRM Smartico, provedores de jogos, gateways de pagamento, fontes externas e canais de atendimento.
  • Construir e evoluir o Data Warehouse / Data Lake da operação, com arquitetura moderna (camadas bronze, silver, gold) e governança de qualidade de dados ponta a ponta.
  • Implementar rotinas de ETL/ELT automatizadas usando ferramentas como Airflow, dbt, Fivetran ou equivalentes, garantindo SLA acordado com as áreas consumidoras.
  • Atender ativamente as demandas das demais áreas da operação, estruturando dados no formato que elas precisam.
  • Garantir integridade, segurança e compliance dos dados (LGPD, auditoria SPA, controle de acesso por papel, mascaramento de dados sensíveis) em parceria com Jurídico e Tecnologia.
  • Monitorar performance de queries, custos de processamento e confiabilidade das pipelines, atuando continuamente em otimização de infraestrutura cloud (AWS/GCP/Azure).
  • Colaborar com o Analista de Dados III na modelagem dimensional, criação de data marts e camadas semânticas para consumo analítico e autoatendimento.
  • Dar suporte ao Head AI/Dados na disponibilização de features engineering, feature stores e datasets tratados para modelos preditivos e sistemas de recomendação.
  • Desenvolver e manter APIs internas de dados para consumo por times de Produto, CRM e Marketing, com baixa latência e escalabilidade.
  • Documentar arquitetura, catálogo de dados, lineage e dicionários (Data Catalog) para garantir discoverability e autonomia das áreas.
  • Implementar observabilidade (logs, métricas, alertas) sobre pipelines e qualidade de dados, com dashboards de monitoramento proativo.
  • Participar com o Head AI/Dados e o PO/Scrum Master do mapeamento de dados e processos de cada área, traduzindo necessidades em backlog técnico.
  • Atuar como referência técnica para padrões de engenharia de dados, mentorar analistas e revisar código de pipelines críticos.
  • Utilizar IA como extensão do trabalho técnico — geração de código, revisão de queries, documentação, troubleshooting, detecção de anomalias em pipelines e aceleração de entrega.
Requirements

O que você trará:

  • Mínimo 6 anos em engenharia de dados com experiência em construção de data warehouses ou pipelines de produção
  • Graduação em Ciência da Computação, Engenharia, Estatística, Sistemas de Informação ou áreas correlatas
  • SQL avançado em data warehouses cloud (BigQuery, Redshift ou Snowflake) — modelagem dimensional, CTEs, window functions, otimização de queries
  • Python para engenharia de dados — pandas, PySpark, construção de pipelines ETL/ELT
    dbt (data build tool) — modelagem em camadas, testes de qualidade, documentação e versionamento de modelos
  • Apache Airflow ou orquestrador equivalente (Prefect, Dagster) em ambiente de produção
  • Cloud data platform: GCP (BigQuery, Dataflow, Pub/Sub) ou AWS (Redshift, Glue, Kinesis)
  • Kafka ou plataforma de streaming para pipelines em tempo real
  • Git e boas práticas de engenharia de software aplicadas a dados (CI/CD for data, testes, code review)

Diferenciais que irão destacar você:

  • Experiência em iGaming, fintechs ou plataformas de alto volume transacional e eventos comportamentais
  • Experiência construíndo arquitetura de dados do zero — greenfield data platform
    Conhecimento de arquitetura Medallion (Bronze/Silver/Gold) ou Data Lakehouse (Delta Lake, Apache Iceberg)
  • Feature store e colaboração com times de ML/IA para pipelines de treinamento e inferência
  • Governância de dados: catálogo (DataHub, Amundsen, Collibra), data contracts e LGPD
  • Inglês avançado — documentação técnica, ferramentas e comunicação com fornecedores
Benefits

Vantagens para você:

Salário competitivo e plano de bônus
Plano de Saúde e Odontológico: para você e seus dependentes
Auxilio Mobilidade
Auxilio Alimentação através do iFood Benefícios
WellHub: para você e +3 dependentes
Starbem + Avus
Day off Aniversário

Estamos montando a operação de entretenimento digital que vai redefinir o mercado brasileiro.

Se faz sentido para você, faça sua candidatura!🚀