Engenheiro(a) de Dados Pleno (GCP)

Barueri Hybrid

Engenheiro(a) de Dados Pleno (GCP)

Modalidade: Híbrido 2x - Alphaville - Barueri/SP

 

Profissional de dados para construir e manter um *Datalake no BigQuery (GCP), com ingestão a partir de banco (Oracle on-premises) e transformações ELT versionadas em Git. Atuará com autonomia nas frentes de *engenharia de dados, **governança* e *análise/visualização* e, ao mesmo tempo, aplicar técnicas de ciência de dados,  realizar análises exploratórias, desenvolvimento de modelos de machine learning e criação de dashboards.

Requirements

Habilidades Técnicas

SQL avançado* — funções de janela, deduplicação, DML no BigQuery
Python* — scripts de ingestão, automação de pipelines e análise de dados
BigQuery* — modelagem, machine learning, particionamento, clustering e otimização de custo
Google Cloud Platform* — navegação e operação básica do console e CLI (gcloud)
Git* — versionamento de código e transformações

Inglês avançado — leitura de documentação técnica

 

Experiência
Em projetos de dados com *BigQuery / GCP*
Experiência com *pipelines de ingestão batch* (qualquer stack)
Experiência com *transformações ELT/ETL* em camadas (raw → trusted → refined ou equivalente)
 

Diferencial

Dataform* (ou dbt) | Ferramenta central de transformação ELT — treinável em GCP 
Cloud Run* | Execução dos pipelines de ingestão incremental Python 
BigQuery Data Transfer Service* | Ingestão Full Load do Oracle 
Oracle / JDBC* | Fonte de dados principal (on-premises) 
Dataplex / Data Catalog* | Governança: linhagem e catalogação de metadados 
Policy Tags (BQ)* | Controle de acesso colunar PII/PCI 
Vertex AI Workbench* | Análises exploratórias e modelos de ML 
Looker / Looker Studio* | Visualização e dashboards analíticos 
LGPD* | Conformidade aplicada a pipelines de dados