Engenheiro(a) de Dados Pleno (GCP)
Modalidade: Híbrido 2x - Alphaville - Barueri/SP
Profissional de dados para construir e manter um *Datalake no BigQuery (GCP), com ingestão a partir de banco (Oracle on-premises) e transformações ELT versionadas em Git. Atuará com autonomia nas frentes de *engenharia de dados, **governança* e *análise/visualização* e, ao mesmo tempo, aplicar técnicas de ciência de dados, realizar análises exploratórias, desenvolvimento de modelos de machine learning e criação de dashboards.
Habilidades Técnicas
SQL avançado* — funções de janela, deduplicação, DML no BigQuery
Python* — scripts de ingestão, automação de pipelines e análise de dados
BigQuery* — modelagem, machine learning, particionamento, clustering e otimização de custo
Google Cloud Platform* — navegação e operação básica do console e CLI (gcloud)
Git* — versionamento de código e transformações
Inglês avançado — leitura de documentação técnica
Experiência
Em projetos de dados com *BigQuery / GCP*
Experiência com *pipelines de ingestão batch* (qualquer stack)
Experiência com *transformações ELT/ETL* em camadas (raw → trusted → refined ou equivalente)
Diferencial
Dataform* (ou dbt) | Ferramenta central de transformação ELT — treinável em GCP
Cloud Run* | Execução dos pipelines de ingestão incremental Python
BigQuery Data Transfer Service* | Ingestão Full Load do Oracle
Oracle / JDBC* | Fonte de dados principal (on-premises)
Dataplex / Data Catalog* | Governança: linhagem e catalogação de metadados
Policy Tags (BQ)* | Controle de acesso colunar PII/PCI
Vertex AI Workbench* | Análises exploratórias e modelos de ML
Looker / Looker Studio* | Visualização e dashboards analíticos
LGPD* | Conformidade aplicada a pipelines de dados