dbt: Seeds y Hooks | Curso dbt GCP

dbt: Seeds y Hooks (Datos Estáticos y Automatización)

Autor: Eduardo Martínez Agrelo

No todos los datos vienen de una base de datos transaccional. A veces tenemos mapeos de países o listas de objetivos en archivos CSV. dbt maneja esto mediante los Seeds.

dbt Seeds

Al colocar un archivo CSV en la carpeta seeds/, dbt lo carga directamente en BigQuery como una tabla. Esto es ideal para datos de referencia que cambian poco y que queremos tener bajo control de versiones en GitHub.

Pre y Post Hooks

¿Necesitas dar permisos de lectura a un grupo después de crear una tabla? ¿O insertar un registro en un log antes de empezar? Los Hooks nos permiten ejecutar sentencias SQL personalizadas en momentos clave del ciclo de vida de dbt (on-run-start u on-run-end).

Conclusión: Control Total

Has integrado datos manuales y automatizado permisos. Tu pipeline es cada vez más autónomo. Solo nos queda el paso final: optimización incremental y automatización con CI/CD.

Newsletter GCP
¿Quieres estar al día con las últimas novedades de Google Cloud Platform? ¡Suscríbete y no te pierdas nada!