dbt: Seeds y Hooks (Datos Estáticos y Automatización)
Autor: Eduardo Martínez Agrelo
No todos los datos vienen de una base de datos transaccional. A veces tenemos mapeos de países o listas de objetivos en archivos CSV. dbt maneja esto mediante los Seeds.
dbt Seeds
Al colocar un archivo CSV en la carpeta seeds/, dbt lo carga directamente en BigQuery como una
tabla. Esto es ideal para datos de referencia que cambian poco y que queremos tener bajo control de versiones en
GitHub.
Pre y Post Hooks
¿Necesitas dar permisos de lectura a un grupo después de crear una tabla? ¿O insertar un registro en un log antes de empezar? Los Hooks nos permiten ejecutar sentencias SQL personalizadas en momentos clave del ciclo de vida de dbt (on-run-start u on-run-end).
Conclusión: Control Total
Has integrado datos manuales y automatizado permisos. Tu pipeline es cada vez más autónomo. Solo nos queda el paso final: optimización incremental y automatización con CI/CD.