dbt: Snapshots y SCD2 | Curso dbt GCP

dbt: Snapshots y SCD2 (Viaje en el tiempo)

Autor: Eduardo Martínez Agrelo

En el mundo real, los datos cambian. Un pedido pasa de 'pendiente' a 'enviado'. Si solo guardamos el estado actual, perdemos la historia. Los Snapshots de dbt implementan dimensiones lentamente cambiantes de tipo 2 (SCD2).

Estrategia de Captura

Configuraremos dbt para que observe cambios en columnas específicas. Cuando dbt detecta una modificación, no borra el dato antiguo; lo "caduca" con una fecha de fin y crea una nueva fila con el dato actualizado.

Análisis Histórico

Gracias a los Snapshots, podemos responder preguntas críticas: ¿Cuánto tiempo pasó realmente este pedido en estado de preparación? Al tener el histórico completo con fechas de validez, el análisis de procesos de negocio se vuelve posible y preciso.

Conclusión: Memoria infinita

Tus dimensiones ahora tienen memoria. Has implementado una técnica avanzada de ingeniería de datos con una configuración mínima. Ahora, aprenderemos a manejar datos estáticos con Seeds.

Newsletter GCP
¿Quieres estar al día con las últimas novedades de Google Cloud Platform? ¡Suscríbete y no te pierdas nada!