dbt: Snapshots y SCD2 (Viaje en el tiempo)
Autor: Eduardo Martínez Agrelo
En el mundo real, los datos cambian. Un pedido pasa de 'pendiente' a 'enviado'. Si solo guardamos el estado actual, perdemos la historia. Los Snapshots de dbt implementan dimensiones lentamente cambiantes de tipo 2 (SCD2).
Estrategia de Captura
Configuraremos dbt para que observe cambios en columnas específicas. Cuando dbt detecta una modificación, no borra el dato antiguo; lo "caduca" con una fecha de fin y crea una nueva fila con el dato actualizado.
Análisis Histórico
Gracias a los Snapshots, podemos responder preguntas críticas: ¿Cuánto tiempo pasó realmente este pedido en estado de preparación? Al tener el histórico completo con fechas de validez, el análisis de procesos de negocio se vuelve posible y preciso.
Conclusión: Memoria infinita
Tus dimensiones ahora tienen memoria. Has implementado una técnica avanzada de ingeniería de datos con una configuración mínima. Ahora, aprenderemos a manejar datos estáticos con Seeds.