dbt: Testing y Documentación (Confianza en el Dato)
Autor: Eduardo Martínez Agrelo
Un ingeniero de datos profesional no solo entrega código, entrega confianza. dbt transforma la calidad del dato en una parte integral del ciclo de desarrollo mediante tests automáticos y documentación autogenerada.
Tests Genéricos
Mediante archivos YAML, podemos aplicar reglas de integridad sin escribir una sola línea de SQL complejo:
- Unique: Asegura que no haya registros duplicados.
- Not Null: Garantiza que campos críticos como IDs siempre tengan valor.
- Accepted Values: Valida que una columna solo contenga valores permitidos (ej. 'completado', 'pendiente').
Documentación Interactiva
Con el comando dbt docs generate, dbt analiza tu proyecto y crea un catálogo de datos web. En este
laboratorio verás cómo documentar descripciones de columnas y visualizar el linaje de datos para entender
exactamente de dónde viene cada métrica.
Conclusión: Calidad por diseño
Has pasado de "esperar que los datos estén bien" a "garantizar que los datos están bien". El siguiente paso es optimizar nuestro código usando Macros para no repetir lógica SQL.