Modelado de Datos Dimensional

modelado datos

Modelado de Datos Dimensional: Conceptos y Diseño

Los modelos dimensionales son estructuras desnormalizadas diseñadas para recuperar datos de un almacén de datos. Están optimizados para realizar la operación “Seleccionar” y se utilizan en el marco de diseño básico para construir almacenes de datos altamente optimizados y funcionales. 

Conceptos y Diseño del modelado dimensional

Un modelo dimensional es una técnica de estructura de datos optimizada para herramientas de almacenamiento de datos. Está diseñado para leer, resumir, analizar información numérica como valores, saldos, recuentos y pesos en un almacén de datos.

Estos modelos dimensionales tienen su forma única de almacenamiento de datos que tiene ventajas específicas. Fue desarrollado por Ralph Kimball y está compuesto por tablas de hechos y dimensiones.

Elementos de un modelo de datos dimensional

Hecho

Los hechos son las medidas, métricas o hechos de tu proceso comercial. Para un proceso comercial de ventas, una medición sería el número de ventas trimestral

Dimensión

La dimensión proporciona el contexto que rodea un evento de proceso de negocio. En términos simples, proporciona el quién, qué, dónde de un hecho. En el proceso comercial de ventas, para el número de ventas trimestral, las dimensiones serían

  • Quién: Nombres de clientes
  • Dónde: Ubicación
  • Qué: nombre del producto

Tabla de hechos

Una tabla de hechos es una tabla primaria en un modelo dimensional. Una tabla de hechos contiene:

  • Mediciones / hechos
  • Clave externa para tabla de dimensiones

Tabla de dimensiones

  • Una tabla de dimensiones contiene dimensiones de un hecho.
  • Se unen a la tabla de hechos mediante una clave externa.
  • Las tablas de dimensiones son tablas desnormalizadas.
  • Los atributos de dimensión son las diversas columnas de una tabla de dimensiones
  • Las dimensiones ofrecen características descriptivas de los hechos con la ayuda de sus atributos.
  • No se establece un límite establecido para el número de dimensiones
  • La dimensión también puede contener una o más relaciones jerárquicas.

Diseñar un modelo dimensional

La precisión en la creación de tu modelado dimensional determina el éxito de la implementación de tu almacén de datos. Estos son los pasos para crear un Modelo de dimensión eficaz capaz de describir el por qué, cuánto, cuándo, dónde, quién y qué de su proceso comercial.

  • Identificar procesos de negocios
  • Identificar grano (nivel de detalle)
  • Identificar dimensiones
  • Identificar hechos
  • Build Star

Identificación el proceso comercial

Esto es, identificar el proceso comercial real que debe abarcar un Data Warehouse. Esto podría ser Marketing, Ventas, Recursos Humanos, etc. según las necesidades de análisis de datos de la organización.

La selección del proceso de negocio también depende de la calidad de los datos disponibles para ese proceso.

Es el paso más importante del proceso de modelado de datos, y una falla aquí tendría defectos en cascada prácticamente irreparables. Para describir el proceso empresarial, puedes utilizar texto sin formato o utilizar la notación básica de modelado de procesos empresariales (BPMN) o el lenguaje de modelado unificado (UML).

Identifica el grano

El grano describe el nivel de detalle del problema. Es el proceso de identificar el nivel más bajo de información para cualquier tabla en tu almacén de datos. Si una tabla contiene datos de ventas de todos los días, debería ser una granularidad diaria.

Si una tabla contiene datos de ventas totales de cada mes, entonces tiene una granularidad mensual. Durante esta etapa, respondemos preguntas como: 

  • ¿Necesitamos almacenar todos los productos disponibles o solo algunos tipos de productos? Esta decisión se basa en los procesos comerciales seleccionados para Data Warehouse
  • ¿Almacenamos la información de venta del producto en forma mensual, semanal, diaria o por hora? Esta decisión depende de la naturaleza de los informes solicitados por los ejecutivos.
  • ¿Cómo afectan las dos opciones anteriores al tamaño de la base de datos?

Ejemplo de el grano: El CEO de una multinacional desea encontrar diariamente las ventas de productos específicos en diferentes ubicaciones. Entonces, el grano es información de venta de productos por ubicación por día.

Identifica las dimensiones

Las dimensiones son sustantivos como fecha, tienda, inventario, etc. Estas dimensiones es donde se deben almacenar todos los datos. Por ejemplo, la dimensión de fecha puede contener datos como un año, mes y día de la semana. Un ejemplo de dimensiones sería:

El CEO de una multinacional desea encontrar diariamente las ventas de productos específicos en diferentes ubicaciones.

  • Dimensiones: producto, ubicación y hora.
  • Atributos: Para Producto: Clave de producto (Clave externa), Nombre, Tipo, Especificaciones.
  • Jerarquías: para ubicación: país, estado, ciudad, dirección, nombre.

Identifica el hecho

Este paso está asociado con los usuarios comerciales del sistema porque aquí es donde obtienen acceso a los datos almacenados en el almacén de datos. La mayoría de las filas de la tabla de hechos son valores numéricos como precio o costo por unidad, etc. Un ejemplo de hechos seria: 

El CEO de una multinacional desea encontrar diariamente las ventas de productos específicos en diferentes ubicaciones.

  • El hecho aquí es Suma de ventas por producto por ubicación por tiempo.

Construir un esquema

En este paso, se implementará el modelo de dimensión. Un esquema no es más que la estructura de la base de datos (disposición de tablas) y hay dos esquemas populares.

Esquema de estrella

Se llama esquema de estrella porque el diagrama se asemeja a una estrella, con puntos que irradian desde un centro.

El centro de la estrella consiste en la tabla de hechos, y los puntos de la estrella son tablas de dimensiones. 

Esquema de copo de nieve

El esquema de copo de nieve es una extensión del esquema de estrella. En un esquema de copo de nieve, cada dimensión se normaliza y se conecta a más tablas de dimensiones.

Reglas para el modelado dimensional

Las siguientes son reglas básicas pero imprescindibles a la hora de crear tu modelado dimensional:

  • Cargue datos atómicos en estructuras dimensionales.
  • Construye modelos dimensionales en torno a los procesos empresariales.
  • Asegúrate de que cada tabla de hechos tenga una tabla de dimensión de fecha asociada.
  • Asegúrate de que todos los hechos en una sola tabla de hechos estén en el mismo grano o nivel de detalle.
  • Recuerda que es esencial almacenar etiquetas de informes y filtrar valores de dominio en tablas de dimensiones
  • Debes asegurarte de que las tablas de dimensiones utilicen una clave sustituta
  • Balancea continuamente los requisitos y las realidades para brindar una solución comercial que respalde su toma de decisiones