Diseño de una Bodega de Datos
Hay
tres arquitecturas en el diseño de sistemas de bodega de datos:
Esquema
de estrella: En este diseño del almacén de datos la tabla de Variables (Hechos)
esta rodeada por Dimensiones y juntos forman una estructura que permite
implementar mecanismos básicos para poder utilizarla con una herramienta de
consultas OLAP. Se implementa un diseño lógico relacional de base da datos que
resulta en que las tablas de hechos representan la Tercera Forma Normal (3FN) y
las dimensiones representan la Segunda Forma Normal (2FN).
Lo
característico de la arquitectura de estrella es que sólo existe una tabla de
dimensiones para cada dimensión y esta tabla representa la segunda forma
normal.
Un
ejemplo del esquema de estrella:
Esquema
estrella
Esquema
en copos de nieve: Esquema en copo de nieve (bola de nieve) es una variedad más
compleja del esquema estrella. El afinamiento está orientado a facilitar
mantenimiento de dimensiones.
Lo que
distingue a la arquitectura en copo de nieve del esquema estrella, es que las
tablas de dimensiones en este modelo representan relaciones normalizadas (3NF)
y forman parte de un modelo relacional de base de datos.
El
problema es que, para extraer datos de las tablas en esquema de copo de nieve,
a veces hay que vincular muchas tablas en las sentencias SQL que puede llegar a
ser muy complejo y difícil para mantener.
Un
ejemplo del esquema en copos de nieve:
Esquema
copo de nieve
Esquema de constelación de hechos: Este
esquema es más complejo que las otras arquitecturas debido a que contiene
múltiples tablas de hechos. Con esta solución las tablas de dimensiones pueden
estar compartidas entre más de una tabla.
Este
tiene mucha flexibilidad, y este factor es su grande virtud. Sin embargo, el
problema es que cuando el número de las tablas vinculadas aumenta, la
arquitectura puede llegar a ser muy compleja y difícil para mantener.
Un
ejemplo del esquema de constelación de hechos:
Implementación
La
implantación de un Data Warehouse lleva implícitos los siguientes pasos:
Extracción de los datos del sistema
operacional y transformación de los mismos.
Carga de los datos validados en el Data
Warehouse. Esta carga deberá ser planificada con una periodicidad que se
adaptará a las necesidades de refresco detectadas durante las fases de diseño
del nuevo sistema.
Explotación del Data Warehouse mediante
diversas técnicas dependiendo del tipo de aplicación que se dé a los datos:
· Query
& Reporting
·
On-line
analytical processing (OLAP)
·
Executive
Information System (EIS) ó Información de gestión
·
Decision
Support Systems (DSS)
· Visualización
de la información
· Data
Mining ó Minería de Datos, etc.
La
información necesaria para mantener el control sobre los datos se almacena en
los metadatos técnicos (cuando describen las características físicas de los
datos) y de negocio (cuando describen cómo se usan esos datos). Dichos
metadatos deberán ser accesibles por los usuarios finales que permitirán en todo
momento tanto al usuario, como al administrador que deberá además tener la
facultad de modificarlos según varíen las necesidades de información.
Con la
finalización de esta fase se obtendrá un Data Warehouse disponible para su uso
por parte de los usuarios finales y el departamento de informática.
Bibliografía