jueves, 3 de mayo de 2018

3.3 Bodega de datos


Diseño de una Bodega de Datos
Hay tres arquitecturas en el diseño de sistemas de bodega de datos:
Esquema de estrella: En este diseño del almacén de datos la tabla de Variables (Hechos) esta rodeada por Dimensiones y juntos forman una estructura que permite implementar mecanismos básicos para poder utilizarla con una herramienta de consultas OLAP. Se implementa un diseño lógico relacional de base da datos que resulta en que las tablas de hechos representan la Tercera Forma Normal (3FN) y las dimensiones representan la Segunda Forma Normal (2FN).
Lo característico de la arquitectura de estrella es que sólo existe una tabla de dimensiones para cada dimensión y esta tabla representa la segunda forma normal.
Un ejemplo del esquema de estrella:


Esquema estrella


Esquema en copos de nieve: Esquema en copo de nieve (bola de nieve) es una variedad más compleja del esquema estrella. El afinamiento está orientado a facilitar mantenimiento de dimensiones.
Lo que distingue a la arquitectura en copo de nieve del esquema estrella, es que las tablas de dimensiones en este modelo representan relaciones normalizadas (3NF) y forman parte de un modelo relacional de base de datos.
El problema es que, para extraer datos de las tablas en esquema de copo de nieve, a veces hay que vincular muchas tablas en las sentencias SQL que puede llegar a ser muy complejo y difícil para mantener.
Un ejemplo del esquema en copos de nieve:

Esquema copo de nieve

 Esquema de constelación de hechos: Este esquema es más complejo que las otras arquitecturas debido a que contiene múltiples tablas de hechos. Con esta solución las tablas de dimensiones pueden estar compartidas entre más de una tabla.
Este tiene mucha flexibilidad, y este factor es su grande virtud. Sin embargo, el problema es que cuando el número de las tablas vinculadas aumenta, la arquitectura puede llegar a ser muy compleja y difícil para mantener.
Un ejemplo del esquema de constelación de hechos:


Implementación
La implantación de un Data Warehouse lleva implícitos los siguientes pasos:
         Extracción de los datos del sistema operacional y transformación de los mismos.
       Carga de los datos validados en el Data Warehouse. Esta carga deberá ser planificada con una periodicidad que se adaptará a las necesidades de refresco detectadas durante las fases de diseño del nuevo sistema.
       Explotación del Data Warehouse mediante diversas técnicas dependiendo del tipo de aplicación que se dé a los datos:
·       Query & Reporting
·       On-line analytical processing (OLAP)
·       Executive Information System (EIS) ó Información de gestión
·       Decision Support Systems (DSS)
·       Visualización de la información
·       Data Mining ó Minería de Datos, etc.
La información necesaria para mantener el control sobre los datos se almacena en los metadatos técnicos (cuando describen las características físicas de los datos) y de negocio (cuando describen cómo se usan esos datos). Dichos metadatos deberán ser accesibles por los usuarios finales que permitirán en todo momento tanto al usuario, como al administrador que deberá además tener la facultad de modificarlos según varíen las necesidades de información.
Con la finalización de esta fase se obtendrá un Data Warehouse disponible para su uso por parte de los usuarios finales y el departamento de informática.
Bibliografía

No hay comentarios:

Publicar un comentario