![Page 1: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/1.jpg)
Modelado de datos
![Page 2: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/2.jpg)
La pregunta central
¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los requerimientos de los usuarios?
![Page 3: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/3.jpg)
¿Por qué es importante?
• Visualización del universo del negocio
• Modelo de abstracción de las “preguntas” que los usuarios necesitan responder
• Diseño del plan de implantación del Data Warehouse
![Page 4: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/4.jpg)
Dos técnicas
Modelo E-R
– Entidades
– Atributos
– Relaciones
Modelo dimensional
– Hechos
– Dimensiones
– Medidas
![Page 5: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/5.jpg)
Modelo E-R
![Page 6: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/6.jpg)
Modelo dimensional: HECHOS
• Hechos : colección de items de datos y datos de contexto. Cada hecho representa un item de negocio, una transacción o un evento
• Los hechos se registran en las tablas CENTRALES del DW
![Page 7: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/7.jpg)
Modelo dimensional: DIMENSION
• Una dimensión es una colección de miembros o unidades o individuos del mismo tipo
• Cada punto de entrada de la tabla de HECHOS está conectado a una DIMENSION
• Determinan el contexto de los HECHOS
![Page 8: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/8.jpg)
Modelo dimensional: DIMENSIONES
• Se utilizan como parámetros para los análisis OLAP
• Dimensiones habituales son:– Tiempo– Geografía– Cliente– Vendedor
![Page 9: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/9.jpg)
Modelo dimensional:DIMENSIONES - Miembros
Dimensión MiembroTiempo Meses, Trimestre, AñosGeografía País, Región, CiudadCliente Id ClienteVendedor Id Vendedor
![Page 10: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/10.jpg)
Modelo dimensionalDIMENSIONES - Jerarquía
![Page 11: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/11.jpg)
Modelo dimensionalDIMENSIONES : Medidas
• Medida : es un atributo numérico de un hecho que representa la performance o comportamiento del negocio relativo a la dimensión
• Ejemplos:– Ventas en $$– Cantidad de productos– Total de transacciones, etc.
![Page 12: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/12.jpg)
Visualización de un modelo dimensional
![Page 13: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/13.jpg)
DW - OLAP
El modelo dimensional es ideal para soportar las 4 operaciones básicas de la tecnología OLAP:
– Relacionadas con la granularidad: ROLL UP - DRILL DOWN
– Navegación por las dimensiones : SLICE - DICE
![Page 14: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/14.jpg)
Drill Down - Roll Up
![Page 15: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/15.jpg)
Slice and Dice
![Page 16: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/16.jpg)
Modelos básicos dimensionales
STAR SNOWFLAKE
![Page 17: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/17.jpg)
Star
![Page 18: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/18.jpg)
SnowFlake
![Page 19: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/19.jpg)
E-R - Modelo dimensional
• El modelo dimensional puede verse como un caso particular del modelo de ER
• Foreing keys Dimension
• Hecho Entidad
![Page 20: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/20.jpg)
Datawarehousing process
![Page 21: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/21.jpg)
Manage the Project
• Es un proceso cíclico e iterativo
• Refiere al manejo del PROYECTO, no al manejo del Warehouse (ONGOING)
![Page 22: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/22.jpg)
Define the project
• ¿Qué se necesita analizar y por qué?¿Cuál es el alcance del proyecto?
• El contexto de definición y los alcances del proyecto DEBEN permitir FLEXIBILIDAD. NO deben ser demasiado específicos.
![Page 23: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/23.jpg)
Requirements gathering
• Quién (personas, grupos, usuarios, etc)• Qué (se quiere analizar)• Por qué• Cuándo (factores de oportunidad en el tiempo)• Dónde (factores geográficos) • Cómo definir las medidas
![Page 24: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/24.jpg)
Source driven
• Los requerimientos se definen utilizando las fuentes de datos operacionales.
• La mayor ventaja es que de antemano se conoce que todos los datos podrán ser provistos ya que se sabe qué está disponible
![Page 25: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/25.jpg)
Source driven
• Se minimiza el tiempo de interacción con los usuarios en las primeras etapas (se gana velocidad).
• El riesgo es producir un conjunto incorrecto de requerimientos por la poca participación del usuario
• El usuario recibe “lo que tenemos”
![Page 26: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/26.jpg)
User driven
• Los requerimientos se definen a partir de las necesidades del usuario.
• Conduce a proyectos más acotados pero probablemente más útiles
• Tiene como desventaja que al no limitarse el pedido del usuario pueden solicitarse objetivos imposibles
![Page 27: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/27.jpg)
Relevamiento:Source driven vs User driven
![Page 28: Modelado de datos. La pregunta central ¿De qué modo deben diseñarse las bases de datos que conforman un Data Warehouse para soportar eficientemente los](https://reader035.vdocuments.mx/reader035/viewer/2022062519/5665b47d1a28abb57c91e90e/html5/thumbnails/28.jpg)
Source driven - User driven
• Data Mart : User driven
• Global Data Warehouse : Source driven para partir el proyecto en áreas temáticas. Luego para cada área se utiliza un enfoque User driven