data warehouse

25
CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN DATA WAREHOUSE S.C.

Upload: santy-cadena

Post on 12-Jun-2015

302 views

Category:

Technology


1 download

DESCRIPTION

ES UN AMBIENTE ESTRUCTURADO PARA ANALISIS DE DATOS NO VOLATILES ES UNA COLECCIÓN DE DATOS ORIENTADA A SUJETOS, INTEGRADA, VARIABLE EN EL TIEMPO Y NO VOLATIL, PARA SOPORTE DE PROCESOS DE TOMA DE DECISION DE LOS EJECUTIVOS.

TRANSCRIPT

Page 1: DATA WAREHOUSE

CERTIFICACIÓN EN SISTESMAS Y TECNOLOGIAS DE LA INFORMACIÓN

DATA WAREHOUSE

S.C.

Page 2: DATA WAREHOUSE

Es un ambiente estructurado para análisis de datos no volatiles

Es una colección de datos orientada a sujetos, integrada, variable en el tiempo y no volatil, para soporte de procesos de toma de decisión de los ejecutivos.

Page 3: DATA WAREHOUSE

Facilita la integración, para la toma de decisiones, de datos de aplicaciones operacionales no integrados.

Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.

Page 4: DATA WAREHOUSE

Bases de Datos Operacional Data Warehouse

Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Datos detallados Resumidos + más resumidos

Datos cambian continuamente Estable

El uso de DW se ha extendido debido a Hardware y software mas robustos y se esperaOrientación a la web.

Page 5: DATA WAREHOUSE
Page 6: DATA WAREHOUSE

META DATA

ALTAMENTERESUMIDO

LIGERAMENTERESUMIDO

DETALLEHISTORICODE DATOS

SISTEMAOPERACIONAL refrescamiento

DETALLE ACTUALDE DATOS

Page 7: DATA WAREHOUSE

Detalle de datos actuales: Datos que constan en los sistemas operacionales

Detalle de datos antiguos: La datos antigüos que se almacenan sobre

alguna forma de almacenamiento masivo. No son frecuentemente accesada

y se almacena a un nivel de ligeramente resumidos, consistente con los

datos detallados actuales del momento en que se obtuvieron.

Datos ligeramente resumidos: La data ligeramente resumida es aquella que

proviene desde un bajo nivel de detalle encontrado al nivel de detalle

actual.

Page 8: DATA WAREHOUSE

Datos completamente resumidos: Estos datos son compactos y fácilmente accesibles, resultan de resumir los datos ligeramente resumidos.

Meta data(datos de datos): juega un rol especial y muy importante contiene referencias y apuntadores tales como:

◦ Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.

◦ Una guía para el mapping de datos, de cómo se transforma desde el ambiente operacional hacia el ambiente de data warehouse.

◦ Una guía de los algoritmos usados para la esquematización entre el detalle de datos actual, con los datos ligeramente resumidos y éstos, con los datos completamente resumidos, etc.

Page 9: DATA WAREHOUSE

META DATASISTEMAOPERACIONAL

refrescamiento

Alto Nivel

Ninguno(libre)

Bajo Nivel

INDEXACIÓN

Page 10: DATA WAREHOUSE

META DATASISTEMAOPERACIONAL

refrescamiento

Relativamentefácil

No permitefácilmente

RESTRUTURACiÓN

Page 11: DATA WAREHOUSE

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

Page 12: DATA WAREHOUSE

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

Page 13: DATA WAREHOUSE

Ponga en un buscador de internet “imágenes Data Warehouse” y encontrará:

Page 14: DATA WAREHOUSE

compras

ventas

rrhh

produccion

Separados de los operacionales para evitar degradación del tiempo

No son modificables

Datos guardados porPeríodos más largos

Bajos costos de almacenamiento

Datos de sistemasOperacionales

Datos de DW

Page 15: DATA WAREHOUSE

Herramientas OLAP Herramientas OLAP (componente (componente clave del DW))

On Line Analitical Process (procesamiento analítico en línea)

Tecnología orientada al análisis de datos Permite el análisis de las diferentes

medidas correspondientes a las dimensiones relacionadas entre sí

DWDIMENSIONES (categoría descriptiva)

MEDIDAS ( valores cuantitativos)

Page 16: DATA WAREHOUSE

LOS MODELOS DE ALMACENAMIENTO DE DATOS QUE FACILITAN EL ANÁLISIS DIFIEREN DEPENDIENDO SI ESTÁN ACTUANDO EN UN AMBIENTE TRANSACCIONAL O EN UN DW

Modelos de datos en ambientes Transaccionales (Operacionales):•OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing)

ROLAP

(MOLAP)=OLAPmultidimensional HOLAP

Análisis de datosAnálisis de datos

Modelos de datos en ambientes de DW :OLAP procesamiento analítico en línea (On-Line Analytical Processing).

•ROLAP : Procesamiento analítico en línea sobre base de datos relacional •MOLAP : Procesamiento analítico en línea sobre base de datos multidimensional (OnLine Transaction Processing)

•HOLAP: Procesamiento analítico en línea híbrido MOLAP+ROLAP

OLTP

Page 17: DATA WAREHOUSE

Creados basados en las técnicas OLAP, para organizar los datos (ya se pueden considerar información) (cubos)

DW

Variable tiempoVariable productoVariable Ubicación geográfica

Page 18: DATA WAREHOUSE

Separados para evitar degradación en el tiempo

Compras DMT

VentasDMT

RrhhDMT

ProduccionDMT

EMPRESA

Una sola área o grupos, costoso y mayor esfuerzo

Riesgos: Proliferación no planificada, Inconsistencia en los datosPérdida de rendimiento por incremento del tamaño

DMT1 + DMT2 + DMT3 + …. DMTn = Reunión de información

Page 19: DATA WAREHOUSE

Compras DMT

VentasDMT

RrhhDMT

ProduccionDMT

EMPRESA

Una sola área o grupos, costoso y mayor esfuerzo

DMT1 + DMT2 + DMT3 + …. DMTn = DW

DataWarehouse

Page 20: DATA WAREHOUSE

Sybase IQ (DW+ business intelligence)

Sybase, Inc. (NYSE: SAP)

IBM Netezza DW appliance Netezza Inc (IBM)

HP Enterprise DW Solutions para MsSql Server

Hewlett-Packard Co.

SAP Business Objects data Service Software

Business Objects, SAP (comprado 2007)

Oracle ( a partir de la versión 11g)

ORACLE

Page 21: DATA WAREHOUSE

DATA MINING (minería de DATA MINING (minería de datos)datos)

Page 22: DATA WAREHOUSE

ES LA EXTRACCIÓN DE INFORMACIÓN OCULTA DE GRANDES BASES DE DATOS

Herramienta que ayuda a predecir futuras tendencias y comportamientos

DATA MINING (minería de DATA MINING (minería de datos)datos)

Page 23: DATA WAREHOUSE

Predicción automatizada de tendencias y comportamientos

Descubrimientos automatizados de modelos previamente desconocidos

Aplica técnicas tales como: redes neuronales artificiales, árboles de decisión, algoritmos genéticos, método vecino más cercano, regla de inducción.

Page 24: DATA WAREHOUSE

FundamentosSoportado por tecnologías

1. Recolección masiva de datos2. Computadores potentes con

multiprocesador3. Algoritmos Data Mining

Page 25: DATA WAREHOUSE

DW

Data mining

Sistema x

Sistema y

Aplicación n

Aplicación 2

Aplicación 1

informació

n