data warehouse

19
DATA WAREHOUSE Presentador Por: Andrés Fabián Cortes Solano

Upload: malupahu

Post on 12-Jun-2015

5.252 views

Category:

Documents


0 download

DESCRIPTION

Data warehouse

TRANSCRIPT

Page 1: Data warehouse

DATA WAREHOUSE

Presentador Por:Andrés Fabián Cortes Solano

Page 2: Data warehouse

TEMARIO

1. ¿Qué es Data Warehouse?

2. Conceptos básicos:

a. Características

b. Aplicaciones

c. Alternativas de Diseño

d. Herramientas Utilizadas

e. Datamining

f. Base de Datos Multidimensional

g. Metadatos

h. Procesos de Construcción

i. Técnicas Explotación

Page 3: Data warehouse

Data Warehouse

Es un repositorio estructurado, a nivel Empresa, de datos orientados hacia áreas de negocio, que contiene datos históricos y que está preparado para facilitar la toma de decisiones.

Page 4: Data warehouse

Diferencias

Base de Datos Operacional Data Warehouse

Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Detallada Detallada + más resumida

Cambia continuamente Estable

Page 5: Data warehouse

Entre las principales se tiene:· Orientado al tema· Integrado· Variante en el Tiempo· No volátil

Características

Page 6: Data warehouse

Orientado al Tema

Una primera característica del data warehouse es que la información se clasifica en base a los aspectos que son de interés para la empresa.

Ejemplo: Para un fabricante pueden ser cliente, vendedor y producto.

Page 7: Data warehouse

Integrado

La base de datos contiene los datos de todos los sistemas operacionales de la organización, y dichos datos deben ser consistentes.

Page 8: Data warehouse

Variante en el Tiempo

Como la información en el data warehouse es solicitada en cualquier momento (es decir, no "ahora mismo"), los datos encontrados en el depósito se llaman “variante en el tiempo".

Page 9: Data warehouse

No volátil

La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura, y se mantiene para futuras consultas.

Page 10: Data warehouse

Aplicaciones

- Sistemas de Marketing- Análisis de Riesgo Financiero- Análisis de Riesgo de Crédito- Control de Gestión- Logística- Recursos Humanos

Page 11: Data warehouse

Alternativas de Diseño

1. Creación de varios Datamarts independientes, uno por cada dominio o fuente de información, y definición de una Capa Usuario por cada uno de estos Datamarts.2. Creación de un único Datawarehouse que englobe todos los datos, del que se extraigan diferentes Datamarts, uno por cada dominio o fuente de información y definición de una Capa Usuario por cada Datamart.3. Creación de un único Datawarehouse con definición de una única Capa Usuario.4. Creación de un único Datawarehouse con definición de varias Capas Usuario.

Page 12: Data warehouse

Herramientas Utilizadas

- Herramientas para la inteligencia empresarial.- Herramientas para extraer, transformar y cargar datos en el almacén de datos.- Herramientas para gestionar y recuperar los metadatos.

Page 13: Data warehouse

Datamining (Minería de Datos)

Es el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Hace uso de prácticas estadísticas y, en algunos casos, de algoritmos de búsqueda próximos a la Inteligencia Artificial y a las redes neuronales.

Page 14: Data warehouse

Base de Datos Multidimensionales

Se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma:

(d1,d2,d3,...,f1,f2,f3,...)Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las métricas o hechos que se quiere almacenar, estudiar o analizar.

Page 15: Data warehouse

Metadatos

Uno de los componentes más importantes de la arquitectura de un almacén de datos son los metadatos. Se define comúnmente como "datos acerca de los datos", en el sentido de que se trata de datos que describen cuál es la estructura de los datos que se van a almacenar y cómo se relacionan.El Metadato documenta, entre otras cosas, qué tablas existen en una base de datos, qué columnas posee cada una de las tablas y qué tipo de datos se pueden almacenar.

Page 16: Data warehouse

Procesos de Construcción

ETL (Extracción, Transformación y Carga).

Extracción: Obtención de información de las distintas fuentes tanto internas como externas.

Transformación: Filtrado, limpieza, depuración, homogeneización y agrupación de la información.

Carga: Organización y actualización de los datos y los metadatos en la base de datos.

Page 17: Data warehouse

Técnicas de Explotación

La explotación del Data Warehouse mediante información de gestión, se fundamenta básicamente en los niveles agrupados o calculados de información.

Carga de Base de datos

Extracción, Depuración, Filtro, Elaboración

Page 18: Data warehouse

Glosario

• Data Warehouse: Es un repositorio estructurado, a nivel Empresa, de datos orientados hacia áreas de negocio, que contiene datos históricos y que está preparado para facilitar la toma de decisiones.• Datamart: Es una base de datos orientada a un tema específico. En otras palabras es un subconjunto del Data Warehouse Corporativo.• Capa Usuario: Es una vista usuario de la base de datos que permite su aislamiento respecto de la complejidad física de la misma. No incluye ningún dato físico. Es una agrupación lógica de los datos adaptada a los conocimientos y filosofía del Usuario• OLAP: Tecnología que permite la explotación de datos en diferentes niveles organizacionales y periodos de tiempo.

Page 19: Data warehouse

GRACIAS POR SU ATENCION