bodegas de datos (1).pptx

47
BODEGAS DE DATOS «DATA WAREHOUSE» JAIME ANDRES RIVERA JUAN CAMILO FRANCO JOSE LUIS GUEVARA HECTOR FABIO OCAMPO

Upload: jaime-rivera

Post on 07-Dec-2015

265 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: BODEGAS DE DATOS (1).pptx

BODEGAS DE DATOS «DATA WAREHOUSE»

JAIME ANDRES RIVERAJUAN CAMILO FRANCOJOSE LUIS GUEVARA

HECTOR FABIO OCAMPO

Page 2: BODEGAS DE DATOS (1).pptx

CONTENIDO

1. Introducción 2. Definición 3. Historia 4. Funciones de una bodega de datos 5. Modelo 6. Usos habituales 7. Aplicaciones existentes 8. Conclusiones 9. Bibliografía

Page 3: BODEGAS DE DATOS (1).pptx

INTRODUCCION

En la siguiente presentación se expondrán temas relacionados con la data warehouse; su historia, las funciones, su manejo, aplicaciones para el manejo de estas, modelos que se implementan y los usos habituales que se le dan a una data warehouse etc.

Page 4: BODEGAS DE DATOS (1).pptx

Diferencias

Base de Datos Operacional Data Warehouse

Datos Operacionales Datos del negocio para Información

Orientado a la aplicación Orientado al sujeto

Actual Actual + histórico

Detallada Detallada + más resumida

Cambia continuamente Estable

Page 5: BODEGAS DE DATOS (1).pptx

DEFINICIONES SOBRE CONCEPTOS DATA WAREHOUSE

Page 6: BODEGAS DE DATOS (1).pptx

Una bodega de datos es una herramienta utilizada por las organizaciones y empresas como una solución informática que consolida los datos de fuentes internas y externas de una entidad, institución o negocio, en un solo sitio, con el objetivo de facilitar las tareas de consulta y análisis de la información.[1]

Page 7: BODEGAS DE DATOS (1).pptx

DATA WAREHOUSE

Page 8: BODEGAS DE DATOS (1).pptx

“Es un conjunto de datos integrados o orientados a un objetivo específico, que varían con el tiempo (datos históricos) y que no son transitorios.

Soportan el proceso de toma de decisiones de la administración y está orientada al manejo de grandes volúmenes de datos provenientes de diversas fuentes o diversos tipos” [3]

Page 9: BODEGAS DE DATOS (1).pptx

Entendemos por Data Warehousing el proceso de extraer y filtrar datos de las operaciones comunes de la organización, procedentes de los distintos sistemas de información operacionales y/o sistemas externos, para transformarlos, integrarlos y almacenarlos en un depósito o almacén de datos (Data Warehouse, en inglés) con el fin de acceder a ellos para dar soporte en el proceso de toma de decisiones de una organización.[1]

Page 10: BODEGAS DE DATOS (1).pptx

DATA WAREHOUSING

Page 11: BODEGAS DE DATOS (1).pptx

DATAMART

Page 12: BODEGAS DE DATOS (1).pptx

Es un subconjunto de datos de una Data Warehouse para un área específica. En un Data Warehouse se tiene la información concentrada de una empresa y de todos los departamentos. Los Data Mart nos permiten hacer una separación de los datos para funciones específicas, usuarios específicos y áreas específicas.[2]

Page 13: BODEGAS DE DATOS (1).pptx

ETL

Sus siglas en inglés significan Extract Transform Load. Extract es el proceso de extraer la información que puede venir de diferentes fuentes de datos o bases de datos de distintos proveedores.[2]

Page 14: BODEGAS DE DATOS (1).pptx

HISTORIA

Page 15: BODEGAS DE DATOS (1).pptx

Con la evolución de los sistemas, las empresas se quedaban cortas al momento de realizar consultas del negocio, en ocasiones se consultaban registros del mes para no afectar su rendimiento de estos fallos nacieron las bodegas de datos.

Las Bodegas de datos hicieron su aparición en la década de los 80 en una pequeña empresa llamada TERADATA que fue la empresa pionera en el concepto de maquinas paralelas. [6]

Page 16: BODEGAS DE DATOS (1).pptx

Posteriormente varios fabricantes siguieron con este esquema de sistemas multiprocesadores, con diferentes arquitecturas, con precios cómodos. Se enfocaron en reducir los tiempos de respuesta en una solución de hardware y vieron que lo importante de un sistema es el SOFTWARE Después de rigurosas pruebas, a mediados de los noventa algunas empresas aplicaron Data Warehouse no siendo tan exitosos los resultados, debido a que la forma de programar en principio era enfocado a programación transaccional. [6]

Page 17: BODEGAS DE DATOS (1).pptx

La persona que cambio el concepto de Data Warehouse en el año de 1992, BILL INMON (considerado el padre del data warehousing) .En donde centro todo hacia el procedimiento del Diseño y formalizo las características que debería tener un sistema de este estilo.[6]

Page 18: BODEGAS DE DATOS (1).pptx

¿Cómo funcionaban?

EN LA PARTE DE HARDWARE :

Era un sistema dedicado, se basaba en la interconexión entre SERVIDORES y cada uno tenía su propia memoria RAM y DISCO DURO utilizando el bus (YNET). Tenía como particularidad que un nodo seria jerárquicamente mayor que otros, utilizando la interconexión en árbol binario.

Page 19: BODEGAS DE DATOS (1).pptx

EN LA PARTE DE SOFTWARE:

Cada servidor cumplía con una tarea en específico, ejemplo: un nodo se encargaba derealizar un SELECT, otro de un JOIN, otro de un COUNT hasta terminar una consulta y distribuyendo la carga en diferentes nodos.

Page 20: BODEGAS DE DATOS (1).pptx

FUNCIONES DE UNA DATA WAREHOUSE

Page 21: BODEGAS DE DATOS (1).pptx

 Entrega de información validada, correcta y oportuna.

Dar respuestas a necesidades del usuario a través de las herramientas DSS, EIS, TCR. Usuario final no afecta las operaciones del sistema.[7]

Page 22: BODEGAS DE DATOS (1).pptx

MODELO DE DATOS DE UNA BODEGA DE DATOS

Page 23: BODEGAS DE DATOS (1).pptx

Una hoja de cálculo estándar constituye una matriz bidimensional.

Si añadimos una dimensión temporal tendríamos una matriz tridimensional.

Page 24: BODEGAS DE DATOS (1).pptx

Las herramientas de explotación OLAP de los almacenes de datos han adoptado un modelo multidimensional de datos.

Page 25: BODEGAS DE DATOS (1).pptx
Page 26: BODEGAS DE DATOS (1).pptx

Los modelos multidimensionales se prestan fácilmente a

representaciones jerárquicas en lo que se conoce como

exploración ascendente (roll-up ) y exploración descendente

(drill- down).

La exploración ascendente desplaza la jerarquía hacia

arriba, agrupándola en unidades mayores a través de una

dimensión. Por ejemplo: resumiendo los datos semanales en trimestrales o en anuales.

La exploración descendente ofrece la función contraria (de

grano más fino). Por ejemplo: disgregando las ventas

nacionales en ventas por regiones y después éstas en ventas

por subregiones.

Page 27: BODEGAS DE DATOS (1).pptx

El diseño multidimensional es un método de diseño de bases de datos basado en el modelo relacional.

Está compuesto por dos tipos de tablas:

-Varias tablas de dimensiones, cada una formada por tuplas de atributos de la dimensión.

-Una tabla de hechos, compuesta por tuplas, una por cada hecho registrado. Este hecho contiene alguna variable o variables medidas u observadas y las identifica con punteros a las tablas de dimensiones.

Page 28: BODEGAS DE DATOS (1).pptx

El esquema relacional esta compuesto por

1 tabla de hechos y M tablas de dimensiones :

Relación 1 : M.

La tabla de hechos contiene los datos, las dimensiones identifican cada tupla en esos datos.

Page 29: BODEGAS DE DATOS (1).pptx

Tres son los esquemas multidimensionales comunes:

Esquema en estrella: formado por una tabla de hechos con una única tabla para cada dimensión.

Page 30: BODEGAS DE DATOS (1).pptx

Esquema en copos: es una variante del esquema de estrella en el que las tablas dimensionales de este último se organizan

jerárquicamente mediante su normalización.

Page 31: BODEGAS DE DATOS (1).pptx

Constelación de hechos: es un conjunto de tablas de hechos que comparten algunas tablas de dimensiones.

Page 32: BODEGAS DE DATOS (1).pptx

USOS HABITUALES DE LAS BODEGAS DE DATOS

Page 33: BODEGAS DE DATOS (1).pptx

Uso deBase de Datos Operacionales

Uso deData Warehouse

Muchos usuarios concurrentes

Pocos usuarios concurrentes

Consultas predefinidas y actualizables

Consultas complejas, frecuentementeno anticipadas.

Cantidades pequeñas de datos detallados

Cantidades grandes de datos detallados

Requerimientos de respuesta inmediata

Requerimientos de respuesta no críticos

Page 34: BODEGAS DE DATOS (1).pptx
Page 35: BODEGAS DE DATOS (1).pptx

Sólo pocos usuarios acceden a los datos concurrentemente

En contraste a la producción de sistemas que pueden manejar cientos o miles de usuarios concurrentes, al data warehouse accesa un limitado conjunto de usuarios en cualquier tiempo determinado.

Page 36: BODEGAS DE DATOS (1).pptx

Los usuarios generan un procesamiento no predecible complejo

Los usuarios del data warehouse generan consultas complejas. A veces la respuesta a una consulta conduce a la formulación de otras preguntas más detalladas, en un proceso llamado drilling down.

Page 37: BODEGAS DE DATOS (1).pptx

Las consultas de los usuarios accesan a cantidades grandes de datos

Debido a la necesidad de investigar tendencias y evaluar las relaciones entre muchas clases de datos, las consultas al data warehouse permiten accesar a volúmenes muy grandes tanto de data detallada como resumida. 

Page 38: BODEGAS DE DATOS (1).pptx

Las consultas de los usuarios no tienen tiempos de respuesta críticos

Las transacciones operacionales necesitan una respuesta inmediata porque un cliente puede estar esperando una respuesta.[8]

Page 39: BODEGAS DE DATOS (1).pptx

APLICACIONES PARA UNA DATA WAREHOUSE

Page 40: BODEGAS DE DATOS (1).pptx

La información estratégica sobre clientes importantes o un exitoso lanzamiento de producto, se almacena en gigabytes de datos de marketing o índice de transacciones de venta. Esa información debe ser extraída de alguna forma para la toma de decisiones.En este caso se necesita software especializado que permita capturar los datos relevantes en forma rápida y pueda verse a través de diferentes dimensiones de los datos. El software no debería limitarse únicamente al acceso a los datos, si no también, al análisis significativo de los datos. En efecto, transformar los datos de la información cruda o no procesada, en información útil para la empresa.[8]

Page 41: BODEGAS DE DATOS (1).pptx

HERRAMIENTAS DE CONSULTA Y REPORTE

Crystal Reports de Seagate, Impromptu de Cognos, Reportsmith de Borland, Intelligent Query de IQ Software, Esperant de Software AG y GQL de Andyne, ofrecen interfases gráficas para seleccionar, arrastrar y pegar.

Page 42: BODEGAS DE DATOS (1).pptx

HERRAMIENTAS DE BASE DE DATOS MULTIDIMENSIONALES / OLAP

(OnLine Analytical Processing). Permiten obtener información generando consultas multidimensionales, con columnas y filas móviles y diversos grados de agrupamiento para diferentes parámetros.

Tipos de servidores OLAP

[9]

MOLAP: Multimensionales OLAP.

ROLAP: Relational OLAP. HOLAP: Híbrido OLAP.

Arreglos multidimensionales.No escalan a grandes volúmenes.No hay estándar.Muy eficiente.Realmente guarda el cubo de decisión.Interfaz estilo hoja de cálculo.Principalmente operaciones de agregación de medidas diferentes.Niveles jerárquicos de las dimensiones.Subir o bajar en los niveles de agregación (Rollup,DrillDown).Otras operaciones comunes: Filtrar y rotar. Slice and Dice.

Relaciones.Consultas SQLEscalan bien a grandes volúmenesSon menos eficientes.

Datos agregados. MOLAPDatos detallados. ROLAP

Page 43: BODEGAS DE DATOS (1).pptx

HERRAMIENTAS DATA MINING

Data mining es una categoría de herramientas de análisis open-end. En lugar de hacer preguntas, se toma estas herramientas y se pregunta algo "interesante", una tendencia o una agrupación peculiar, por ejemplo. El proceso de data mining extrae los conocimientos guardados o información predictiva desde el data warehouse sin requerir pedidos o preguntas específicas.

Page 44: BODEGAS DE DATOS (1).pptx

SISTEMAS DE GESTION DE BASES DE DATOS 

DB2 IBM

Fast-Count DBMS MegaPlex Software

HOPS HOPS International

Microsoft SQL Server Microsoft

Model 204 Computer Corporation of America

NonStop SQL Tandem

Nucleus Server Sand Technology Systems

OnLine Dynamic Server,Extended Parallel Server Informix

OpenIngres Computer Associates

Oracle Server Oracle

Rdb Oracle

Red Brick Warehouse Red Brick Systems

SAS System SAS

Sybase IQ Sybase

Sybase SQL Server, SQL Server MPP Sybase

SymfoWARE Fujitsu

Teradata DBS NCR

THOR Hitachi

Time Machine Data Management Technologies, Inc.

Titanium Micro Data Base Systems, Inc.

Unidata Unidata, Inc.

UniVerse VMARK

Vision Innovative Systems Techniques, Inc.

WX9000 White Cross Systems Inc.

XDB Server XDB Systems, Inc. [8]

Page 45: BODEGAS DE DATOS (1).pptx

CONCLUSIONES

Como conclusión podemos decir lo siguiente la importancia que tienen las bodega de

datos y el manejo frente a una empresa, El desarrollo que tiene BD, se deben

implementar siguiendo determinados pasos y normas.

Una BD es eficiente o confiable si sus aspectos de seguridad cumplen con todo los requerimiento.

Page 46: BODEGAS DE DATOS (1).pptx

Bibliografía

[1]http://informationmanagement.wordpress.com/2007/10/07/data-warehousing-data-warehouse-y-datamart/

[2]http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

[3]Introduccion B_I Elizabeth Leon Guzman .UNAL

[4]http://www.scielo.org.co/scielo.php?pid=S0120-56092007000100008&script=sci_arttext

[5]trabajofinal4.tripod.com/historia.html

[6]https://prezi.com/qg-ty8ueevar/data-warehouse/

[7]http://haroldrhp.wordpress.com/23-2/

[9] http://www.monografias.com/trabajos24/bodega-de-datos/bodega-de-datos.shtml#uso#ixzz3Jz51vWce

Page 47: BODEGAS DE DATOS (1).pptx

[8 ]http://www.ongei.gob.pe/publica/metodologias/Lib5084/132.HTM

http://www.oracle.com/us/products/database/datawarehousing/overview/index.html

http://es.wikipedia.org/wiki/Data_mart

https://docs.oracle.com/html/E10312_01/dm_concepts.htm

http://es.wikipedia.org/wiki/OLAP

http://es.wikipedia.org/wiki/Base_de_datos_multidimensional

[9]http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

http://www.disi.unal.edu.co/profesores/eleonguz/cursos/tabd/presentaciones/Sesion2-Introdu

ccionBI.pdf

http://www.sinnexus.com/business_intelligence/olap_avanzado.aspx

http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos

http://www.sispro.gov.co/

http://es.wikipedia.org/wiki/Esquema_en_estrella