bi subsistemas

Download BI Subsistemas

Post on 04-Nov-2015

19 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

DHW

TRANSCRIPT

Presentacin de PowerPoint

Subsistemas de DWH34 subsistemas de DWH (Kimball)Las industrias aceptan el termino ETL y ste presenta 4 componentes importantes:ExtraccinLimpieza y conformidadEntregaAdministracin Cada uno de estos componentes estn contenidos en 34 subsistemas y se explican a continuacin.Extraccin:Colocacin de la data en el DWHLos subsistemas actuales de la arquitectura ETL se centran en la transformacin, carga y en la administracin de Sistemas dentro del ambiente ETL.La extraccin en subsistemas ETL incluye:Extraccin:Colocacin de la data en el DWHLimpieza y Conformidad de DatosEs este tipo de subsistema cambia los datos y agrega valor a la organizacin.Estos subsistemas deben de ser diseados para crear metadata y usarla para el diagnstico de problemas de los sistemas origen.Este diagnstico eventualmente puede dirigir las iniciativas de re ingeniera de los procesos de negocio, limpiando la informacin y mejorando la calidad de los datos en el tiempo que se requiera.Limpieza y Conformidad de DatosEl proceso de limpieza es comnmente utilizado para corregir la data sucia, y al mismo tiempo el DWH muestra una imagen real de los datos tal cual fueron obtenidos de los sistemas de produccin de la organizacin.La clave es desarrollar un sistema ETL capaz de corregir, rechazar o cargar datos tal cuales son, para luego en base a estructuras fciles de usar enfatizar modificaciones y estandarizaciones en los sistemas de limpieza le permita desarrollar la documentacin.Limpieza y Conformidad de DatosLa limpieza y conformidad en subsistemas ETL incluye 5 subsistemas importantes:

Entrega: Preparar para la PresentacinLa misin bsica del sistema ETL es la transferencia de las tablas dimensionales y hechos en la etapa de entrega.

Existe una variacin considerable en las estructuras de datos de origen y la limpieza, pero las tcnicas de procesamiento de entrega es fundamental para construir un almacn de datos con xito ,dimensiones fiables, escalable y fcil de mantenerPara muchas dimensiones, el plan de distribucin bsico es relativamente simple: llevar a cabo transformaciones bsicas a los datos para construir las dimensiones para luego ser cargados en la presentacin de destinoLa preparacin de las tablas hechos es ciertamente importante, ya que ocupan las mediciones clave del negocio que los usuarios quieren ver. Las tablas hechos pueden ser muy grandes y lleva mucho tiempo en distribuir. Sin embargo, la preparacin de tablas hechos para la presentacin suele ser ms sencillo. La arquitectura del sistema de distribucin en ETL consiste:Entrega: Preparar para la Presentacin21. Gerente de propagacin de datos El sistema ETL debe de cumplir 3 criterios para que el data warehouse se vuelva una fuente confiable para la decisin de negocio :

Gestin del Ambiente ETL