data warehouse

Download data warehouse

Post on 07-Nov-2015

212 views

Category:

Documents

0 download

Embed Size (px)

DESCRIPTION

data warehouse

TRANSCRIPT

Trabajo final de grado

REFERENCIAS BIBLIOGRAFICAS

FACULTAD DE INGENIERA

Carrera Ingeniera de Sistemas

MODALIDAD DE GRADUACIN Proyecto de Grado

Data Mart para la gestin de reportes y apoyo a la toma de decisiones del departamento de RR.HH. de la empresa de agua S.A.

Oscar Marcos Amelunge Ruiz

Santa Cruz - Bolivia2010

FACULTAD DE INGENIERA

Carrera Ingeniera de Sistemas

MODALIDAD DE GRADUACIN Proyecto de Grado

Data Mart para la gestin de reportes y apoyo a la toma de decisiones del departamento de RR.HH. de la empresa de agua S.A.

Oscar Marcos Amelunge RuizNR. 2003210474

Proyecto de Grado para optar algrado de Licenciado en Ingeniera de Sistemas

Santa Cruz - Bolivia2010

56

ABSTRACT

TITULOData Mart para la gestin de reportes y apoyo a la toma de decisiones del departamento de RR.HH. de la empresa de agua S.A.

AUTOR: Oscar Marcos Amelunge Ruiz.

PROBLEMATICAOBJETIVOCONTENIDOCARRERA: Ingeniera de Sistemas

PROFESOR GUIA:

DESCRIPTORES O TEMAS: Data Warehouse, Data Mart, Analisis, Diseo, Modelo Dimensional.

E-MAIL: oscar.amelunge@gmail.com

FECHA: Julio de 2010.

AGRADECIMIENTOEn esta seccin se realizara el agradecimiento correspondiente

RESUMEN

INTRODUCCION

Desde principios de la dcada de los 80 los sistemas de informacin empezaron a desarrollarse utilizando el modelo relacional y la informacin almacenada en las bases de datos generalmente ha sido orientada al registro de transacciones, lo que comnmente se conoce como sistemas OLPT OLTP es la sigla en ingls de Procesamiento de Transacciones En Lnea (Online Transaction Processing) es un tipo de sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y procesamiento de transacciones. (WIKIPEDIA, 2010). Como su nombre lo dice este tipo de sistemas estn orientados exclusivamente generar informacin a travs de transacciones y no a la consulta y anlisis de la informacin, ya que al aumentar el volumen de informacin en los sistemas transaccionales se dificulta la consulta de los datos generados. Como alternativa a esta situacin surgi el concepto de Data Warehouse (D.W.) (almacn de datos) como lo define Ralph Kimball una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis o la unin de todos los Data Marts de una entidad (Kimball, 2002)(Ralph Kimball 2002).

El objetivo primordial de un D.W.es almacenar los datos de tal manera que se facilita la extraccin y consulta de los mismos sin importar el amplio volumen de informacin que pueda existir. Normalmente el alcance que tiene un D.W. llega a ser, toda la informacin generada empresa, la construccin de un D.W. requiere una inversin en tiempo y esfuerzo considerable. Una estrategia o concepto alternativo al D.W. que tiene el mismo fin pero con un alcance ms limitado a un rea o departamento de empresa es el Data mart. Un Data mart es una versin especial de almacn de datos (Data Warehouse). Son subconjuntos de datos con el propsito de ayudar a que un rea especfica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de mltiples formas para que diversos grupos de usuarios realicen la explotacin de los mismos de la forma ms conveniente segn sus necesidades. (WIKIPEDIA, 2010).

En los tiempos actuales las empresas necesitan depositar toda su confianza en la toma de decisiones, para lo cual se requieren fuentes de informacin fiables y oportunas, la cuales brinden a los empleados, jefes de seccin, administrativos, ejecutivos y tambin entes externos a la empresa como ser: organismos gubernamentales, bancos, fondos financieros, etc. la facilidad de compartir, gestionar, procesar y utilizar los datos generados, sobre todo la informacin que es procesada y almacenada por los Sistemas de Informatizados de la compaa como fuente principal de apoyo a la toma de decisiones, marco del estado actual e indicador de los posibles estados futuros; para esto las empresas pueden valerse de los D.W..

El presente trabajo de grado pretende enfocarse en la implementacin de un Data Mart para una de las areas de empresa mayor estudiada y de mayor preocupacin; los Recursos Humanos, eje principal del aparato productivo de toda organizacin. La cantidad de informacin generada por las actividades y procesos concernientes al control y gestin de recursos humanos en las empresas es substancial, y de la misma pueden derivarse una gran cantidad de informacin como ser control de asistencias y permisos, control de vacaciones, planillas de sueldos, pagos de beneficios, etc.

TABLA DE CONTENIDO

.PARTE I PLANIFICACIN Y PREPARACIN DEL PROYECTO2

i

.PARTE I PLANIFICACIN Y PREPARACIN DEL PROYECTO

1. PLANIFICACION DEL PROYECTO1.1. INTRODUCCION

1.2. DEFINICION DEL PROBLEMAEl departamento de Recursos Humanos de la empresa de agua S.A. cuenta actualmente con un sistema de informacin con el cual se gestionan y almacena la informacin de ms de 600 funcionarios.

El sistema utiliza como repositorio de informacin una base de datos cuyo diseo relacional est orientado mas al almacenamiento que a la consulta y explotacin de los mismo, con el paso del tiempo los usuarios de dicho sistema han ido requiriendo cada vez mayor cantidad de reportes y necesidad de poder analizar la informacin de los funcionarios, con lo cual el modelo transaccional sobre la cual est construida la base de datos dificulta el estudio de la informacin almacenada en la misma.

Con los sistemas tradicionales se preparan reportes ad-hoc para encontrar las respuestas a algunas de las preguntas del negocio, pero se necesita dedicar mucho del tiempo al anlisis de localizacin, formateo, presentacin y procesamiento de los datos, como tambin asignacin de recursos humanos del departamento de sistemas para poder responderlas, sin tener en cuenta la degradacin de los sistemas transaccionales. Esta problemtica se debe a que dichos sistemas transaccionales no fueron construidos con el fin de brindar sntesis, anlisis, consolidacin, bsquedas y proyecciones.

Existe una gran cantidad de reportes ad-hoc asociados a los datos que se registran en el sistema de recursos humanos y la variacin de los mismos en el tiempo es poco significativa, la herramienta en la cual estn construidos y publicados estos reportes exige que cada vez que se requiera un cambio menor en el mismo, tenga que contactarse a los desarrolladores para que el reporte ad-hoc sea modificado, lo cual implica un retraso para la persona o rea de empresa que necesita el reporte.

1.3. SITUACION PROBLEMTICANo existe una disponibilidad inmediata de la informacin para la generacin de reportes y consulta de datos de los empleados.1.4. SITUACION DESEADAContar con un Data Mart que almacene la informacin generada por el sistema de recursos humanos y que de la posibilidad de acceder dicha informacin de manera inmediata a travs de una herramienta de consulta.

1.5. JUSTIFICACINLa ventaja de utilizar un Data Mart como herramienta al soporte de decisiones son muchas por ejemplo: que el departamento de RR. HH. pueda consultar la informacin sin tener que depender de personal tcnico (programadores o analistas de sistemas) que genere los reportes o consultas ad hoc a travs de un lenguaje y/o herramienta de programacin, lo cual adems conlleva en disminuir el tiempo de espera en la generacin de reportes por parte del personal tcnico.

Adems el departamento de RR. HH. Podr manejar la informacin, examinarla desde diferentes puntos de vista, de manera que puedan entenderla mejor e interpretarla de acuerdo a su criterio.

1.6. OBJETIVOS1.6.1. OBJETIVO GENERALConstruir un Data Mart para la gestin de reportes y apoyo a la toma de decisiones del departamento de RR.HH. de la empresa de agua S.A.

1.6.2. OBJETIVOS ESPECIFICOS Definir los requerimientos generales del rea de RRHH para la construccin del Data Mart. Analizar y definir las fuentes de datos que permitan alimentar el Data Mart. Realizar el diseo de la base de datos del Data Mart Definir los procesos de ETL para alimentar el Data Mart. Construir una versin Beta de la base de datos y los procesos ETL del Data Mart.1.7. ALCANCELa metodologa a utilizar ser El Proceso de Ingeniera para el Data Warehouse (DWEP por sus siglas en ingles) planteado en la tesis doctoral de Lujn-Mora (Lujn Mora, 2005) utilizando como herramientas de modelado al Lenguaje Unificado de Modelado (UML) y las extensiones multidimensional profile, data mapping profile, ETL profile, UML profile database desing y database deployment profile planteadas en la citada tesis doctoral.

FasesInicio Requerimientos Requerimientos funcionales y no funcionales. Identificacin de las medidas y dimensiones ms importantes. Anlisis de los reportes peridicos que se utilizan actualmente. Elaboracin del modelo del dominio Elaboracin de los casos de uso ms importantes Anlisis Determinacin de las posibles fuentes de datos Elaboracin de los diagramas lgico de la fuente de datos SLS, diagrama fsico de las fuentes de datos SPS. Diseo Diseo definicin de la estructura del data Warehouse Elaboracin del diagrama conceptual del data Warehouse DWCS.

Elaboracin Requerimientos Recoleccin y refinamiento de requerimientos. Identificacin de nuevas medidas agregaciones y dimensiones. Anlisis Eleccin de fuentes de datos que alimenta el DM. Actualizacin de los diagramas SLS, SPS. Elaboracin de los diagramas diagrama conceptual SCS. Diseo Definicin procesos ETL a nivel conceptual. Actualizacin del diagrama DWCS. Elaboracin del diagrama mapeo de datos de integracin DM.

ImplementacinCAPITULO I PLAIFICACION DEL PROYECTOElaboracin de las estructuras fsicas.4