data warehouse

Download Data Warehouse

Post on 14-Oct-2015

17 views

Category:

Documents

0 download

Embed Size (px)

TRANSCRIPT

PRESENTACION

El Instituto Nacional de Estadstica e Informtica (INEI), ente rector de los Sistemas Nacionales de Estadstica e Informtica, se complace en presentar el"Manual para la Construccin de un Data Warehouse".Esta tecnologa permite que la organizacin disponga, en forma integrada y estandarizada, de la informacin correspondiente a la operacin de la empresa, as como, proporciona a los usuarios, que tienen a su cargo la toma de decisiones, las herramientas adecuadas, para que a travs de consultas rpidas, ellos mismos accedan la informacin requerida.El documento consta de tres captulos. En el primero, "Aspectos Tericos", se dan los conceptos y el fundamento de la tecnologa data warehousing. En el segundo, "Proyecto de Elaboracin de un Data Warehouse", se definen las estrategias para su planificacin, desarrollo, diseo y gestin, adems de los puntos que deben considerarse en la evaluacin de la inversin.El tercer captulo, "Software en un Data Warehouse", permite comparar las herramientas de anlisis adecuadas para los usuarios del data warehouse. Asimismo, en los Anexos, se proporciona una relacin de los diversos Softwares que se usan en el manejo de un Data Warehouse, seguido de un Glosario de Trminos utilizados en la publicacin.El INEI, en su propsito de contribuir con la modernizacin de la gestin de los Servicios Informticos, pone a disposicin de las Instituciones Pblicas, Privadas, estudiantes y pblico en general, este documento, agradeciendo a las personas que han contribuido a la realizacin de la presente publicacin.Lima, Setiembre de 1997

Econ. Flix Murillo AlfaroJefeINSTITUTO NACIONAL DE ESTADISTICAE INFORMATICA

PREFACIO

Desde que se inici la era de la computadora, las organizaciones han usado los datos desde sus sistemas operacionales para atender sus necesidades de informacin. Algunas proporcionan acceso directo a la informacin contenida dentro de las aplicaciones operacionales. Otras, han extrado los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus necesidades de informacin.Ambos mtodos han evolucionado a travs del tiempo y ahora las organizaciones manejan una data no limpia e inconsistente, sobre las cuales, en la mayora de las veces, se toman decisiones importantes.La gestin administrativa reconoce que una manera de elevar su eficiencia est en hacer el mejor uso de los recursos de informacin que ya existen dentro de la organizacin. Sin embargo, a pesar de que sto se viene intentando desde hace muchos aos, no se tiene todava un uso efectivo de los mismos.La razn principal es la manera en que han evolucionado las computadoras, basadas en las tecnologas de informacin y sistemas. La mayora de las organizaciones hacen lo posible por conseguir buena informacin, pero el logro de ese objetivo depende fundamentalmente de su arquitectura actual, tanto de hardware como de softwareEl data warehouse, es actualmente, el centro de atencin de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la informacin que est siendo administrada por diversas aplicaciones operacionales.Un data warehouse es una coleccin de datos en la cual se encuentra integrada la informacin de la Institucin y que se usa como soporte para el proceso de toma de decisiones gerenciales. Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.Reunir los elementos de datos apropiados desde diversas fuentes de aplicacin en un ambiente integral centralizado, simplifica el problema de acceso a la informacin y en consecuencia, acelera el proceso de anlisis, consultas y el menor tiempo de uso de la informacin.Las aplicaciones para soporte de decisiones basadas en un data warehousing, pueden hacer ms prctica y fcil la explotacin de datos para una mayor eficacia del negocio, que no se logra cuando se usan slo los datos que provienen de las aplicaciones operacionales (que ayudan en la operacin de la empresa en sus operaciones cotidianas), en los que la informacin se obtiene realizando procesos independientes y muchas veces complejos.Un data warehouse se crea al extraer datos desde una o ms bases de datos de aplicaciones operacionales. La data extrada es transformada para eliminar inconsistencias y resumir si es necesario y luego, cargadas en el data warehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para el acceso a la informacin Institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con ms responsabilidad.La innovacin de la Tecnologa de Informacin dentro de un ambiente data warehousing, puede permitir a cualquier organizacin hacer un uso ms ptimo de los datos, como un ingrediente clave para un proceso de toma de decisiones ms efectivo. Las organizaciones tienen que aprovechar sus recursos de informacin para crear la informacin de la operacin del negocio, pero deben considerarse las estrategias tecnolgicas necesarias para la implementacin de una arquitectura completa de data warehouse.1.1INTRODUCCION AL CONCEPTO DATA WAREHOUSING

Data warehousing es el centro de la arquitectura para los sistemas de informacin en la dcada de los '90. Soporta el procesamiento informtico al proveer una plataforma slida, a partir de los datos histricos para hacer el anlisis. Facilita la integracin de sistemas de aplicacin no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analtico, informtico sobre una amplia perspectiva de tiempo.Un Data Warehouse o Depsito de Datos es una coleccin de datos orientado a temas, integrado, no voltil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales.Se puede caracterizar un data warehouse haciendo un contraste de cmo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de produccin.Base de Datos OperacionalData Warehouse

Datos OperacionalesDatos del negocio para Informacin

Orientado a la aplicacinOrientado al sujeto

ActualActual + histrico

DetalladaDetallada + ms resumida

Cambia continuamenteEstable

Diferentes tipos de informacinEl ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos los casos. El data warehouse es siempre un almacn de datos transformados y separados fsicamente de la aplicacin donde se encontraron los datos en el ambiente operacional.

1.2 SISTEMAS DE INFORMACION

En las metodologas anteriores, publicadas por el Instituto Nacional de Estadstica e Informtica - INEI y con el fin de proporcionar una visin ms clara, los sistemas de informacin se han dividido de acuerdo al siguiente esquema:

Sistemas Estratgicos, orientados a soportar la toma de decisiones, facilitan la labor de la direccin, proporcionndole un soporte bsico, en forma de mejor informacin, para la toma de decisiones. Se caracterizan porque son sistemas sin carga peridica de trabajo, es decir, su utilizacin no es predecible, al contrario de los casos anteriores, cuya utilizacin es peridica.Destacan entre estos sistemas: los Sistemas de Informacin Gerencial (MIS), Sistemas de Informacin Ejecutivos (EIS), Sistemas de Informacin Georeferencial (GIS), Sistemas de Simulacin de Negocios (BIS y que en la prctica son sistemas expertos o de Inteligencia Artificial - AI). Sistemas Tcticos, diseados para soportar las actividades de coordinacin de actividades y manejo de documentacin, definidos para facilitar consultas sobre informacin almacenada en el sistema, proporcionar informes y, en resumen, facilitar la gestin independiente de la informacin por parte de los niveles intermedios de la organizacin.Destacan entre ellos: los Sistemas Ofimticos (OA), Sistemas de Transmisin de Mensajera (E-mail y Fax Server), coordinacin y control de tareas (Work Flow) y tratamiento de documentos (Imagen, Trmite y Bases de Datos Documentarios). Sistemas Tcnico-Operativos,que cubren el ncleo de operaciones tradicionales de captura masiva de datos (Data Entry) y servicios bsicos de tratamiento de datos, con tareas predefinidas (contabilidad, facturacin, almacn, presupuesto, personal y otros sistemas administrativos). Estos sistemas estn evolucionando con la irrupcin de censores, autmatas, sistemas multimedia, bases de datos relacionales ms avanzadas y data warehousing.

Sistemas Interinstitucionales, este ltimo nivel de sistemas de informacin recin est surgiendo, es consecuencia del desarrollo organizacional orientado a un mercado de carcter global, el cual obliga a pensar e implementar estructuras de comunicacin ms estrechas entre la organizacin y el mercado (Empresa Extendida, Organizacin Inteligente e Integracin Organizacional), todo sto a partir de la generalizacin de las redes informticas de alcance nacional y global (INTERNET), que se convierten en vehculo de comunicacin entre la organizacin y el mercado, no importa dnde est la organizacin (INTRANET), el mercado de la institucin (EXTRANET) y el mercado (Red Global).

Sin embargo, la tecnologa data warehousing basa sus conceptos y diferencias entre dos tipos fundamentales de sistemas de informacin en todas las organizaciones: los sistemas tcnico-operacionales y los sistemas de soporte de decisiones. Este ltimo es la base de un data warehouse.1.2.1 Sistemas tcnico-operacionales

Como indica su nombre, son los sistemas que ayudan a manejar la empresa con sus operaciones cotidianas. Estos son los sistemas que operan sobre el "backbone" (columna vertebral) de cualquier empresa o institucin, entre las que se tiene sistemas de ingreso de rdenes, inventario, fabricacin, planilla y contabilidad, entre otros.Debi