charla pentaho - utn

41
www.datalytics.com Presentación Pentaho Enterprise Edition @aeyherabide Ing. Andrés Eyherabide

Upload: datalytics

Post on 19-Jun-2015

2.002 views

Category:

Documents


3 download

DESCRIPTION

Presentación usada en la charla de Pentaho, cátedra de BI, UTN Regional Buenos Aires.

TRANSCRIPT

Page 1: Charla Pentaho - UTN

www.datalytics.com Presentación Pentaho Enterprise Edition

@aeyherabide

Ing. Andrés Eyherabide

Page 2: Charla Pentaho - UTN

Fundada en el año 2007, Datalytics es una empresa de servicios profesionales

independiente, orientada exclusivamente a las prácticas de:

Data Integration

Business Intelligence

Data Mining

Oficinas en las ciudades de Buenos Aires, Rosario y Medellín.

Equipo de trabajo interdisciplinario, con +25 profesionales de diversas áreas.

Implementaciones en Argentina, Chile, Brasil, Colombia, España y USA.

Nuestros servicios incluyen la consultoría, capacitación, implementación y el apoyo

necesario para asegurar una solución exitosa que soporte los procesos de negocios.

Datalytics ha certificado su Sistema de Gestión de calidad para la “Provisión de Servicios

de Business Intelligence y Data Mining” bajo la norma ISO 9001:2008 por Bureau

Veritas.

La Empresa

Page 3: Charla Pentaho - UTN

Nuestros servicios

Siebel PeopleSoft SAP R/3 XML

VSAM MQSeries AS/400

DB2 UDB Informix Oracle Microsoft ...

Archivos Planos FTP

Web Logs

DW OLAP & Reporting

DW ODS Data Mart

Extract Transform Clean Load

ETL

Data Mining

Datastage Informatica Oracle DI Pentaho DI SAS DIS Etc.

SAS, SPSS, Rapid Miner

Pentaho, Oracle/Hyperion, Microstrategy, SAS, Etc.

Oracle IBM DB2 SQL Server Teradata Sybase IQ Etc.

Page 4: Charla Pentaho - UTN

Relevamiento de implementaciones de BI. Análisis de GAP.

Consultoría, diseño e implementación de estrategias y soluciones de BI.

Integración de datos de múltiples fuentes: estructuradas y no estructuradas, locales o en

la nube, migración desde aplicaciones legacy, etc.

Utilización de técnicas y herramientas de BI para otras aplicaciones como:

Web y Social Media Analytics (Google Analytics, Twitter, Facebook, etc.).

Sistemas de gestión de campañas con herramientas de ETL.

Herramienta de gestión de Fuerza de Ventas.

Solución de gestión de evaluaciones de desempeño.

Procesos de limpieza, estandarización y normalización de datos

Desarrollo de modelos de Data Mining (descriptivos y predictivos).

Nuestros servicios

Page 6: Charla Pentaho - UTN

Primer Platinum Reseller, Systems Integrator and Training Partner en América Latina.

Partners desde Marzo 2008. Larga y fluida relación.

Oferta de cursos oficiales y a medida, presenciales y vía web.

+50 implementaciones en clientes de distinta escala distribuidos en 6 países.

+20 consultores especializados en la Plataforma.

Pentaho Partnership

Page 7: Charla Pentaho - UTN

Open Source en la actualidad

Page 8: Charla Pentaho - UTN

Que es Pentaho?

Pentaho es la empresa líder en

Commercial Open Source Business

Intelligence & Data Integration

Compañía americana fundada en 2004,

con HQ en Orlando (FL)

Modelo Low Cost y metodología ágil de

implementación, acelerando la generación

de valor y el ROI

Auspiciada por Benchmark Capital, Index

Ventures and NEA

+ de 160 partners, entre ellos algunas de

las empresas de tecnología más

innovadoras del mercado

Page 9: Charla Pentaho - UTN

Presencia internacional en aumento

+ 10.000 implementaciones

+185 países

+ 1.200 clientes comerciales

Debút en los cuadrantes mágicos de BI Gartner (2012)

En promedio 1 descarga cada 30 segundos (!)

Q1 '09

Q2 '09

Q3 '09

Q4 '09

Q1 '10

Q2 '10

Q3 '10

Q4 '10

Q1 '11

Q2 '11

Q3 '11

Q4 '11

# Suscripciones

Page 10: Charla Pentaho - UTN

Modelo de Negocios

Build

Test Contribute

Write

Enterprise Edition Open Source Community

Pentaho contrata los principales desarrolladores de cada módulo, y dirige el desarrollo de cada uno de los proyectos

La comunidad contribuye nueva funcionalidad, testeo e innovación

Lo anterior mejora la calidad del producto mediante la rápida detección de defectos

Software certificado, listo para ambientes de producción

Módulos exclusivos, funcionalidad adicional y facilidades de uso

Soporte técnico oficial

Modelo de suscripción que minimiza la inversión inicial

Page 11: Charla Pentaho - UTN

Liderazgo en el mundo Open Source

# 1 OS BI

# 1 en OS DI/ETL

# 2 en OS Data Mining

Fuente TDWI y BeyeNetwork

Page 12: Charla Pentaho - UTN

El Open Source según Gartner

“Para el 2012, el 80% de todo software comercial

incluirá algún elemento Open Source”

“Hay variedad de herramientas/software open source en un estadío maduro,

estable y bien soportadas. Ellas proveen una significativa oportunidad para

vendedores y usuarios de bajar el costo total de ownership e incrementar el ROI.”

“Ignorar esta realidad pondrá a las compañías en una sería posición de

desventaja competitiva. Embeber sofware Open Source se convertirá en la

inversión mínima que muchos grandes vendors encontrarán necesaria para

mantener su ventaja competitiva durante los próximos 5 años.”

Gartner Group, año 2008

Page 13: Charla Pentaho - UTN

Open Source dentro de Close Source

5 años después, los megavendors de BI le hicieron caso al Grupo Gartner.

SAP/Business Objects:

Apache Tomcat, MySQL, Eclipse, Python, Subversion, etc…

IBM/Cognos:

Apache Tomcat, Apache Derby, PostgreSQL, iSeries Appliance (Talend)

Greenplum:

PostgreSQL, Proyecto R, Map/Reduce

Information Builders:

Magnify (Lucene), Rstat (Proyecto R), Open Portal Services (Apache Jetspeed)

Page 14: Charla Pentaho - UTN

Adopción Open Source BI

Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009

50%

Page 15: Charla Pentaho - UTN

Por qué Open Source?

Fuente: Open Source Adoption in the BI Market, 3rd Nature, 2009

Page 16: Charla Pentaho - UTN

El futuro del Open Source

Page 17: Charla Pentaho - UTN

Reconocimiento de analistas

Page 18: Charla Pentaho - UTN

La visión de Pentaho sobre el futuro de BI

2012

Drivers

2007 2000

Legacy BI • Transaction data

• IT-driven

• On premise

BI for Business

Analysts • In-Memory

• Self Service

• Visualization

Next Generation

Analytics • Integration of transaction &

big data

• User-driven, collaborative

• Cloud-ready, Embedded,

Mobile

Incremento exponencial de datos

Diversidad de información

Arquitecturas Cloud y Móviles

Masificación de IT

Por que Pentaho considera que una plataforma que una data integration con business analytics es crítico para el futuro

Page 19: Charla Pentaho - UTN

La visión de Pentaho sobre el futuro de BI

2012

Drivers

2007 2000

Legacy BI • Transaction data

• IT-driven

• On premise

BI for Business

Analysts • In-Memory

• Self Service

• Visualization

Next Generation

Analytics • Integration of transaction &

big data

• User-driven, collaborative

• Cloud-ready, Embedded,

Mobile

Incremento exponencial de datos

Diversidad de información

Arquitecturas Cloud y Móviles

Masificación de IT

Page 20: Charla Pentaho - UTN

Plataforma unificada

Reports Dashboards

Analysis Visualizations

Predictive Analytics

Access Integrate Cleanse Enrich

Data Integration

Data Discovery

Data Mining

Web Data

Transaction Data

External Data/ Partner Apps

Decision Maker

Analyst

Business User

Integrar información de manera visual desde múltiples fuentes de información

Visualizar y analizar la información de la compañía de manera interactiva

Interfaz web de usuario final desarrollada para permitir self-service BI, reduciendo la dependencia de IT

Capa de metadatos compartida

Page 21: Charla Pentaho - UTN

Plataforma moderna

100% Java, multi-plataforma (Windows, Linux, Unix, Mac OS) Modular y liviana, de arquitectura sencilla Alta-performance, escalable

Arquitectura orientada a servicios (SOA). Integración y reusabilidad Basa en estándares, altamente extendible y fácil de embeber/integrar

Reporting, dashboards, análisis OLAP, data mining, análisis predictivo Poderosas herramientas para usuarios y analistas de negocio, investigadores

Datos estructurados, no estructurados y NoSQL Soporte nativo para plataformas emergentes como Hadoop, Cassandra, etc.

Diversidad de Datos

Embedded Analytics

Plataforma integral de bajo costo

Plataforma completa, con visión unificada de integración y análisis de datos Enfoque ágil para rápidas iteraciones y desarrollo de prototipos evolutivos Modelo de suscripción low cost

Arquitectura Moderna

Diversidad de Análisis

Page 22: Charla Pentaho - UTN

Guiado por una metodología

Single Development Environment

La misión de Agile BI es acelerar el ROI.

Crear soluciones de calidad de manera rápida y sencilla, promoviendo la participación

del usuario final durante el desarrollo y reduciendo los riesgos de desvíos en la

implementación.

Una plataforma integrada reduce los tiempos de desarrollo.

Rápidas iteraciones promueven la

participación de los analistas

de negocio.

La agilidad para adaptarse a nuevos

requerimientos y a un entorno

cambiante es vital para satisfacer

las necesidades del negocio.

Page 23: Charla Pentaho - UTN

Suscripción anual Low Cost

“En un proyecto de 5 años, open source BI cuesta

82% menos que los BI Megavendors y 77% menos

que empresas dedicadas a BI” (Fuente: BI Platform Licensing Models and Negotiating Strategies, Abril 2010)

En un período de 3 años, la reducción de costos de Pentaho respecto a otros productos propietarios:

• Implementaciones Grandes (500 usuarios): 95% • Implementaciones Medianas (100 usuarios): 72% • Implementaciones Pequeñas (25 usuarios): 55%

(Fuente: Lowering the Cost of Business Intelligence With Open Source, 2010)

Page 24: Charla Pentaho - UTN

Pentaho BA Suite

Pentaho está compuesta por un

conjunto de herramientas, una por cada

etapa de su proyecto de BI.

Estructura modular y embebible:

Data Integration

Pentaho Reporting

Pentaho Analysis

Pentaho Dashboards

Pentaho Data Mining

Arquitectura multiplataforma

Soporte para Mobile BI

Énfasis en Big Data (Hadoop, bases

analíticas, NoSQL, etc.).

Page 25: Charla Pentaho - UTN

Pentaho Data Integration

Permite tomar información de diferentes fuentes, consolidarla y cargarla en un repositorio analítico.

Su entorno de trabajo visual y drag & drop se traduce en un menor tiempo de desarrollo y un mantenimiento más sencillo y agilidad para incorporar nuevas fuentes de información e indicadores.

Plug-in de Agile BI:

Data Discovery: Análisis y visualización de información en tiempo real

Data Modeling: Modelado y publicación de cubos OLAP para prototipado y validación de requerimientos

Page 26: Charla Pentaho - UTN

+ de 150 steps para manipulación, enriquecimiento de datos y generación de reportes.

Repositorio integrado: control de versiones para trabajo colaborativo y scheduling de procesos.

Conectividad nativa contra:

Típicas: SQL Server, Oracle, DB2, Teradata, Sybase IQ, SAP, MySQL, PostgreSQL, etc.

No tan típicas: AS/400, Hadoop, LDAP/Active Directory, SalesForce, Google Analytics, etc.

Nuevos Features:

Soporte para MongoDB.

ElasticSearch.

Archivos HL7.

Capacidad de documentación automática.

cliente REST.

Etc…

Pentaho Data Integration

Page 27: Charla Pentaho - UTN

Portal Web

Los usuarios pueden acceder a la información mediante la web en cualquier momento, desde cualquier lugar con conectividad.

100% personalizable e integrable.

El Portal integra todos los módulos de la solución y provee servicios críticos para los usuarios como son:

Fácil acceso a información del negocio.

Análisis de tipo Ad-Hoc.

Scheduling de reportes de manera intuitiva.

Descarga de información. Análisis offline.

También provee servicios para administradores:

Administración de usuarios y seguridad.

Auditoria y monitoreo de rendimiento, etc.

Page 28: Charla Pentaho - UTN

Portal Web

Page 29: Charla Pentaho - UTN

Pentaho Report Designer

Conectividad con múltiples fuentes de información:

Bases de datos (SQL Server, Oracle, DB2,

Teradata, Sybase, …).

Transformaciones de Pentaho Data

Integration.

Otros: Metadata de Pentaho, OLAP (XML/A,

MDX), XML.

Principales Características:

Reportes pixel-perfect.

Desarrollo 100% drag & drop.

Utilización de parámetros y variables.

Posibilidad de descargar la información en

diversos formatos (html, pdf, xls, etc.).

Page 30: Charla Pentaho - UTN

Pentaho Enterprise Edition (EE)

Analyzer

Advanced Data Integration

• Desarrollo colaborativo

• Automatización integrada

• Plugin de Agile BI para prototipado

• Steps adicionales: Data Mining,

Google Docs, Google Analytics, etc.

Big Data

• Reportes sumarizados vía Drag & drop

• Analisis y visualización avanzada

• Navegación vía Drill-through y linkeo

Dashboard Designer

• Dashboards on-demand

• Punto de integración de análisis

• Tablas, gráficos, reportes, etc.

Enterprise Console

• Administración centralizada

• Monitoreo y diagnostico

• Auditoría de la plataforma

• Soporte nativo para Hadoop

• Bases de datos NoSQL

• Soporte para Amazon EMR

• Procesamiento distributed

Interactive Reporting

• Reportes detallados vía Drag & drop

• Selección, filtrado y formateo online

• Integración con Dashboards

Page 31: Charla Pentaho - UTN

Pentaho Ad-Hoc Reporting

Diseñador Web de reportes de tipo Drag & Drop.

Capacidad de los analistas de negocio de generar sus propios reportes operativos desde la web.

Selección de campos, totales por columna, filtros, ordenamiento, etc.

Modificación de Look & Feel: fonts, colores, tamaño de las columnas, etc.

Posibilidad de descargar la información en diversos formatos (html, pdf, excel, etc.)

La Capa de negocios permite presentar la información a los usuarios en términos de negocio: los usuarios ven “Ventas” y “Clientes” en vez de CUST_TBLE u ORDR_TBLE.

Page 32: Charla Pentaho - UTN

Interfaz web: resulta más sencillo para el usuario el usuario promedio crear reportes

operacionales de manera ad-hoc, sin depender de IT.

Drag & Drop: agregar, mover o borrar campos en tiempo real desde el reporte.

Edición y formatting: fonts y colores, filtrado, ordenamiento, agrupamiento, agregación.

Export de grandes volúmenes de información en diversos formatos: Excel, PDF, etc.

Creación de reportes basados en templates, para darle a los reportes la impronta visual de

la compañía.

Mas funcionalidad en la web: menos casos

donde se requiere Report Designer (cliente

desktop orientado a IT).

Diferenciales de Int. Reporting (EE only)

Page 33: Charla Pentaho - UTN

Pentaho Analysis

Los cubos OLAP permiten a los usuarios interacturar y visualizar la información de manera multi-dimensional:

Ejemplo: ventas por regional, por unidad de

negocio, por año fiscal.

Navegar y explorar la información de manera 100% intuitiva:

Análisis Ad-Hoc, Self-Service BI.

Drill-down, Drill-up.

Pivot, Slice and Dice.

Seleccionar miembros específicos para el

análisis.

Interacción con alto rendimiento:

Tecnología optimizada para manipular

grandes volumenes de información en seg.

Page 34: Charla Pentaho - UTN

Capacidad analítica: cliente web 2.0 orientada a Drag & Drop que permite a los usuarios

finales mantener una conversación más fluida con los datos.

Análisis de información en formato de tablas pivot y gráficos, con soporte para multi-

charting y drill down en gráficos, brindando mayor facilidad para navegar la información y

descubrir patrones y anomalías.

Ordenamiento y filtrado mediante click derecho, más intuitivo para el usuario promedio.

Métricas creadas por los usuarios en tiempo real, sin código MDX o SQL.

Filtros dinámicos. Ejemplo: mes actual.

Export de grandes volúmenes de información

en diversos formatos: Excel, PDF, etc.

Mondrian Enterprise Cache: arquitectura de

última generación para trabajar con BIG DATA.

Mobile BI: Plug-in para iPad.

Diferenciales de Pentaho Analyzer (EE only)

Page 35: Charla Pentaho - UTN

Dashboard Designer (EE only)

Dashboards interactivos en minutos.

Orientado a usuarios finales (no IT)

Desarrollo amigable y 100% web.

Permite reunir en una única pantalla

diversos elementos:

Tablas Pivot

Gráficos

Mapas

Contenido existente (Ej.: reportes)

Contenido externo (Ej.: páginas web)

Controles para filtros

Link entre objetos:

Dentro del mismo Dashboard

Entre Dashboards u otros reportes de Pentaho

Page 36: Charla Pentaho - UTN

Pentaho Data Integration (EE only)

Pentaho Data Integration Server: arquitectura

cliente/servidor.

Repositorio Enterprise:

Almacenamiento y cersionador

Seguridad y control de acceso

Scheduling

Data Integration Web Console:

Ejecución, monitoreo y gestión de procesos

Análisis de performance, trends, históricos.

Configuración de umbrales de alerta

Steps exclusivos:

Google Docs

Google Analytics

Full Agile BI Plug-in

Page 37: Charla Pentaho - UTN

Pentaho Enterprise Console (EE only)

Administración de usuarios y roles

Integración de seguridad con Active Directory/LDAP

Health Check de la plataforma

Configuración de conexiones

Configuración de servicios:

Servidor OLAP

Application Server

Servidor SMTP

Monitoreo de uso, auditoría

Scheduling de reportes

Data Integration Console

Administración de licencias

Page 38: Charla Pentaho - UTN

Pentaho EE – 3 Sabores

Operational Reporting

Dashboards

Data Integration

Interactive Reporting &

Analysis

Data Mining

Big Data y NoSQL

Basic Professional Enterprise

Page 39: Charla Pentaho - UTN

Arquitectura moderna, con una solución analítica integral (DI + BI).

Suscripción Low Cost: se paga a medida que se van obteniendo resultados.

Soporte para Mobile BI, Big Data y Cloud Analytics.

Más de 10.000 implementaciones / batallas ganadas.

Tasa de innovación acelerada, con una comunidad de + 10.000 desarrolladores.

Socio tecnológico de las empresas más innovadoras del mercado de BI.

90% más efectiva en materia de costo que los sistemas tradicionales de BI.

Por qué Pentaho?

Page 40: Charla Pentaho - UTN