pentaho: inteligência de negócios utilizando software livre @ telefonica campus party 2011
DESCRIPTION
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Campus Party 2011TRANSCRIPT
Tornar sua organização mais competitiva pode ser mais livre do que você imagina!
CAMPUS PARTY 2011 – SÃO PAULO 18 DE JANEIRO DE 2011
Por que BI?
Utilizando estratégias de Inteligência de Negócios (Business Intelligence - BI) é possível
tomar decisões mais rápidas e seguras para sua empresa. E utilizando a ferramenta certa de
BI você garante o sucesso de seu projeto!
Projeto de BI
Data Warehouse
Um data warehouse nada mais é do que um banco de dados contendo dados
extraídos do ambiente de produção da empresa, que foram selecionados e depurados, tendo
sido otimizados para processamento de consulta e não para processamento de transações. Em
geral, um data warehouse requer a consolidação de outros recursos de dados, além dos
armazenados em banco de dados relacionais, como informações provenientes de planilhas
eletrônicas, documentos textuais, etc. [INMON, 1999].
Pensadores (DW)
Bill Inmonhttp://www.inmoncif.com/home/
&
Ralph Kimball http://www.rkimball.com/html/about.html
Star Schema
Ferramentas de BI
Os grandes fornecedores de ferramentas de BI são:
Open Source BI
No mundo de BI Open Source encontramos:
Pentaho
O Pentaho atualmente é a plataforma de inteligência de negócios de código aberto mais popular e poderosa no mundo.
Pentaho Corp.
● Fundada em 2004;● Sede em Orlando, Florida, Estados Unidos;● Aportes financeiros de fundos de investimentos
como Enterprise Associates, investidores do SugarCRM, Xensource, Index Ventures, investidores do MySQL, Zend e outros.
Por que Pentaho?
● Funciona;● Tecnologia Java;● Código Aberto;● Robusto;● Confiável;● Gratuito;● Apoio da Comunidade;● Já foi testado por muitas empresas.
Links Importantes
● http://wiki.pentaho.com● http://forums.pentaho.com/● http://sourceforge.net/projects/pentaho/
Possibilidades
Permite realizar consultas, relatórios, análise de informações (OLAP), painéis (dashboards) para controle gerencial, ETL e mineração de dados (Data Mining).
Mobilidade
Acesso ao Portal de BI através de Celulares.
Vantagens
Custo Zero de Licença do Pentaho; Desenvolvimento customizado dos Indicadores de Negócios (Relatórios, Cubos e Dashboards); Acesso web aos Indicadores independente de sistema operacional (Windows, Linux, Mac, iPhone).
Pentaho BI Suite
JAVA; Padrões Abertos; Multi Plataforma;
Equipe Pentaho
Blogs Pentaho
Blog Doug Moran (Pentaho Community Guy)http://dougmoran.blogspot.com/
Blog Matt Casters (Kettle Guy)http://www.ibridge.be/
Blog Julian Hyde (Mondrian Guy)http://julianhyde.blogspot.com/
Blog Thomas Morgner (Reporting Guy)http://www.sherito.org/
Blog Pedro Alves (CDF Guy)http://pedroalves-bi.blogspot.com/
Blog Roland Bouman (Author of Pentaho Solutions Book)http://rpbouman.blogspot.com/
Blogs Pentaho
Nicholas Goodmanhttp://www.nicholasgoodman.com/bt/blog/
Gretchen Moranhttp://gretchenmoran.blogspot.com
Michael Tarallohttp://michaeltarallo.blogspot.com/
James Dixonhttp://jamesdixon.wordpress.com/
Will Gormanhttp://www.willgorman.com/
Licença
A plataforma Pentaho é distribuída como Código Aberto através da Licença Pública da Pentaho (PPL,do inglês, Pentaho Public License). Uma cópia desta licença está disponível em http://www.pentaho.org/license.A PPL é similar à Licença Pública do Mozilla V1.1, com exceção de um atributo adicional.
Pentaho CE ou EE
Pentaho CE (Community Edition) = gratuita;Pentaho EE (Enterprise Edition) = paga;
Para realizar comparações entre as versões acesse:
http://www.pentaho.com/products/enterprise/enterprise_comparison.php
Clientes Pentaho
Os produtos da empresa Pentaho têm sido utilizados por organizações como:
Arquitetura BI
Fonte: Pentaho
Conexão com os diversos Bancos de
Dados
Apresentação das Ferramentas do
Pentaho
Kettle (ETL)
Também conhecido como PDI (Pentaho Data Integration); Realiza integração de dados entre empresas e sistemas; Lê e escreve mais de 10 formatos de SGBD, como Oracle, PostgreSQL, SQL Server, etc; Importa arquivos texto, excel e bases de dados; Responsável pelos processos de ETL.
Kettle (ETL)
Desenvolvido por profissionais que trabalharam em empresas como a Informatica e SAS; Comparavél com as ferramentas comerciais; Ambiente gráfico que possibilita a criação dos processos de ETL de forma visual.
Exemplo ETL
Cubo OLAP
Editor de TextoCube DesignerSchema Workbench
Mondrian
● Servidor OLAP (online analytical processing);● Open Source;● Escrito em Java;● Suporta consultas MDX (multidimensional
expressions);● EPL – Eclipse Public License;● Criado por Julian Hyde;● Adquirido pela Pentaho;
Cubo
Cubos OLAP
Cube Designer
Pivot Table/Drill Down
Schema Workbench
A dimensional model (logical)– Cubes & virtual cubes– Shared & private dimensions– Calculated measures in cube
and in query language– Parent-child hierarchies
… mapped onto a star/snowflake schema (physical)
– Fact table– Dimension tables– Joined by foreign key
relationships
Fonte: Apresentação Julian Hyde
Schema Mondrian
Exemplo Cubo
jPivot
jPivot
jPivot
Visões jPivot
jPivot
jPivot
Relatórios
Report DesignerJasperReportsBIRT
Report Designer
Também conhecido como PRD (Pentaho Report Designer); Auxilia na criação de relatórios; Muito parecido com outras ferramentas comerciais; Pode-se também utilizar o iReport para criar relatórios.
Relatórios
Eclipse Birt
Ad-Hoc Reporting
Report Designer
Jfreereport
• Utiliza-se para o desenvolvimento das xactions;
• Ferramenta baseada no Eclipse;• Pode ser usada como plug-in do Eclipse;
Design Studio
Data Mining
Weka
• Weka (Waikato Environment for Knowledge Analysis)
• Ferramenta de Data Mining criada em 1993 pela “University of Waikato” (Nova Zelândia);
• Desenvolvida em Java;• Recebe o SIGKDD Data Mining and
Knowledge Discovery Service Award em 2005;
• Em 2006 é comprada pela Pentaho;• GNU – General Public License.• Site: http://www.cs.waikato.ac.nz/ml/weka/
WEKA – Data Mining
WEKA
Weka na CPBR10
Oficina: Data Mining Weka na Campus Party 2010 pelos Campuseiros Ary Fagundes Bressane Neto (pesquisador de Inteligência Artificial) e Flávio Soares Corrêa da Silva (livre docente da USP)
Link da Oficina: http://blog.professorcoruja.com/2010/02/software-livre-oficina-data-mining-weka.html
Dashboards
Java / JSP / Javascript / ProgramaçãoCDF (Community Dashboard Framework)
CDF Dashboard Editor
Ferramenta web criada pela Comunidade (Pedro Alves e outros) para facilitar o desenvolvimento de dashboards.
Informações sobre o projeto:http://code.google.com/p/cdf-de/
Dashboards
Dashboards
Integração com oGoogle Maps
Pentaho Spreadsheet Services
Google Mantle Project
Dashboards
Dashboards
Dashboards
Dashboards
Dashboards
Conhecendo o Pentaho BI Server
Servidor Pentaho
Executa dentro de um Webserver com J2EE:
Apache Tomcat
JBOSS
Escolha do BD
A versão default do Pentaho vem pronta para execução, não existindo a necessidade de configuração do Banco de Dados com as tabelas do BI Server. Porém existe a possibilidade de alterar as configurações do hibernate para o Pentaho funcionar com outros bancos de dados como: MySQL, Oracle ou PostgreSQL.
Pentaho BI Server
PUC (Pentaho User Console)
Tradução PUC
http://blog.professorcoruja.com/2009/06/traducao-pentaho-bi-server-20-e-30-para.html
BI Mobile
BI Mobile
BI Mobile
BI Mobile
Comunidade
O Perfil da Comunidade Pentaho:
Empresas Públicas; Empresas Privadas; Universidades
Alunos de Graduação; Alunos de Pós-Graduação; Professores;
Quantos somos
● No Brasil há cerca de 1000 pessoas cadastradas nas listas de Pentaho e muitas outras que utilizam a ferramenta mas não fazem parte destas listas.
Como participamos
● Fórum de discussão da Pentaho (Oficial);● IRC;● Twitter;● Listas de discussão;● Blogs;● E-mails;● Encontros nacionais e internacionais.
Evento Internacional
Evento Internacional da Pentaho - Barcelona 2009
Obrigado
Caio Moreno de Souza
[email protected]@gmail.comtwitter.com/caiomsouza
http://blog.professorcoruja.com