linux day 2009 - intelliware - ferrara
DESCRIPTION
business intelligence, pentaho, BI, linux day, 2009, FerraraTRANSCRIPT
![Page 1: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/1.jpg)
1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Strumenti Open Source per Data Mining e Business intelligence
Giacomo Gamberoni e Denis FerrarettiIntelliWARE, Ferrara
![Page 2: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/2.jpg)
2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
SommarioData Mining– Cos'è il Data Mining– Esempi e dataset– Tecniche– WEKA– Altri progetti
Business Intelligence– Scenario tipico– Dai dati alle decisioni– Architettura BI– Pentaho– Beekeper
![Page 3: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/3.jpg)
3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Cos'è il Data Mining
The non-trivial process of identifying– Valid– Novel– potentially useful, and– ultimately understandable patterns in data.
![Page 4: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/4.jpg)
4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Esempi di problemi
Distinguere mail/spam
Riconoscimento numeri scritti a mano
Valutazione usato auto
Distinguere categorie di geni (fori)
Analisi sondaggi elettorali
Analisi scontrini della spesa
Previsione abbandono clienti
Segmentazione visitatori
Valutazione afdabilità credito
![Page 5: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/5.jpg)
5Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
UCI Machine Learning Repository
![Page 6: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/6.jpg)
6Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
UCI Machine Learning Repository
![Page 7: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/7.jpg)
7Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Esempi di dataset
Market Basket
Customer 1: beer, pretzels, potato chips, aspirin
Customer 2: diapers, baby lotion, grapefruit juice,
baby food, milk
Customer 3: soda, potato chips, milk
Customer 4: soup, beer, milk, ice cream
Customer 5: soda, cofee, milk, bread
Customer 6: beer, potato chips
![Page 8: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/8.jpg)
8Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Tecniche di Data Mining
Pseudo-tecnica
Alberi decisionali
Regole associative
Clustering
![Page 9: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/9.jpg)
9Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Pseudo problema
![Page 10: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/10.jpg)
1 0Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Pseudo soluzione
IF salary<k then not repaid
kApproccio predittivo/descrittivo
![Page 11: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/11.jpg)
1 1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Alberi decisionali
![Page 12: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/12.jpg)
1 2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Valutazione della classifcazione
Si divide il dataset in due parti– Training set (per esempio 90% delle istanze)– Test set (per esempio 10% delle istanze)
Si usa il training set per apprendere l'albero e si testa il risultato usando le istanze del test set
Si compila la matrice di confusione
Esiste anche la 10-fold Cross Validation
![Page 13: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/13.jpg)
1 3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Clustering
Raggruppare gli elementi con caratteristiche simili
Attributi numerici
Non supervisionato (non c'è una classe defnita prima)
Algoritmi– K-means– Hierarchical
![Page 14: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/14.jpg)
1 4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Regole Associative
Si basa sul concetto di itemset (insieme di prodotti)– Supporto (frequenza in percentuale)
Regole tipo: x,y → z– Confdenza = supp(x,y,z)/supp(x,y)
Possibili regole trovate:– Latte → Pane (supporto 40%, confdenza 100%)– Latte, pane → Burro (supporto 40%, confdenza 50%)
Scontrino Latte Pane Burro Birra
1 1 1
2 1 1
3 1
4 1 1 1
5 1
Scontrino Prodotti
1 Latte, pane
2 Pane, burro
3 Birra
4 Latte, pane, burro
5 Pane
![Page 15: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/15.jpg)
1 5Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
WEKA: il software
Waikato Environment for Knowledge Analysis
Collezione di algoritmi allo stato dell'arte per Data Mining, implementato in Java– Rilasciato sotto licenza GPL
Supporto per l'intero processo di Data Mining sperimentale– Preparazione dei dati di input– Valutazione Statistica dei modelli appresi– Visualizzazione degli input e dei risultati
Usato per la didattica, la ricerca e le applicazioni
Complemento di “Data Mining” di Witten & Frank
![Page 16: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/16.jpg)
1 6Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Main Features
49 strumenti di preprocessing
76 algoritmi di classifcazione/regressione
8 algoritmi di clustering
3 algoritmi per le regole associative
15 attribute/subset evaluators
+ 10 algoritmi di ricerca per feature selection
3 interfacce grafche – “The Explorer” (exploratory data analysis)– “The Experimenter” (experimental environment)– “The KnowledgeFlow” (new process model inspired interface)
![Page 17: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/17.jpg)
1 7Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
C'era una volta...
![Page 18: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/18.jpg)
1 8Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Oggi:
![Page 19: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/19.jpg)
1 9Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Classifcatori
![Page 20: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/20.jpg)
2 0Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Alberi Decisionali
![Page 21: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/21.jpg)
2 1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Knowledge fow
![Page 22: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/22.jpg)
2 2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Experimenter
![Page 23: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/23.jpg)
2 3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Progetti che sfruttano WEKA
Rapid Miner (suite)
Gate (NLP)
GRB Tool Shed
Judge (Docs)
Pentaho
![Page 24: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/24.jpg)
2 4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
Bibliografa Data Mining
Data mining– Data Mining: Practical Machine Learning Tools and Techniques (2ed), Ian H. Witten, Eibe Frank,
Morgan Kaufmann, 2005– Machine Learning, Tom Mitchell, McGraw Hill, 1997.– http://www.kdnuggets.com/– http://www.cs.waikato.ac.nz/ml/weka/
Algoritmi– Quinlan, J. R. 1986 “Induction of Decision Trees” Mach. Learn. 1, 1 (Mar. 1986), 81-106.– Agrawal R, Imielinski T, Swami AN "Mining Association Rules between Sets of Items in Large
Databases." SIGMOD. June 1993, 22(2):207-16– MacQueen, J. B. 1967 "Some Methods for classifcation and Analysis of Multivariate
Observations", Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1:281-297
![Page 25: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/25.jpg)
2 5Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
uno scenario tipico...
...è quello di una grande azienda, con numerose fliali, i cui dirigenti desiderano quantifcare e valutare il contributo dato da ciascuna di esse al rendimento commerciale globale dell’impresa.
![Page 26: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/26.jpg)
2 6Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
uno scenario tipico...
...è quello di una grande azienda, con numerose fliali, i cui dirigenti desiderano quantifcare e valutare il contributo dato da ciascuna di esse al rendimento commerciale globale dell’impresa.
BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE
la business intelligence è un insieme di strumenti
e procedure che consentono a un'azienda
di trasformare i propri dati di business
in informazioni utili al processo decisionale, da rendere disponibili alla persona giusta e
nel formato idoneo
![Page 27: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/27.jpg)
2 7Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
dai dati alle informazioni
costituisce la materia prima che viene trasformata dai sistemi informativi, come i semilavorati vengono trasformati dai sistemi di produzione
la disponibilità di troppi dati rende difcile estrapolare le informazioni veramente importanti
DATI = INFORMAZIONIDATI = INFORMAZIONI
l'informazione è un bene a valore crescente, necessario per pianifcare e controllare le attività aziendali con efcacia
![Page 28: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/28.jpg)
2 8Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
la piramide della BI
![Page 29: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/29.jpg)
2 9Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
la piattaforma di BI
Si parla di piattaforma di BI poiché per consentire ai manager analisi potenti e fessibili è necessario defnire un’apposita infrastruttura hardware e software di supporto composta da:
● Hardware dedicato● Infrastrutture di rete● DBMS● Software di back-end● Software di front-end
![Page 30: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/30.jpg)
3 0Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
architettura di BI
![Page 31: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/31.jpg)
3 1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
le domande
“Che incassi sono stati registrati l’anno passato per ciascuna regione e ciascuna categoria di prodotto?”
“Che correlazione esiste tra l’andamento dei titoli azionari dei produttori di PC e i proftti trimestrali lungo gli ultimi 5 anni?”
“Quali sono gli ordini che massimizzano gli incassi?”
“Quale di due nuove terapie risulterà in una diminuzione della durata media di un ricovero?”
“Che rapporto c’è tra i proftti realizzati con spedizioni di meno di 10 elementi e quelli realizzati con spedizioni di più di 10 elementi?”
![Page 32: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/32.jpg)
3 2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
esempio di aree di utilità
Commercio – analisi delle vendite e dei reclami, controllo di spedizioni e
inventari, cura del rapporto con i clienti
Manifattura – controllo dei costi di produzione, supporto fornitori e ordini
Servizi fnanziari – analisi del rischio e delle carte di credito, rivelazione di frodi
Trasporti – gestione parco mezzi
Telecomunicazioni– analisi del fusso delle chiamate e del proflo dei clienti
Sanità – analisi di ricoveri e dimissioni, contabilità per centri di costo
![Page 33: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/33.jpg)
3 3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
tecniche di analisi dei dati
Una volta che i dati sono stati ripuliti, integrati e trasformati, occorre capire come trarne il massimo vantaggio informativo
Esistono in sostanza tre approcci diferenti, supportati da altrettante categorie di strumenti, all’interrogazione di un DW da parte degli utenti fnali:– OLAP: richiede all’utente di ragionare in modo
multidimensionale e di conoscere l’interfaccia dello strumento grafco utilizzato
– reportistica/dashboarding: non richiede conoscenze informatiche
– data mining: richiede una conoscenza specifca e tecnica (consulente)
![Page 34: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/34.jpg)
3 4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
strumenti: OLAP (On-Line Analytical Processing)
Analisi dei dati in tempo reale mediante interfacce user friendly
Dati organizzati in base al modello multidimensionale: i fatti di interesse sono rappresentati in cubi.
![Page 35: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/35.jpg)
3 5Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
OLAP: le gerarchie
![Page 36: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/36.jpg)
3 6Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
OLAP: le operazioni sui cubi
![Page 37: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/37.jpg)
3 7Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
OLAP: le operazioni sui cubi
Al manager di prodotto interessa la vendita di un prodotto in tutti i periodi e in tutti i mercati
Al manager regionale interessa la vendita dei prodotti in tutti i periodi nei propri mercati
![Page 38: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/38.jpg)
3 8Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
OLAP: le operazioni sui cubi
Al manager fnanziario interessa la vendita dei prodotti in tutti i mercati relativamente al periodo corrente e quello precedente
Il manager strategico si concentra su una categoria di prodotti, una area regionale e un orizzonte temporale medio
![Page 39: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/39.jpg)
3 9Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
strumenti: REPORTISTICA e DASHBOARDING
Possibilità di utilizzare un’unica sorgente dati integrata e consistente per realizzare la reportistica/dashboarding
Report sempre aggiornati
Possibilità di costruire una “visione d’insieme” in tempo reale
![Page 40: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/40.jpg)
4 0Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
strumenti: DATA MINING
Ofrono possibilità di analisi “superiori” e complementari rispetto a quelle ottenibili tramite i sistemi OLAP
Richiedono la presenza di “esperti” per scegliere/impostare/tarare/interpretare gli algoritmi impiegati
![Page 41: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/41.jpg)
4 1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO BI Suite
![Page 42: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/42.jpg)
4 2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO
Pentaho è un software open source commerciale per la Business Intelligence
Pentaho sviluppato a partire dal 2004
Pentaho comprende: reporting, OLAP analysis, dashboards, data integration (ETL), data mining e una piattaforma di BI.
Software Open Source
Ha una community per il supporto degli utenti
Multipiattaforma (Windows, Linux, Macintosh, Solaris, Unix,...)
![Page 43: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/43.jpg)
4 3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
modello di sviluppo BeekeeperJames Dixon, Pentaho Chief Technology Ofcer
le api sono libere di andarsene: l'apicoltore deve creare un ambiente bello e confortevole
i clienti non hanno niente a che fare con le api, vogliono solo il loro miele
la crescita dell'allevamento dipende da quanto miele/cera viene venduto, questo dipende in parte dalle capacità del venditore e in parte dalla quantità di miele disponibile
la quantità di miele dipende dal numero di api e questo dipende da quanto miele/cera viene lasciato alle api
![Page 44: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/44.jpg)
4 4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
software proprietario e software open source
![Page 45: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/45.jpg)
4 5Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
software commerciale open source
rispecchia il modello dell'apicoltore
include il modello proprietario e quello open
i clienti sono le aziende
![Page 46: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/46.jpg)
4 6Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO architettura
La Suite PENTAHO– BI Platform– Pentaho Dashboard– Report Designer– Mondrian (OLAP)– Kettle (ETL)– Weka (Data Mining)
Tutto sviluppato su piattaforma JAVA.
![Page 47: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/47.jpg)
4 7Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO
![Page 48: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/48.jpg)
4 8Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO Dashboard
Il servizio Dashboard di PENTAHO fornisce, all'utente business, le informazioni cruciali per migliorare le performance aziendali
Consente di avere un'immediata visione di insieme dei diversi aspetti aziendali attraverso la visualizzazione accattivante di metriche personalizzate
![Page 49: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/49.jpg)
4 9Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO Reporting
Consente l'accesso semplice, la formattazione e la divulgazione delle informazioni.
![Page 50: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/50.jpg)
5 0Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO Mondrian
Server Open Source OLAP
L'interfaccia web è JPivot
Esplorazione interattiva (slice-and-dice, drill-down) delle informazioni senza la necessità di conoscere linguaggi di query
![Page 51: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/51.jpg)
5 1Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO Kettle
Consente l'accesso, la pulizia e l'integrazione dei dati aziendali
Operazioni di estrazione, trasformazione e caricamento dei dati, attraverso un ambiente di progettazione grafco.
![Page 52: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/52.jpg)
5 2Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO Weka
...
![Page 53: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/53.jpg)
5 3Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
PENTAHO e oltre...
![Page 54: Linux Day 2009 - intelliWARE - Ferrara](https://reader033.vdocuments.mx/reader033/viewer/2022042816/55895220d8b42af20b8b4587/html5/thumbnails/54.jpg)
5 4Ferraretti D, Gamberoni G, Strumenti Open Source per Data Mining e Business Intelligence Ferrara, 2009-10-24 FLUG – Ferrara Linux User Group - www.ferrara.linux.it
GRAZIE PER L'ATTENZIONE
www.i-ware.it