big data : volume di dati livelli variabili di complessità generati a velocità differenti
DESCRIPTION
Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali. LE TRE V. Volume : gestione di moltissimi dati Velocità : gestione in tempo reale Varietà : fonti e tipologie diverse. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/1.jpg)
Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali
![Page 2: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/2.jpg)
LE TRE V
Volume: gestione di moltissimi dati
Velocità: gestione in tempo reale
Varietà: fonti e tipologie diverse
![Page 3: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/3.jpg)
DUE V IN PIÙ
Veridicità: attendibilità dei dati raccolti
Volatilità: tempo di validità dei dati
![Page 4: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/4.jpg)
PERCHÉ UTILIZZARE I BIG DATA
Opportunità di conoscenza Capire il mondo reale Opportunità commerciali
![Page 5: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/5.jpg)
DATI NON STRUTTURATI
Non possiedono un modello prestabilito Non sono organizzati Possono causare ambiguità Sono costituiti da:
› Testo› Audio› Video› Flussi di click› …
![Page 6: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/6.jpg)
RACCOLTA DI DATI ORDINARI
Raccolta di informazioni Classificazione in categorie prestabilite Organizzazione secondo uno schema preciso Memorizzazione fisica dei dati
![Page 7: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/7.jpg)
ELABORAZIONE DEI BIG DATA
Collezione e memorizzazione dei dati
Classificazione per categorie
Trasformazione dei dati
Generazione dei risultati trovati
![Page 8: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/8.jpg)
ANALISI DEI COMPORTAMENTI
SOCIALI
![Page 9: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/9.jpg)
ANALISI DEI SENTIMENTI
ASCOLTARE
CAPIRE
RIELABORARE
VISUALIZZARE
![Page 10: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/10.jpg)
HEDONOMETER
Script pattern matching:› individuare tokens› stabilire il pattern delle frequenze in un testo
Set di parole:› Google books› Twitter› Canzoni 1960/2007› New York Times 1987/2007
Grado di felicitá:› Amazon’s Mechanical Turk
http://www.hedonometer.org/index.html
![Page 11: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/11.jpg)
havg(T) = livello di felicitá della frase T
havg (wi) = felicitá di ciascuna parola
Fi = frequenza della i-esima parola
![Page 12: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/12.jpg)
TWITTER ANALYSIS
484 miloni di tweets 9.8 milioni di persone Luglio 2009 e Gennaio 2012 54 piú larghe cittá della Gran Bretagna
Parole cercate: PAURA, GIOIA, RABBIA, TRISTEZZA
PAPER: <<Big Data Analysis of News and Social Media Content>>Ilias Flaounas, Thomas Lansdall-Welfare, Nello Cristianini Intelligent Systems Laboratory, University of Bristol
![Page 13: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/13.jpg)
GRAFICO DELLA GIOIA
GRAFICO
DELLA RABBIA
TIMELINE GENERATE
![Page 14: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/14.jpg)
GRAFICO SETTIMANA
LE
GRAFICO GIORNALIER
O
PAPER: <<Temporal patterns of happiness in a global social network: Hedonometrics and Twitter>> P. Sheridan Dodds, K. Decker Harris, I. Kloumann, Center of complex systems of the university of Vermont
![Page 16: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/16.jpg)
LIMITAZIONI
AMBIGUITÁ SENSI MULTIPLI TONO SARCASMO SOPRANNOMI IMMAGINI
![Page 17: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/17.jpg)
CONSIDERAZIONI
«Il Big Data ha avuto un impatto nello studio del comportamento umano simile all’introduzione del microscopio o del telescopio nei campi della biologia e dell’astronomia»
Zeynep Tufekci “Big Questions for Social Media Big Data”
![Page 18: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/18.jpg)
BIG DATA E
LE AZIENDE
![Page 19: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/19.jpg)
BIG DATA vs MARKETING
Big Data aiutano a comprendere le dinamiche del proprio mercato di riferimento
Per riuscire a trarne il massimo bisogna sodisfare alcuni requisiti:› Nuova mentalità› Leadership› Team di ricerca› Gestione dei dati
![Page 20: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/20.jpg)
BIG DATA vs ROI
Big Data + Marketing = ROI enorme
¿RisultatoOperativo
Capitale investito nettooperatvo
![Page 21: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/21.jpg)
Perché le aziende ti conoscono
meglio della tua famiglia
Attraverso un’analisi dei dati il negozio Target è riuscito a scoprire che una ragazza era incinta, ancora prima che lo sapessero i suoi genitori.
Fedelity Card
Informazioni Personali
+Informazioni di
Vendita
Big Data
![Page 22: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/22.jpg)
AMAZON 152 milioni di conti cliente
Ricerche+
Acquisti+
Desideri
Big DataPubblicit
à
Amazon Web Services:• Raccolta• Archiviazione• Calcolo• Condivisione
![Page 23: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/23.jpg)
AMAZON CLOUD DRIVE
5 GB gratis 1.000 GB massimo 2 GB trasferimento massimo per file $ 0.50 per GB Online software Cloud Player
![Page 24: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/24.jpg)
SPEDIZIONE ANTICIPATA
Obiettivi: Restringere tempi di attesa Predire gli ordini del cliente
« Se non lo vuoi, te lo regaliamo! »
![Page 25: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/25.jpg)
SPEDIZIONE CON DRONIAmazon Prime Air:
15 KM massimo 2 KG massimo Spediti 30/60 minuti dall’ordine Ricevuti nella stessa giornata dell’ordine
![Page 26: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/26.jpg)
Servizi per: Utenti:
› Motore di ricerca› Chrome› Gmail
Aziende:› Pubblicità con testo› Pubblicità multimediale
![Page 27: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/27.jpg)
GOOGLE NOW OGGI
Schede: Traffico Meteo Sport Attività Appuntamenti
Trasporto pubblico Attrazioni nelle vicinanze Amici nelle vicinanze Notizie
![Page 28: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/28.jpg)
GOOGLE NOW DOMANI Salvataggio posizione parcheggio Conto alla rovescia Promemoria pagamento bollette
DATI GOOGLE NOW
Cronologia delle posizioni GPS Gmail Calendario Contatti Ricerche Google
![Page 29: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/29.jpg)
RICERCA TRAMITE IMMAGINE
Ricerca per: Trascinamento Caricamento URL Click su un’immagine Web
Risultati: Immagine stessa Immagini simili Siti web contenenti immagini
simili
![Page 30: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/30.jpg)
Caratteristiche: 80 lingue traduzione automatica statistica possibilità di cambiare il testo tradotto
scegliendo alternative da un elenco esistente
News: « Improve this translation »
![Page 31: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/31.jpg)
Google Translate : App
immissione vocale fotocamera scrittura a mano
libera modalità offline
![Page 32: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/32.jpg)
INFORMATION RETRIEVAL
Reperimento delle informazioni:È l'insieme delle tecniche utilizzate per gestire oggetti contenenti informazioni
![Page 33: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/33.jpg)
INFORMATION RETRIEVAL
Permette di:
Rappresentare Memorizzare Organizzare
![Page 34: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/34.jpg)
INFORMATION RETRIEVAL
Soddisfa: Il bisogno informativo
dell’utente
Gestistione: Ricerca di informazioni,
non di dati
Possibile restituzione di risultati non pertinenti
![Page 35: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/35.jpg)
È un movimento che promuove il non utilizzo del modello relazionale.
Identifica: un'ampia varietà di tecnologie legate ai database
Risponde: al crescente volume di dati memorizzati sulla Rete alle modalità e alla frequenza di accesso ai dati alla necessitá di performance e di potenza di
calcolo
![Page 36: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/36.jpg)
NOSQL I PUNTI DI FORZA
Scalabilitá
Prestazioni migliori
Schemi dinamici
Facile da utilizzare
Flessibile
![Page 37: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/37.jpg)
È un framework che supporta applicazioni distribuite con elevato accesso ai dati
Permette di lavorare con migliaia di nodi e petabyte di dati
![Page 38: Big Data : volume di dati livelli variabili di complessità generati a velocità differenti](https://reader035.vdocuments.mx/reader035/viewer/2022081516/56813cec550346895da697f7/html5/thumbnails/38.jpg)
Yahoo! è il più grande contributore a questo progetto
È usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter