data visualization - smals research · –fondamentaux graphiques géographique visual analytics...

184
Oct. 2015 - 1/184 Vandy BERTEN Section Recherche Data Visualization

Upload: others

Post on 11-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 1/184

Vandy BERTEN

Section Recherche

Data Visualization

Page 2: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 2/184

Table des matières

Introduction

Les fondamentaux

Choix de graphique

Visualisation géographique

Visual Analytics

Conclusions

Vandy Berten

Page 3: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 3/184

www.iStockphoto.com

Introduction

Page 4: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 4/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

x1 y1

10.0 8.04

8.0 6.95

13.0 7.58

9.0 8.81

11.0 8.33

14.0 9.96

6.0 7.24

4.0 4.26

12.0 10.84

7.0 4.82

5.0 5.68

Limites des statistiques (Anscombe)

x2 y2

10.0 9.14

8.0 8.14

13.0 8.74

9.0 8.77

11.0 9.26

14.0 8.10

6.0 6.13

4.0 3.10

12.0 9.13

7.0 7.26

5.0 4.74

x3 y3

10.0 7.46

8.0 6.77

13.0 12.74

9.0 7.11

11.0 7.81

14.0 8.84

6.0 6.08

4.0 5.39

12.0 8.15

7.0 6.42

5.0 5.73

x4 y4

8.0 6.58

8.0 5.76

8.0 7.71

8.0 8.84

8.0 8.47

8.0 7.04

8.0 5.25

19.0 12.50

8.0 5.56

8.0 7.91

8.0 6.89

Propriété Valeur

Moyenne des x 9.0

Variance des x 10.0

Moyenne des y 7.5

Variance des y 3.75

Corrélation entre les x et les y

0.816

Équation de la droite de régression linéaire

y = 3+0.5x

Somme des carrés des erreurs relativement à la moyenne

110.0

Page 5: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 5/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Limites des statistiques (Anscombe)

Cré

dit

s : W

ikip

edia

Page 6: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 6/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Satisfaction College Degrees No College degrees

Income/Age ≤50 >50 ≤50 >50

< 50,000$ 643 793 590 724

> 50,000$ 735 928 863 662

Limites de la cognition

• Est-ce que la satisfaction de tous les employés augmente avec l’âge ?

• Un groupe a-t-il un pattern différent des autres ?

Page 7: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 7/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Limites de la cognition

Ou

til :

Go

ogl

e C

har

t

Page 8: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 8/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Limites de la cognition

Ou

til :

Go

ogl

e C

har

t

Page 9: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 9/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Santé (John Snow, 1854)

Page 10: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 10/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démographie (H. Rosling, Gapminder)

Page 11: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 11/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data visualization : objectifs

Scie

nce

Ph

oto

Lib

rary

/Get

ty C

reat

ive

x y

10.0 8.04

8.0 6.95

13.0 7.58

9.0 8.81

11.0 8.33

14.0 9.96

6.0 7.24

4.0 4.26

12.0 10.84

7.0 4.82

5.0 5.68

Données Visualisation Information

Page 12: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 12/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data visualization : objectifs

Enregistrer de l’information

Communiquer des informations (visual explanation)

Analyser des données

(visual analytics, visual exploration)

Page 13: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 13/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Enregistrer de l’information

htt

p:/

/ww

w.d

atav

is.c

a/m

ilest

on

es/

Page 14: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 14/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Communiquer des informations

Page 15: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 15/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Analyser des données

Ou

til :

Tab

leau

So

ftw

are

Page 16: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 16/184 www.seas.harvard.edu

Les fondamentaux

Page 17: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 17/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outline

• Données :

– Classification par fonction (Mesure & dimension)

– Classification par nature (Quantitatif, qualificatif)

• Graphique :

– Éléments graphiques (sémiologie)

– Perception (Gestalt, processus pré-attentif)

• Qualité :

– Mesures de qualité

– Exemples

Page 18: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 18/184

MESURES & DIMENSIONS

Les fondamentaux

Page 19: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 19/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesures & Dimensions

Deux types d’informations :

« Les quantités que l’on veut mesurer » →

Mesure (quantitatif)

« Les choses que l’on veut suivre » →

Dimension (qualitatif/quantitatif) Ou

til :

Go

ogl

e C

har

t

Page 20: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 20/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesures & Dimensions

Mesures

La population

Le PIB

Le nombre de personnes

Les bénéfices et les pertes

Les marges

par

par

par

par

par

Dimensions

continent

pays

genre

date

trimestre et département

Page 21: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 21/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesures & Dimensions

Une mesure (Population)

Deux dimensions (année, continent)

Ou

til :

Go

ogl

e C

har

t

Page 22: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 22/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesures & Dimensions

Trois mesures : 1. Life Expectancy (x) 2. Fertility (y) 3. Population (taille)

Deux dimensions : 1. Pays (point) 2. Continent (couleur)

Ou

til :

Go

ogl

e C

har

t

Page 23: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 23/184

SCALE OF MEASUREMENT

Les fondamentaux

Page 24: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 24/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Scale of measurement (Stevens)

Id Name Breed Size Time Weight

123 Bobby Dog Big 10:00 12kg

456 Plume Cat Medium 05:00 3,5kg

789 Mickey Mouse Small 08:00 53g

012 Caroline Turtle Medium 04:00 24kg

Quantitatif Qualitatif

Nominal Ratio Ordinal Intervalle

Page 25: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 25/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Scale of measurement

Qualitative Quantitative

Nominal

No order

Ordinal

Intrinsic order

1r, 2d, 3e

Intervalle

Gap comparison Conventional zero

22°C

1/1/2011, 3:50

50°55’21,2’’

Ratio

Size comparison Intrinsic zero

22Kg

25 secondes

105€

Page 26: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 26/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Nominal : Dimension

Ou

til :

Go

ogl

e C

har

t

Page 27: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 27/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Nominal : Dimension

Ou

til :

Go

ogl

e C

har

t

Page 28: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 28/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Ordinal : Dimension

Ou

til :

Go

ogl

e C

har

t

Page 29: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 29/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Intervalle : dimension

Ou

til :

Go

ogl

e C

har

t

Page 30: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 30/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Scale of Measurement

Dimension Measure

Sort by Use Don’t use Use Don’t use

Qualitative

Nominal Alpha,

Measure

Bar, Pie, Scatter ,

Tree map Line Count

Average Median

Max Sum

Ordinal Intrinsic

order Bar, Line, Scatter

Pie Idem + Median

Max

Average Sum

Quantitative

Interval Value Bar, Line Pie Idem +

Average Sum

Ratio Value Bar, Line,

Histogram Pie

Idem + Sum

Insp

irat

ion

: H

. Cro

nst

röm

, Qlik

Page 31: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 31/184

SÉMIOLOGIE GRAPHIQUE

Les fondamentaux

Page 32: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 32/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique

• Quantitatives :

– Position

– Longueur

– Couleur

– Angle

– Orientation

– Surface

– Vitesse

• Qualitatives :

– Forme

– Couleur

– Texture

• Nombreuses façons de visualiser des valeurs

• Toutes n’ont pas la même efficacité

• Sémiologie : Science des signes

Page 33: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 33/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique : Position

• A, B et C sont alignés, distinguables

• A-B est deux fois plus long que B-C

A

B

C

Page 34: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 34/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique : Longueur

• Quelle est la plus longue barre (ratio : 9/10)?

Page 35: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 35/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique : Angle

• Quelle tranche est la plus grande ?

Page 36: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 36/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique : Surface

• Quelle est la plus grande surface (ratio : 9/10)

Page 37: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 37/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique : Couleur

0 10

Combien représentent ces boules :

Page 38: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 38/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique

Position

Longueur

Pente Angle

Surface

Intensité

Couleur Forme

Efficacité

Quantitative

Ordinal

Nominal

Plus adapté pour :

Page 39: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 39/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique

• En règle générale, on utilise plusieurs « canaux » dans un graphique

• On veillera à utiliser le canal le plus efficace pour l’information la plus importante !

Ou

til :

Qlik

Sen

se

Page 40: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 40/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique

• Éventuellement, duplication des canaux :

Ou

til :

Qlik

Sen

se

Page 41: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 41/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sémiologie graphique

• À éviter : canal « inutile »

Ou

til :

Qlik

Sen

se

Page 42: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 42/184

LOIS DE GESTALT

Les fondamentaux

Page 43: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 43/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Lois de Gestalt

• Gestalt : « Pattern » en allemand

• Émises par un groupe de psychologues allemands

• Elles décrivent comment le cerveau « complète » automatiquement tout ce qu’il perçoit

• Ces mécanismes permettent de comprendre un graphique

Page 44: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 44/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Closure

Fermeture : Terminaison des contours manquants

Cré

dit

s : H

ansp

eter

Pfi

ster

, Har

vard

Page 45: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 45/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Proximity

Proximité : regroupement des entités proches

Page 46: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 46/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Proximity

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

Mise en évidence des colonnes :

Mise en évidence des lignes :

Page 47: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 47/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws: Similarity

Similarité : regroupement des entités similaires

Page 48: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 48/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Proximity

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

Mise en évidence des colonnes :

Mise en évidence des lignes :

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

1 5 3 1 7

2 5 4 7 4

5 7 3 5 8

6 8 4 3 2

7 7 9 7 1

Page 49: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 49/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Continuity

Continuité : Construction sur base d’éléments lisses et continus

Page 50: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 50/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Gestalt Laws : Continuity

• À quoi est connecté A ?

[IV

]

A A

Page 51: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 51/184

PERCEPTION PRÉ-ATTENTIVE

Les fondamentaux

Page 52: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 52/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive

• Certains éléments sont identifiés « instantanément »

• Trouvez le 3 dans la série :

654649687454066865468784548768484686485257687684689897897554684568621357687861687196876868178676786876876714546

654649687454066865468784548768484686485257687684689897897554684568621357687861687196876868178676786876876714546

Page 53: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 53/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive : Couleur

Page 54: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 54/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive : Couleur

Page 55: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 55/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive : Forme

Page 56: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 56/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive : Combinaison

Page 57: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 57/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive

• On peut utiliser la perception pré-attentive pour mettre fortement un élément en évidence :

– Couleur (le plus efficace)

– Forme

– Orientation

– Taille

– …

• Une seule méthode à la fois !

Page 58: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 58/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perception pré-attentive

Ou

til :

Qlik

Sen

se

Page 59: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 59/184

MESURE DE QUALITÉ

Les fondamentaux

Page 60: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 60/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesure de qualité

Tufte a proposé 3 métriques pour mesurer la qualité d’un graphique :

• Lie Factor :

À quel point le graphique est fidèle aux données

• Data-ink factor :

À quel point l’encre est utilisée efficacement (et la distraction diminuée)

• Data density :

À quel point l’espace est utilisé efficacement

Page 61: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 61/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Lie Factor

5 − 1010

5 − 1010

=50%

50%= 1

2 − 1010

5 − 1010

=80%

50%= 1,6

Lie factor= size of effect in graphic

size of effect in data

Size of effect= 2d value −1st value

1st value

5

10

5

10

Page 62: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 62/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Lie Factor : Exemple

Data= 64−110

110= 41,8% Graphic=

12−35

35= 65,7%

35 12

Lie Factor =65,7%

41,8%= 1,57

Sncb

.be

Page 63: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 63/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Lie Factor : Exemple

Page 64: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 64/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Lie factor : Exemple

Données Graphique

1: Other 21,5% 3838 px

2: Apple 19,5% 6914 px -8% +80 % !

Lie Factor =80%

8%= 10

Page 65: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 65/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data-ink ratio

5

10

A B 0

10

A B 0

10

1 2 3 4 5 6 7 8 9

Data−ink ratio= Data−ink

Total ink in the graphic

= 1.0 − proportion of a graphic that can be erased without loss of data−information

Page 66: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 66/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data-ink ratio

• Principe : enlever ce qui ne contient pas d’info

• Éliminer tout ce qui pourrait distraire le lecteur (chart-junk, non-data ink, redundant data-ink) :

– Fond de couleur

– Grille trop dense, visible, épaisse

– Axe avec trop de « tics »…

– Effet d’ombre, 3D…

• Notion subjective ! Attention aux excès !

A B 0

10

5

10

A B 0

10

« Above else, show the data »

E. Tufte

Page 67: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 67/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data density

5

10

A B 0

10 a: 125 cm²

0

10

10 0

b: 80 cm²

Data density=

# entries in the data matrix

Area of data graphic

Page 68: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 68/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Pt x y coul form

1 10 6 B R

2 5 2 O R

3 8 5 O C … … … … …

40 1 1 B R

Data density

b: 80 cm²

Pt val

A 10

B 5

a: 125 cm²

DD𝑎= 2

125= 0,016 𝑑/𝑐𝑚²

DD𝑏= 40 × 4

80= 2 𝑑/𝑐𝑚²

Page 69: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 69/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Data density

• L’objectif n’est pas d’augmenter la densité à tout prix !

• Le graphique n’utilise-t-il pas une place inutile ?

• Un autre graphique peut-il représenter la même chose plus densément ?

• Un autre graphique peut-il représenter plus de données ?

• Qu’apporte le graphique par rapport à un simple tableau ?

0

10

10 0

Page 70: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 70/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Mesures de qualité : en pratique

• Viser un « lie factor » de 1

• Minimiser le « data-ink » ratio avec raison :

– Supprimer la « décoration » (3D, ombre, fond…)

– Limiter la redondance

• Maximiser la « data-density » sans perdre en lisibilité

Page 71: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 71/184

ERREURS & MANIPULATIONS

Les fondamentaux

Page 72: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 72/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Tronquer un axe, utiliser la perspective

Page 73: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 73/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Valeurs cumulatives

Val

eurs

?

Ventes meilleures là…

… ou là ?

Page 74: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 74/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Valeurs cumulatives

David Yanofsky

Page 75: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 75/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Le contraire

Luminance : Bush : 57% Obama: 84%

2007 2008 2009 2010

4 ans ?

≠ unemployment !

Page 76: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 76/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Le contraire

Soq

uel

by

de

Cre

ek

Page 77: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 77/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perspectives & 3D

Series 1

Series 2

Series 3

0

1

2

3

4

5

Series 1

Series 2

Series 3

Excel, « Histogramme 3D » par défaut

Valeur ? Comparaison ?

Comparaison ?

Ou

til :

Exc

el

Page 78: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 78/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perspectives & 3D

0

1

2

3

4

5

6

Category 1 Category 2 Category 3 Category 4

Series 1

Series 2

Series 3

Ou

til :

Exc

el

Page 79: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 79/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Perspectives & 3D

0

2

4

Series 1

0

2

4

Series 2

0

2

4

Series 3

« Small multiples » Ou

til :

Exc

el

Page 80: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 80/184

www.datameer.com

Choix des graphiques

Page 81: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 81/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Choix des graphiques

• Pas une science exacte !

• Dépend de beaucoup de paramètres

• Quelques guidelines peuvent aider

Key Value

A 8

B 1

C 7

D 4

E 3

Ou

til :

Go

ogl

e C

har

ts

Page 82: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 82/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Choix des graphiques

Comparaison Quelle province est la plus active ? Comment évolue le taux de chômage de 2014 à 2015 ?

Composition Comment les régions participent au résultat ? De quoi composé le budget de l’État ?

Corrélation Quel est le lien entre l’âge et répartition des genres ? La nationalité et le secteur ?

Distribution Quelle est la forme de la durée de chômage ? Combien de travailleurs par groupe d’âge ?

Page 83: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

COMPARAISON

Choix des graphiques

Page 84: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 84/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Comparaison C

om

par

aiso

n

Nominale

1Dim, 1Mes Bar chart

1Dim, 2Mes Bar chart

2Dim, 1Mes Grouped bar

chart

Temporelle

Few periods Bar chart (V)

Many periods Line chart

Cyclic Circular area

chart

Ou

til :

Go

ogl

e C

har

ts, H

igh

Ch

arts

Page 85: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 85/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Bar chart

1,5

2

2,5

3

3,5

4

4,5

Département 1

Département 2

Département 3

Département 4

Ou

til :

Exc

el

Page 86: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 86/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Bar chart

0

1

2

3

4

5

Variable qualitative

(nominale ou ordinale)

Perception : Longueur (2x plus long = 2x plus) Var. quantitative ratio Tronquer = tromper !

Ou

til :

Exc

el

Page 87: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 87/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Line chart

• Axe vertical :

– Ce que l’œil perçoit, c’est la position des points

– L’origine de l’axe n’a pas (peu) d’importance, peut être arbitraire… en étant « honnête »

• Axe horizontal : notion de continuité

– Les valeurs intermédiaires ont un sens

– Pas de variable nominale (rouge, vert, bleu…)

– Variable ordinale (petit, moyen, grand…) : à éviter

Page 88: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 88/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Line chart

0

50

100

150

200

250

0 1 2 3 4 5 6 7 8 9 10 11 12

Tension

Tension

Ou

til :

Exc

el

Page 89: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 89/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Line chart

213

214

215

216

217

218

219

220

221

222

223

0 1 2 3 4 5 6 7 8 9 10 11 12

Tension

Tension

Ou

til :

Exc

el

Page 90: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 90/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Line Chart

0

50

100

150

200

250

1 2 3 4 5 6 7 8 9 10 11 12

Nous

Concurrence

Ou

til :

Exc

el

Page 91: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 91/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Line Chart

198

200

202

204

206

208

210

212

1 2 3 4 5 6 7 8 9 10 11 12

Nous

Concurrence

Ou

til :

Exc

el

Page 92: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

COMPOSITION

Choix des graphiques

Page 93: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 93/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Composition

Co

mp

osi

tio

n

Nominale (statique)

1Dim, 1Mes Pie chart

1Dim, 2Mes Tree map

2 Dim, 1Mes

Stacked bar

1-2D, 1-2Mes

Water fall

Temporelle (évolutive)

Few periods Stacked Bar

Many periods

Stacked Line

Flux

Sankey

Chord

Ou

til :

Go

ogl

e C

har

ts, H

igh

Ch

arts

Page 94: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 94/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Pie Chart

• Avantages :

– Intuitif, facile à comprendre

– Donne une bonne vue d’ensemble de la composition : D+A ≈ B ≈ C

• Inconvénients :

– Peu précis ! A > D ? B > C ? A vs B

– Peu adapté au-delà de 3-4 tranches

Ou

til :

Go

ogl

e C

har

ts

Page 95: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 95/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Pie Chart

Ou

til :

Hig

hC

har

ts

Page 96: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 96/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Pie Chart vs Bar Chart

Ou

til :

Hig

hC

har

ts

Page 97: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 97/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Sun Burst

Ou

til :

Hig

hC

har

ts

Page 98: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 98/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Stacked line chart Données :

Ou

til :

Go

ogl

e C

har

ts

Page 99: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 99/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Stacked line chart Données :

Ou

til :

Go

ogl

e C

har

ts

Page 100: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 100/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Stacked line chart Données :

Ou

til :

Go

ogl

e C

har

ts

Page 101: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 101/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Stacked line chart

vari

abili

Données :

Ou

til :

Go

ogl

e C

har

ts

Page 102: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 102/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Diagramme de Sankey

ClientA

ClientB

ClientC

ClientD D

ept1

D

ept2

D

ept3

Glo

b R

ev.

IT

HR

Buildings

Ou

til :

San

keym

atic

Page 103: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 103/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Diagramme de Chord

htt

p:/

/ww

w.d

elim

ited

.io

Page 104: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 104/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Diagramme de Chord : migrations 2013

htt

p:/

/ww

w.a

lter

eco

plu

s.fr

Page 105: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

CORRÉLATION

Choix des graphiques

Page 106: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 106/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Corrélation C

orr

élat

ion

Quantitative

1Dim, 2Mes Scatter plot

1Dim, 3-4Mes Bubble chart

2 Dim, 2-3Mes Bubble chart

Qualitative

2Dim, 1Mes Heat map/Highlight

table

2Dim, 2 Mes Heat map

Ou

til :

Go

ogl

e C

har

ts, H

igh

Ch

arts

Page 107: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 107/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Bubble Chart

Données (test) :

Ou

til :

Qlik

Sen

se

Page 108: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

DISTRIBUTION

Choix des graphiques

Page 109: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 109/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Distribution D

istr

ibu

tio

n

Single variable

Percentiles Box

Few data Histogram

Many data Histogram

Two variables

Few data Scatter

Many data Heat map

Ou

til :

Go

ogl

e C

har

ts, H

igh

Ch

arts

Page 110: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

NOMBREUSES VARIABLES

Choix des graphiques

Page 111: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 111/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Small multiple

0

2

4

Series 1

0

2

4

Series 2

0

2

4

Series 3

Ou

til :

Exc

el

Page 112: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 112/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Matrix Plot

Val

eurs

d’u

ne

dim

ensi

on

A

Valeurs d’une dimension B

Ratio ♂/♀ Age

Données (test) :

Ou

til :

Go

ogl

e C

har

ts, Q

likSe

nse

Page 113: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 113/184

RÉSEAUX

Choix de graphiques

Page 114: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 114/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Réseaux

• Représentation d’entités (nœuds) + relations entre elles (arcs)

• Réseau social : personnes + liens d’amitié/intérêt

• Pages web + hyperliens

• Entreprises/Fournisseurs + liens contractuels

• Arbre généalogique

• Organigramme

• …

Page 115: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 115/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Réseaux : les misérables (V. Hugo)

Outil et données :

Page 116: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 116/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Réseaux : Entrepreneur – sous-traitant

Entrepreneur

Sous-traitant

Données :

Outil :

Page 117: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 117/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Questions ?

Page 118: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 118/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Pause !

Page 119: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

OUTILS

Choix des graphiques

Page 120: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 120/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils

• Outils avec interface « user-friendly », données déjà agrégées

– Composant d’une suite (Excel et autres suites bureautiques), souvent statique

– Outils spécialisés, en ligne, interactif

• Outils avec interface « user-friendly », données brutes

– Outils de type « visual analytics »

• Librairies :

– Javascript

– Python

– R (Shiny), gnuplot

Page 121: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 121/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

Page 122: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 122/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

Page 123: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 123/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

Page 124: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 124/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

Page 125: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 125/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

Page 126: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 126/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils spécialisés : infogr.am

• Version gratuite (10 infographies, tout public, cartes limitées, pas de live connections)

• Version « pro » à partir de 15$/mois

• Alternatives : plot.ly, chartblocks.com

Page 127: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 127/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies JavaScript

• De nombreuses librairies, pas toutes de la même qualité !

• Panoplie de graphiques ?

• Interactivité ? Tooltip ? Action sur clics ?

• Possibilité de zoom, de « save as » ?

• Facilité de paramétrisation ?

• Compatible AngularJS ou autre ?

• Open Source ? Extensible ?

• Taille de la librairie ?

• Prix ?

Page 128: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 128/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies javascript : D3

• « Data-Driven Documents »

• Librairie (gratuite) pour produire en « SVG »

• Permet de tracer des formes (carrés, cercles, lignes…), et de gérer des évènements

• Beaucoup d’exemples pour tout type de graphique

• Très puissant, mais très bas niveau

• À la base de beaucoup de librairies

Page 129: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 129/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies javascript : D3

<!DOCTYPE html> <meta charset="utf-8">

<style>

.bar { fill: steelblue; }

.bar:hover { fill: brown; }

.axis { font: 10px sans-serif; }

.axis path,

.axis line { fill: none; stroke: #000; shape-rendering: crispEdges; }

.x.axis path { display: none; }

</style>

<body>

<script src="https://cdnjs.cloudflare.com/ajax/libs/d3/3.5.5/d3.min.js"></script>

<script>

var margin = {top: 20, right: 20, bottom: 30, left: 40},

width = 960 - margin.left - margin.right,

height = 500 - margin.top - margin.bottom;

var x = d3.scale.ordinal() .rangeRoundBands([0, width], .1);

var y = d3.scale.linear() .range([height, 0]);

var xAxis = d3.svg.axis() .scale(x) .orient("bottom");

var yAxis = d3.svg.axis() .scale(y) .orient("left") .ticks(10, "%");

var svg = d3.select("body").append("svg")

.attr("width", width + margin.left + margin.right)

.attr("height", height + margin.top + margin.bottom)

.append("g")

.attr("transform", "translate(" + margin.left + "," + margin.top + ")");

d3.tsv("data.tsv", type, function(error, data) {

if (error) throw error;

x.domain(data.map(function(d) { return d.letter; }));

y.domain([0, d3.max(data, function(d) { return d.frequency; })]);

svg.append("g")

.attr("class", "x axis")

.attr("transform", "translate(0," + height + ")")

.call(xAxis);

svg.append("g") .attr("class", "y axis")

.call(yAxis)

.append("text")

.attr("transform", "rotate(-90)")

.attr("y", 6)

.attr("dy", ".71em")

.style("text-anchor", "end")

.text("Frequency");

svg.selectAll(".bar")

.data(data)

.enter()

.append("rect")

.attr("class", "bar")

.attr("x", function(d) { return x(d.letter); })

.attr("width", x.rangeBand())

.attr("y", function(d) { return y(d.frequency); })

.attr("height", function(d) { return height - y(d.frequency); }); });

function type(d) { d.frequency = +d.frequency; return d; } </script>

letter frequency

A .08167

B .01492

C .02782

D .04253

E .12702

F .02288

G .02015

....

htt

p:/

/bl.o

cks.

org

/mb

ost

ock

/38

85

30

4

Page 130: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 130/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies javascript : D3

Page 131: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 131/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

NVD3

<div id="chart"> <svg></svg></div>

<script>

data = [{ values: [ {x: "A", y: .8167 }, {x: "B", y: .1492 }, {x: "C", y: .2782 }, {x: "D", y: .4253 }, {x: "E", y: 1.2702 }, {x: "F", y: .2288 }, {x: "G", y: .2015 }]}];

nv.addGraph(function() {

var chart = nv.models.discreteBarChart();

d3.select('#chart svg')

.datum(data)

.call(chart);

nv.utils.windowResize(chart.update);

return chart;

});

</script> Autre lib. basée sur D3: C3.js

Page 132: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 132/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Google Charts

<script type="text/javascript">

google.load("visualization", "1", {packages:["corechart"]});

google.setOnLoadCallback(drawChart);

function drawChart() {

var data = google.visualization.arrayToDataTable([ ['Letter', 'Frequency'], ["A",.8167 ], ["B",.1492 ], ["C",.2782 ], ["D",.4253 ], ["E",1.2702], ["F",.2288 ], ["G",.2015 ]]);

var div = document.getElementById('chart_div');

var chart = new google.visualization.ColumnChart(div);

chart.draw(data);

}

</script>

<div id="chart" style="width: 100%; height: 100%;"></div>

Page 133: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 133/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies javascript : HighCharts

• Librairie payante, gratuite pour usage « non commercial »

• Très grand nombre de visualisations (y compris cartes)

• Cartes : pays du monde, provinces belges (+ GeoJSON)

• Mobile ready (pinch-to-zoom…)

• OpenSource

Page 134: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 134/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Librairies javascript : AmCharts

• Librairie payante, gratuit avec « watermark »

• Niveau similaire à HighCharts

• Source « minifié »

Page 135: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 135/184

Visualisation géographique

Page 136: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 136/184

TYPES DE VISUALISATION

Visualisation géographique

Page 137: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 137/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Point & bubble

• Nécessite les coordonnées géographiques

Données :

Ou

til :

Qlik

Sen

se

Page 138: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 138/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Point & bubble

• Couleur : dimension (couleur discrète) ou mesure (couleur continue)

Données :

Ou

til :

Qlik

Sen

se

Page 139: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 139/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Carte choroplèthe

QlikSense

Données (test) :

Ou

til :

Qlik

Sen

se

Page 140: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 140/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Carte choroplèthe

PIB/habitant

Ou

til :

Tab

leau

Page 141: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 141/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Carte choroplèthe

Ou

til :

Tab

leau

Page 142: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 142/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Heatmap

Ou

til :

Car

toD

B

Données :

Page 143: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 143/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Carte isoplèthe

• Carte isoplèthe : relie par une courbe tous les points possédant une même caractéristique

• Isochrone : même temps de trajet

• Isotherme : même température

• Isobare : même pression atmosphérique

• Isohypse : même altitude

Page 144: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 144/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Carte isochrone

http://emptypipes.org/supp/isochrone_brussels/

Page 145: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 145/184

GÉOCODAGE

Visualisation géographique

Page 146: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 146/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage

• Géocodage : transformation d’une adresse en coordonnées géographiques

• Utilité :

– Visualisation

– Détection de doublons/fraudes/…

– Détection d’erreur/data quality

• Nombreuses API gratuites (limitées) et commerciales, faciles d’utilisation

Page 147: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 147/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Types de données

• Coordonnées :

– degré-minute-seconde : 50°50'10.1"N, 4°20'17.8"E

– décimales : 50.8361263, 4.3382716

– OK pour carte bubble, heatmap

• Adresse : Avenue Fonsny 20, 1060 Saint-Gilles

– Souvent des problèmes de data quality

– Nécessite un « géocodage », difficile « on-site »

– Pas d’adresse pour une borne d’autoroute, une forêt…

– OK pour carte bubble, heatmap

• Entité : Bruxelles, Belgique, 1160, Hal-Vilvorde…

– Table « entité – frontière – centre » facile à connaitre

– OK pour carte bubble (centre) choroplèthe (frontières)

Page 148: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 148/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage : Google Maps

• Avenue Fonsny 20, 1060 Bruxelles :

• http://maps.googleapis.com/maps/api/geocode/json?sensor=false&address=Avenue%20Fonsy%2020,%201060%20Bruxelles

{

"results" : [

{

"address_components" : [

{

"long_name" : "20",

"short_name" : "20",

"types" : [ "street_number" ]

},

{

"long_name" : "Avenue Fonsny",

"short_name" : "Avenue Fonsny",

"types" : [ "route" ]

},

{

"long_name" : "Sint-Gillis",

"short_name" : "Sint-Gillis",

"types" : [ "locality", "political" ]

},

{

"long_name" : "Brussel",

"short_name" : "Brussel",

"types" : [ "administrative_area_level_1",

"political" ]

},

{

"long_name" : "Belgique",

"short_name" : "BE",

"types" : [ "country", "political" ]

},

{

"long_name" : "1060",

"short_name" : "1060",

"types" : [ "postal_code" ]

}

],

"formatted_address" : "Avenue Fonsny 20, 1060 Sint-Gillis, Belgique",

"geometry" : {

"bounds" : {

"northeast" : {

"lat" : 50.83613219999999,

"lng" : 4.3385958

},

"southwest" : {

"lat" : 50.83612489999999,

"lng" : 4.338581500000001

}

},

"location" : {

"lat" : 50.83612489999999,

"lng" : 4.3385958

},

"location_type" : "RANGE_INTERPOLATED",

"viewport" : {

"northeast" : {

"lat" : 50.83747753029149,

"lng" : 4.339937630291503

},

"southwest" : {

"lat" : 50.83477956970849,

"lng" : 4.337239669708499

}

}

},

"partial_match" : true,

"place_id" :

"EitBdmVudWUgRm9uc255IDIwLCAxMDYwIF

NpbnQtR2lsbGlzLCBCZWxnacOr",

"types" : [ "street_address" ]

}

],

"status" : "OK"

}

Page 149: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 149/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage : Google Maps

Adresse standardisée

{ "long_name" : "20", "types" : [ "street_number" ]},

{ "long_name" : "Avenue Fonsny", "types" : [ "route" ]},

{ "long_name" : "Sint-Gillis", "types" : [ "locality", "political" ]},

{ "long_name" : "Brussel",

"types" : [ "administrative_area_level_1", "political" ]},

{ "long_name" : "Belgique", "types" : [ "country", "political" ]},

{ "long_name" : "1060", "types" : [ "postal_code" ]},

"formatted_address" : "Avenue Fonsny 20, 1060 Sint-Gillis, Belgique"

Géometrie

"geometry" : {

"bounds" : {

"northeast" : { "lat" : 50.83613219, "lng" : 4.3385958 },

"southwest" : { "lat" : 50.83612489, "lng" : 4.3385815}

},

"location" : {"lat" : 50.83612489, "lng" : 4.3385958 }

Précision

"location_type" : "RANGE_INTERPOLATED"

"status" : "OK"

Page 150: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 150/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage

Page 151: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 151/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage : comparaison

• Comparaison de services : difficile !

• Littérature : dataset d’adresses/coordonnées connues -> difficile à établir, forcément tronqué

• Alternative : comparer les réponses de 7 API

• Voir s’il y a consensus :

• Dataset : 10,000 adresses aléatoires de la CBE (KBO), Belgique (98,4%) + étranger

Mauvaise réponse ?

Page 152: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 152/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocoding : comparaison

Données :

Page 153: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 153/184

OUTILS

Visualisation géographique

Page 154: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 154/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Visualisation (gratuits)

• Google Fusion Table (Google Drive)

– Points map/heatmap + géocodage

– Choroplèthes

– Permet de fusionner (« join ») des tables

• CartoDB

– Géocodage d’adresses limité (100/mois)

– Géocodage de villes non limité

– De nombreux types de cartes, fusion de tables, filtres SQL…

• QlikView/QlikSense : point & choroplèthe

• Tableau public

– Géocodage des villes

– Bloqué par le firewall de Smals

Page 155: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 155/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Géocodage

• API :

– Google Maps (2500/j)

– OpenStreetMap (usage policy: « no heavy use »)

– Bing (Microsoft, 30.000/j)

– Here (Nokia, 100.000/m)

– IGN (Beta)

• Web interface (batch) :

– Google Fusion Table (~2/sec)

– CartoDB (100/mois, 1/sec)

– BatchGeo (par 250, ~0.5/sec)

– EasyMapMaker (~1/s), cut&paste

Page 156: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 156/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Chez Smals

• DDT/Checkin@Work :

– ESRI/ArcGIS : manipulation, interface,

– IGN : Visualisation

– Here (Nokia) : géocodage

• SMUREG/MEDEGA (SPF SP) :

– TeleAtlas (TomTom)

– RealDolmen

Page 157: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 157/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo CartoDB

Page 158: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 158/184

Visual Analytics

Page 159: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 159/184

DÉFINITIONS

Visual Analytics

Page 160: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 160/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Visual Analytics : définition

« Visual analytics is the science of analytical reasoning facilitated by interactive visual

interfaces »*

Approche combinant :

• Visualisation (dataviz, sciviz, comp. graphics…)

• Interaction (H-C interaction, cognitive psychology, perception…)

• Data analysis (Information retrieval, data mining, information/geospatial/scientific/statistical analytics…)

*[ITP]

Page 161: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 161/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Objectifs

• Synthétiser l’information et en tirer une intuition (insight) de données massives, dynamiques, ambigües et souvent contradictoires

• Détecter l’attendu, découvrir l’inattendu

• Fournir des évaluations en temps voulu, défendable et compréhensible

• Communiquer ces évaluations efficacement pour action

[MIA]

Page 162: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 162/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Visual Analytics Process

[MIA]

Page 163: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 163/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Domaines

[MIA]

Page 164: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 164/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Domaines

• Visualisation

– Visualisation scientifique (Sciviz) : visualisation multi-D d’entités physiques (météo, biologie, chimie, ingénierie…)

– Visualisation de données (Dataviz) : visualisation de données « abstraites » (démographie, business, mesures, texte…)

– Visualisations plus complexes que pour le grand public

• Data management

– Hétérogénéité sources (DB, fichiers, page web, streams, texte…) et types (format)

– Big Data

– Data quality

Page 165: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 165/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Domaines

• Data Mining

– Extraction automatique d’information de valeur

– « Supervised learning » : extraction basée sur des échantillons connus

– « Unsupervised learning » : extraction sans connaissance préalable

• Spatio-temporal Data Analysis

– Les données spatiales et les données temporelles requièrent des techniques particulières

– La combinaison (données spatio-temporelle) augmente la complexité

Page 166: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 166/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Domaines

• Perception & Cognition

– Perception : Interprétation de l’environnement (5 sens)

– Cognition : capacité de comprendre (basée sur l’apprentissage)

• Infrastructure

– Liaison des différents processus et technologies, souvent incompatibles

• Évaluation

Page 167: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 167/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Données brutes

• Libraires graphiques :

• Outils Visual Analytics :

Id Key

1 X1

2 X2

3 X1

4 X3

5 X2

Javascript

Key Attr

X1 A

X2 C

X3 B

Key Value

A 8

B 1

C 7

D 4

E 3

SELECT Attr, COUNT (Id) FROM … LEFT JOIN …

GROUP BY Attr

Page 168: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 168/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

In-Memory

Live In-Memory

Principe Connexion à la source pour chaque affichage

Extract local de ce qui est nécessaire au dashboard

Requêtes Sur la source Localement

Mises à jour Permanentes Manuelles/programmées

Vitesse Plus lent Plus rapide

Problème si Source pas efficace (fichier CSV…)

Très gros volume (big data)

Hybride : certaines sources live, d’autre in-memory

Page 169: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 169/184

OUTILS

Visual Analytics

Page 170: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 171/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Outils

DB

CSV

Web

SELECT … FROM

var x = obj.add (…)

Reporting/ Dashboard IT

Power user

End user

Page 171: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 172/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Tableau Software

• Créé par Pixar

• Gartner :

– Tableau's intuitive, visual-based data discovery capabilities have transformed business users' expectations about what they can discover […]

• Life ou In-Memory

• Méthodes statistiques, forecast, trendlines

• Choix des dimensions, suggestion de graphique

• Tableau Public : version gratuite, tout en ligne, données publiques (bloqué par le FW :-s )

• Uniquement Drag&Drop

Page 172: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 173/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Qlik

• Anciennement « Quik » (1993)

• QlikView :

– Gartner: « … mature, self-contained, […] used by IT or more technical users for building intuitive and interactive dashboard applications […]”

– Personal Edition: gratuit, pas de partage

• QlikSense (Gratuit)

– « Self-service BI »

• In-Memory (ou hybride « direct query »)

• Discovery & Reporting, peu de data analytics

• Choix du graphique puis des dimensions

• Beaucoup d’extensions (QlikMaps…)

• Drag&Drop ou Script

Page 173: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 174/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Use cases Qlik & Tableau

Qlik Tableau

Usage gratuit

- QlikSense (Partage via « Qlik Cloud » ou par envoi des fichiers)

- QlikView Personal Ed. (Pas de partage)

Tableau Public : Client desktop, données publiques sur un cloud

Usage interne

- Named User Licence + partage fichiers

- QlikView Server : - Small Business Ed. (≤25 users) - Enterprise Edition

Tableau Server + Tableau Desktop + Tableau Reader (gratuit)

Usage public QlikView Server EE + Information Access Server

Tableau Server (Lic. CPU)

Page 174: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 175/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

IBM Watson Analytics

Page 175: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 176/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

IBM Watson Analytics

Page 176: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 177/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo Qlik Sense

• Contexte : données anonymisées de l’ONSS

• On a une liste de chantiers avec pour chacun :

– L’entrepreneur

– Les sous-traitants (+ pays)

– L’adresse

– Un score de « risque de fraude »

• On géocode les adresses (API Google Maps)

• On croise avec des données de la poste (CP > Commune > Arrondissement > Province > Région) + des données géographiques (contours)

Page 177: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 178/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo – schéma de données

Chantiers

Id

ZipCode

Entrepreneur

Sous-traitant

Pays

Adresse

Latitude, Longitude

Zip

ZipCode

Commune

KML_commune

Commune

Contours

KML_prov

Province

Contours

Commune

Commune

Arrondissement

Arrond

Arrondissement

Province

KML_arrond

Arrondissement

Contours

OpenSource

Page 178: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 179/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo

Page 179: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 180/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo Tableau

• Contexte : déclaration DIMONA

• Données « brutes »

• 3 uses cases :

– Compréhension des données

– Détection de problèmes de qualité

– Détection de cas « suspects »

Page 180: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 181/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Démo Tableau

Period

Period ID

Timestamp

Date IN

Date OUT

Employer ID

Worker ID

Com. Paritaire

Type

Worker

Worker ID

Firstname

Gender

Nationality

Declaration_Historic

Timestamp

Period ID

Date IN

Date OUT

Page 181: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 182/184 socialstrand.com

Conclusions

infocux

Page 182: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 183/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Conclusions

Visual Analytics = dataviz par le business

Visualisation = données →

information/connaissance

Très facile de faire une mauvaise

visualisation, même avec un bon outil !

Complémentaire à d’autres techniques

d’analyse (statistiques, data

mining/analytics…)

Page 183: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 184/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Vandy Berten 02/787.57.32 [email protected]

More on Smals Research : Website : www.smals.be

Blog : www.smalsresearch.be Twitter : @SmalsResearch

Page 184: Data Visualization - Smals Research · –Fondamentaux Graphiques Géographique Visual Analytics Oct. 2015 -Intro 11/184 Data visualization : objectifs y e x y 10.0 8.04 8.0 6.95

Oct. 2015 - 185/184 Intro – Fondamentaux – Graphiques – – Géographique – Visual Analytics

Bibliographie

• [MIA] « Mastering the Information Age, Solving Problems with Visual Analytics », D. Keim, J. Kohlhammer, G. Ellis and F. Mansmann, Goslar, Germany, 2010 (http://www.vismaster.eu)

• [VDQI] « The Visual Display of Quantative Information »

• [SMTN] « Show Me the Numbers »

• [ITP] « Illuminating the Path, The Research and Development Agenda for Visual Analytics », J. J. Thomas, K. A. Cook

• [IV] « Information Visualisation, Perception for Design », C. Ware