projetjourdain.org — a database of data journalism

68
La base de données du journalisme de données Le site projetjourdain.org mercredi 16 octobre 13

Upload: pierre-carl-langlais

Post on 01-Nov-2014

352 views

Category:

Education


0 download

DESCRIPTION

Presentation of the website projetjourdain.org, that hosts the database of the jourdain project.

TRANSCRIPT

Page 1: projetjourdain.org — A Database of Data Journalism

La base de données du journalisme de données

Le site projetjourdain.org

mercredi 16 octobre 13

Page 2: projetjourdain.org — A Database of Data Journalism

Prologue

mercredi 16 octobre 13

Page 3: projetjourdain.org — A Database of Data Journalism

Une optique communicationelle

Technique Sémiotique

Social

« les sciences de l’information et de la communication n’étudient jamais la communication et l’information en elles-mêmes ou pour elles-mêmes, c’est-à-dire comme des êtres abstraits (elles seraient alors une idéologie), mais bien en tant qu’elles sont matérialisées, institutionnalisées et opérationalisées dans la société. » — Jean Davallon

mercredi 16 octobre 13

Page 4: projetjourdain.org — A Database of Data Journalism

Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :

mercredi 16 octobre 13

Page 5: projetjourdain.org — A Database of Data Journalism

Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :

• Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ?

mercredi 16 octobre 13

Page 6: projetjourdain.org — A Database of Data Journalism

Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :

• Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ?• Le journalisme de données comme

processus : un système inédit de production de l’information journalistique ?

mercredi 16 octobre 13

Page 7: projetjourdain.org — A Database of Data Journalism

Structure de la représentation

I. Le théâtre

II. Les coulisses

III. La mise en scène

mercredi 16 octobre 13

Page 8: projetjourdain.org — A Database of Data Journalism

Le Théâtre

mercredi 16 octobre 13

Page 9: projetjourdain.org — A Database of Data Journalism

Data ♥ JournalismA Love Story

Cours van Negotie, publié à Amsterdam depuis 1609

Exemple d’une feuille d’avis publiée en 1757

mercredi 16 octobre 13

Page 10: projetjourdain.org — A Database of Data Journalism

Data ♥ JournalismA Love Story

La presse occidentale succombe à une fièvre statistique (tipsterism) à partir de 1830.

mercredi 16 octobre 13

Page 11: projetjourdain.org — A Database of Data Journalism

Data ♥ JournalismA Love Story

Le Computer Assisted Reporting apparaît dès le début des années 1950 aux États-Unis.

mercredi 16 octobre 13

Page 12: projetjourdain.org — A Database of Data Journalism

Des apports inéditsL’extension de la frontière professionnelle

C’est important que nous soyons assis dans la salle de rédaction. Le contenu de notre travail dépend habituellement de conversations en face-à-face avec les reporters. — Brian Boyer, The Data Journalism Handbook

mercredi 16 octobre 13

Page 13: projetjourdain.org — A Database of Data Journalism

Des apports inéditsUne démocratisation des outils

Les journalistes peuvent aisément accéder à des outils jusqu’alors réservés aux professionnels : bases de données relationnelles, langages d’analyse statistique…

mercredi 16 octobre 13

Page 14: projetjourdain.org — A Database of Data Journalism

Des apports inéditsUn nouveau regard critique

J’ai pris conscience, avec mes modestes moyens, de ce que les chercheurs en sciences sociales savent depuis fort longtemps : il n’y a pas plus de fait brut que de données brutes. — Simon Chignard

mercredi 16 octobre 13

Page 15: projetjourdain.org — A Database of Data Journalism

Les Coulisses

mercredi 16 octobre 13

Page 16: projetjourdain.org — A Database of Data Journalism

Construire la donnée

Une donnée « brute » ? Une donnée « construite »

≠mercredi 16 octobre 13

Page 17: projetjourdain.org — A Database of Data Journalism

Rechercher les données

La phase la plus journalistique :

Recherche

mercredi 16 octobre 13

Page 18: projetjourdain.org — A Database of Data Journalism

Rechercher les données

La phase la plus journalistique :

•Utilisation des procédés classiques du journalisme d’investigation

Recherche

mercredi 16 octobre 13

Page 19: projetjourdain.org — A Database of Data Journalism

Rechercher les données

La phase la plus journalistique :

•Utilisation des procédés classiques du journalisme d’investigation

• Recours au croisement des sources existantes.

Recherche

mercredi 16 octobre 13

Page 20: projetjourdain.org — A Database of Data Journalism

À ce jour, il n’existe aucun diplôme de datajournaliste.

En quête d’un critère…

mercredi 16 octobre 13

Page 21: projetjourdain.org — A Database of Data Journalism

Recourir à des détours

mercredi 16 octobre 13

Page 22: projetjourdain.org — A Database of Data Journalism

Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.

mercredi 16 octobre 13

Page 23: projetjourdain.org — A Database of Data Journalism

Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.

mercredi 16 octobre 13

Page 24: projetjourdain.org — A Database of Data Journalism

Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.

mercredi 16 octobre 13

Page 25: projetjourdain.org — A Database of Data Journalism

Le Data Journalism Handbook

Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.

mercredi 16 octobre 13

Page 26: projetjourdain.org — A Database of Data Journalism

Recueillir des données

Trois types de recueil :

Recueil

mercredi 16 octobre 13

Page 27: projetjourdain.org — A Database of Data Journalism

Recueillir des données

Trois types de recueil :

• Réutilisation de jeux de données déjà formatés.

Recueil

mercredi 16 octobre 13

Page 28: projetjourdain.org — A Database of Data Journalism

Recueillir des données

Trois types de recueil :

• Réutilisation de jeux de données déjà formatés.• Recueil manuel.

Recueil

mercredi 16 octobre 13

Page 29: projetjourdain.org — A Database of Data Journalism

Recueillir des données

Trois types de recueil :

• Réutilisation de jeux de données déjà formatés.• Recueil manuel.

• Recueil automatisé (ou scraping)Recueil

mercredi 16 octobre 13

Page 30: projetjourdain.org — A Database of Data Journalism

Le scraping

Exploiter l’architecture des pages web

mercredi 16 octobre 13

Page 31: projetjourdain.org — A Database of Data Journalism

Utiliser un code d’extraction

Exemple de la bibliothèque BeautifulSoup de Python

mercredi 16 octobre 13

Page 32: projetjourdain.org — A Database of Data Journalism

Le résultat final

mercredi 16 octobre 13

Page 33: projetjourdain.org — A Database of Data Journalism

Classer les données

Classement

Phase très complexe :

mercredi 16 octobre 13

Page 34: projetjourdain.org — A Database of Data Journalism

Classer les données

Classement

Phase très complexe :

•Définition d’un système de rangement adapté.

mercredi 16 octobre 13

Page 35: projetjourdain.org — A Database of Data Journalism

Classer les données

Classement

Phase très complexe :

•Définition d’un système de rangement adapté.• Prise en compte des relations

élaborées entre les différents items

mercredi 16 octobre 13

Page 36: projetjourdain.org — A Database of Data Journalism

Des relations élaborées

Le datajournalisme constitue un objet d’étude complexe :

•Une organisation peut employer plusieurs datajournalistes

•Un datajournaliste peut être (ou avoir été) employé par plusieurs institutions.

Many-to-many relationships

mercredi 16 octobre 13

Page 37: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

mercredi 16 octobre 13

Page 38: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

mercredi 16 octobre 13

Page 39: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

mercredi 16 octobre 13

Page 40: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

y

mercredi 16 octobre 13

Page 41: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

y

mercredi 16 octobre 13

Page 42: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

y

mercredi 16 octobre 13

Page 43: projetjourdain.org — A Database of Data Journalism

Une architecture en trois dimensions

x

y

z

mercredi 16 octobre 13

Page 44: projetjourdain.org — A Database of Data Journalism

Lier les bases

mercredi 16 octobre 13

Page 45: projetjourdain.org — A Database of Data Journalism

TableNoms

TableOrganisations

Lier les bases

mercredi 16 octobre 13

Page 46: projetjourdain.org — A Database of Data Journalism

Analyser la donnée

Analyse

Un tout autre regard : la pensée statistique

mercredi 16 octobre 13

Page 47: projetjourdain.org — A Database of Data Journalism

Analyser la donnée

Analyse

Un tout autre regard : la pensée statistique

• Transformation des données en connaissances.

mercredi 16 octobre 13

Page 48: projetjourdain.org — A Database of Data Journalism

Analyser la donnée

Analyse

Un tout autre regard : la pensée statistique

• Transformation des données en connaissances.

•Croisement d’outils mathématiques et de préceptes méthodologique.

mercredi 16 octobre 13

Page 49: projetjourdain.org — A Database of Data Journalism

Visualiser

VisualiserÀ quoi sert une visualisation ?

mercredi 16 octobre 13

Page 50: projetjourdain.org — A Database of Data Journalism

Visualiser

VisualiserÀ quoi sert une visualisation ?

• Création d’une représentation simple et circulante des résultats obtenus.

mercredi 16 octobre 13

Page 51: projetjourdain.org — A Database of Data Journalism

Visualiser

VisualiserÀ quoi sert une visualisation ?

• Création d’une représentation simple et circulante des résultats obtenus.

• Percevoir des liaisons et relations passées inaperçues. La visualisation a une portée maïeutique.

mercredi 16 octobre 13

Page 52: projetjourdain.org — A Database of Data Journalism

Les outilsSimplicité

Flexibilité

D3.JS

mercredi 16 octobre 13

Page 53: projetjourdain.org — A Database of Data Journalism

Une polyphonie énonciative

Données (format JSON)

BibliothèqueInfovis

Formatage CSS Formatage HTML

Configurationinfovis

mercredi 16 octobre 13

Page 54: projetjourdain.org — A Database of Data Journalism

Un exempleLes datajournalistes français

mercredi 16 octobre 13

Page 55: projetjourdain.org — A Database of Data Journalism

Publier

PublierLes problématiques de la publication

mercredi 16 octobre 13

Page 56: projetjourdain.org — A Database of Data Journalism

Publier

PublierLes problématiques de la publication

• Réinscription des résultats dans une nouvelle structure informationnelle

mercredi 16 octobre 13

Page 57: projetjourdain.org — A Database of Data Journalism

Publier

PublierLes problématiques de la publication

• Réinscription des résultats dans une nouvelle structure informationnelle

• Retranscription vers un format lisible pour le site.

mercredi 16 octobre 13

Page 58: projetjourdain.org — A Database of Data Journalism

La Scène

mercredi 16 octobre 13

Page 59: projetjourdain.org — A Database of Data Journalism

Un projet de recherche

mercredi 16 octobre 13

Page 60: projetjourdain.org — A Database of Data Journalism

Un projet de recherche

mercredi 16 octobre 13

Page 61: projetjourdain.org — A Database of Data Journalism

Un projet de recherche

mercredi 16 octobre 13

Page 62: projetjourdain.org — A Database of Data Journalism

Des jeux de données

mercredi 16 octobre 13

Page 63: projetjourdain.org — A Database of Data Journalism

Des jeux de données

mercredi 16 octobre 13

Page 64: projetjourdain.org — A Database of Data Journalism

Des jeux de données

mercredi 16 octobre 13

Page 65: projetjourdain.org — A Database of Data Journalism

Des analyses composites

Croiser du texte, des jeux de données…

mercredi 16 octobre 13

Page 66: projetjourdain.org — A Database of Data Journalism

Des analyses composites

…des cartes…

mercredi 16 octobre 13

Page 67: projetjourdain.org — A Database of Data Journalism

Des analyses composites

et des schémas.

mercredi 16 octobre 13

Page 68: projetjourdain.org — A Database of Data Journalism

Épilogue

mercredi 16 octobre 13