projetjourdain.org — a database of data journalism
DESCRIPTION
Presentation of the website projetjourdain.org, that hosts the database of the jourdain project.TRANSCRIPT
La base de données du journalisme de données
Le site projetjourdain.org
mercredi 16 octobre 13
Prologue
mercredi 16 octobre 13
Une optique communicationelle
Technique Sémiotique
Social
« les sciences de l’information et de la communication n’étudient jamais la communication et l’information en elles-mêmes ou pour elles-mêmes, c’est-à-dire comme des êtres abstraits (elles seraient alors une idéologie), mais bien en tant qu’elles sont matérialisées, institutionnalisées et opérationalisées dans la société. » — Jean Davallon
mercredi 16 octobre 13
Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :
mercredi 16 octobre 13
Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :
• Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ?
mercredi 16 octobre 13
Une double articulationAnalyser le journalisme de données avec et par les outils du journalisme de données :
• Le journalisme de données comme phénomène : l’émergence d’une nouvelle conception de la profession journalistique ?• Le journalisme de données comme
processus : un système inédit de production de l’information journalistique ?
mercredi 16 octobre 13
Structure de la représentation
I. Le théâtre
II. Les coulisses
III. La mise en scène
mercredi 16 octobre 13
Le Théâtre
mercredi 16 octobre 13
Data ♥ JournalismA Love Story
Cours van Negotie, publié à Amsterdam depuis 1609
Exemple d’une feuille d’avis publiée en 1757
mercredi 16 octobre 13
Data ♥ JournalismA Love Story
La presse occidentale succombe à une fièvre statistique (tipsterism) à partir de 1830.
mercredi 16 octobre 13
Data ♥ JournalismA Love Story
Le Computer Assisted Reporting apparaît dès le début des années 1950 aux États-Unis.
mercredi 16 octobre 13
Des apports inéditsL’extension de la frontière professionnelle
C’est important que nous soyons assis dans la salle de rédaction. Le contenu de notre travail dépend habituellement de conversations en face-à-face avec les reporters. — Brian Boyer, The Data Journalism Handbook
mercredi 16 octobre 13
Des apports inéditsUne démocratisation des outils
Les journalistes peuvent aisément accéder à des outils jusqu’alors réservés aux professionnels : bases de données relationnelles, langages d’analyse statistique…
mercredi 16 octobre 13
Des apports inéditsUn nouveau regard critique
J’ai pris conscience, avec mes modestes moyens, de ce que les chercheurs en sciences sociales savent depuis fort longtemps : il n’y a pas plus de fait brut que de données brutes. — Simon Chignard
mercredi 16 octobre 13
Les Coulisses
mercredi 16 octobre 13
Construire la donnée
Une donnée « brute » ? Une donnée « construite »
≠mercredi 16 octobre 13
Rechercher les données
La phase la plus journalistique :
Recherche
mercredi 16 octobre 13
Rechercher les données
La phase la plus journalistique :
•Utilisation des procédés classiques du journalisme d’investigation
Recherche
mercredi 16 octobre 13
Rechercher les données
La phase la plus journalistique :
•Utilisation des procédés classiques du journalisme d’investigation
• Recours au croisement des sources existantes.
Recherche
mercredi 16 octobre 13
À ce jour, il n’existe aucun diplôme de datajournaliste.
En quête d’un critère…
mercredi 16 octobre 13
Recourir à des détours
mercredi 16 octobre 13
Le Data Journalism Handbook
Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.
mercredi 16 octobre 13
Le Data Journalism Handbook
Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.
mercredi 16 octobre 13
Le Data Journalism Handbook
Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.
mercredi 16 octobre 13
Le Data Journalism Handbook
Publié en 2012, The Data Journalism Handbook constitue la principale référence sur le data journalisme.
mercredi 16 octobre 13
Recueillir des données
Trois types de recueil :
Recueil
mercredi 16 octobre 13
Recueillir des données
Trois types de recueil :
• Réutilisation de jeux de données déjà formatés.
Recueil
mercredi 16 octobre 13
Recueillir des données
Trois types de recueil :
• Réutilisation de jeux de données déjà formatés.• Recueil manuel.
Recueil
mercredi 16 octobre 13
Recueillir des données
Trois types de recueil :
• Réutilisation de jeux de données déjà formatés.• Recueil manuel.
• Recueil automatisé (ou scraping)Recueil
mercredi 16 octobre 13
Le scraping
Exploiter l’architecture des pages web
mercredi 16 octobre 13
Utiliser un code d’extraction
Exemple de la bibliothèque BeautifulSoup de Python
mercredi 16 octobre 13
Le résultat final
mercredi 16 octobre 13
Classer les données
Classement
Phase très complexe :
mercredi 16 octobre 13
Classer les données
Classement
Phase très complexe :
•Définition d’un système de rangement adapté.
mercredi 16 octobre 13
Classer les données
Classement
Phase très complexe :
•Définition d’un système de rangement adapté.• Prise en compte des relations
élaborées entre les différents items
mercredi 16 octobre 13
Des relations élaborées
Le datajournalisme constitue un objet d’étude complexe :
•Une organisation peut employer plusieurs datajournalistes
•Un datajournaliste peut être (ou avoir été) employé par plusieurs institutions.
Many-to-many relationships
mercredi 16 octobre 13
Une architecture en trois dimensions
x
mercredi 16 octobre 13
Une architecture en trois dimensions
x
mercredi 16 octobre 13
Une architecture en trois dimensions
x
mercredi 16 octobre 13
Une architecture en trois dimensions
x
y
mercredi 16 octobre 13
Une architecture en trois dimensions
x
y
mercredi 16 octobre 13
Une architecture en trois dimensions
x
y
mercredi 16 octobre 13
Une architecture en trois dimensions
x
y
z
mercredi 16 octobre 13
Lier les bases
mercredi 16 octobre 13
TableNoms
TableOrganisations
Lier les bases
mercredi 16 octobre 13
Analyser la donnée
Analyse
Un tout autre regard : la pensée statistique
mercredi 16 octobre 13
Analyser la donnée
Analyse
Un tout autre regard : la pensée statistique
• Transformation des données en connaissances.
mercredi 16 octobre 13
Analyser la donnée
Analyse
Un tout autre regard : la pensée statistique
• Transformation des données en connaissances.
•Croisement d’outils mathématiques et de préceptes méthodologique.
mercredi 16 octobre 13
Visualiser
VisualiserÀ quoi sert une visualisation ?
mercredi 16 octobre 13
Visualiser
VisualiserÀ quoi sert une visualisation ?
• Création d’une représentation simple et circulante des résultats obtenus.
mercredi 16 octobre 13
Visualiser
VisualiserÀ quoi sert une visualisation ?
• Création d’une représentation simple et circulante des résultats obtenus.
• Percevoir des liaisons et relations passées inaperçues. La visualisation a une portée maïeutique.
mercredi 16 octobre 13
Les outilsSimplicité
Flexibilité
D3.JS
mercredi 16 octobre 13
Une polyphonie énonciative
Données (format JSON)
BibliothèqueInfovis
Formatage CSS Formatage HTML
Configurationinfovis
mercredi 16 octobre 13
Un exempleLes datajournalistes français
mercredi 16 octobre 13
Publier
PublierLes problématiques de la publication
mercredi 16 octobre 13
Publier
PublierLes problématiques de la publication
• Réinscription des résultats dans une nouvelle structure informationnelle
mercredi 16 octobre 13
Publier
PublierLes problématiques de la publication
• Réinscription des résultats dans une nouvelle structure informationnelle
• Retranscription vers un format lisible pour le site.
mercredi 16 octobre 13
La Scène
mercredi 16 octobre 13
Un projet de recherche
mercredi 16 octobre 13
Un projet de recherche
mercredi 16 octobre 13
Un projet de recherche
mercredi 16 octobre 13
Des jeux de données
mercredi 16 octobre 13
Des jeux de données
mercredi 16 octobre 13
Des jeux de données
mercredi 16 octobre 13
Des analyses composites
Croiser du texte, des jeux de données…
mercredi 16 octobre 13
Des analyses composites
…des cartes…
mercredi 16 octobre 13
Des analyses composites
et des schémas.
mercredi 16 octobre 13
Épilogue
mercredi 16 octobre 13