2013 bibnum ebd

90
numérisation et bibliothèque numérique Luc Bellier, BnF École de bibliothécaires documentalistes, Septembre- Octobre 2013

Upload: luc-bellier

Post on 11-May-2015

665 views

Category:

Education


2 download

DESCRIPTION

bibliothèque numérique, numérisation, formation à destination des étudiants de 1° année à l'Ecole des bibliothécaires et documentalistes (ebd.fr)

TRANSCRIPT

Page 1: 2013 bibnum ebd

numérisation et bibliothèque numérique

Luc Bellier, BnF

École de bibliothécaires documentalistes, Septembre-Octobre 2013

Page 2: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique Objectif : appréhender les différents composant le document

numérique Télécharger un document PDF sur Gallica

http://gallica.bnf.fr/ark:/12148/bpt6k145269m Le manipuler (mode texte et mode image, appréhender les méta-

données et les qualifier) Consulter le document sur Gallica et retrouver les éléments du

document numérique Télécharger un ePub et le manipuler retrouver les mêmes éléments

(http://fr.feedbooks.com/book/16/bel-ami ou http://gallica.bnf.fr/ark:/12148/bpt6k145269m)

A la maison : consulter un document sur Google Books, athi trust ou autre et décrire les services proposés par la bibliothèque numérique

Prendre quelques images et les passer à l’OCR (presse, patrimonial, illustré, moderne) => préparer le dossier avec images concernées

Page 3: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique•TéléchargerPDF

•Trouver le mode texte•Télécharger l’ePub•Changer le .ePub en .zip•Ouvrir le dossier

Page 4: 2013 bibnum ebd

•Le titre = métadonnées descriptives•Les pages = métadonnées de structure

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 5: 2013 bibnum ebd

•?

•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux

•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document

•donner accès à la copie numérique / électronique

• identifiant unique (localisation / identification)

•Métadonnées de structure

•rattacher les fichiers entre eux

•reconstituer la structure du document

•Métadonnées administratives

•gérer la collection, c’est-à-dire

•gérer les droits d’accès

•préserver les informations techniques nécessaires à la lecture des fichiers

•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications

•LesLes métadonnéesmétadonnées

Page 6: 2013 bibnum ebd

•Le contenu d’un ePub

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 7: 2013 bibnum ebd

•Le manifeste *.opf

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 8: 2013 bibnum ebd

•Toc.ncx

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 9: 2013 bibnum ebd

Produire et décrire le Produire et décrire le document numériquedocument numérique

» Le cas des livres numériques ePub

•Métadonnées•Descriptives?

Métadonnées de structure ?

•OPF

•XH

TML

•JPG

•NC

X

Page 10: 2013 bibnum ebd

•?

•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux

•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document

•donner accès à la copie numérique / électronique

• identifiant unique (localisation / identification)

•Métadonnées de structure

•rattacher les fichiers entre eux

•reconstituer la structure du document

•Métadonnées administratives

•gérer la collection, c’est-à-dire

•gérer les droits d’accès

•préserver les informations techniques nécessaires à la lecture des fichiers

•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications

•LesLes métadonnéesmétadonnées

Page 11: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 12: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 13: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 14: 2013 bibnum ebd

Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document

numériquenumérique

Page 15: 2013 bibnum ebd

Fiche à faire à la Fiche à faire à la maisonmaison

À compléter et à envoyer à [email protected]

Présentation du site Nom de la bibliothèque numérique Nom de l’institution éditrice

Présentation des collections Nature des collections proposées par la bibliothèque Quantité estimée des documents Autres informations

Services proposés par la bibliothèque numérique Quels accès aux documents ? Quels type de lecture est proposée ? Autres informations

Page 16: 2013 bibnum ebd

•?

•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux

•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document

•donner accès à la copie numérique / électronique

• identifiant unique (localisation / identification)

•Métadonnées de structure

•rattacher les fichiers entre eux

•reconstituer la structure du document

•Métadonnées administratives

•gérer la collection, c’est-à-dire

•gérer les droits d’accès

•préserver les informations techniques nécessaires à la lecture des fichiers

•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications

•LesLes métadonnéesmétadonnées

Page 17: 2013 bibnum ebd
Page 18: 2013 bibnum ebd
Page 19: 2013 bibnum ebd

Qu’est-ce qu’une bibliothèque numérique?

Luc Bellier, BnF

École de bibliothécaires documentalistes, octobre-novembre 2010

Page 20: 2013 bibnum ebd

PlanPlan

Qu’est-ce qu’une bibliothèque numérique?

Des collections de documents Sélectionner Numériser Décrire et organiser Conserver et stocker

Un espace

Des publics

Des services

Page 21: 2013 bibnum ebd

Qu’est-ce qu’une bibliothèque?Qu’est-ce qu’une bibliothèque?

des livres(sélectionnés et classés)

un espace…

des outils de référence

un publicdes publics…

…qui ont besoin de confort,de lumière, d’espace, d’outils pour lire, écrire, discuter, travailler etc...

Page 22: 2013 bibnum ebd

La bibliothèque numérique : visiteLa bibliothèque numérique : visite

Entrée

La liste des nouveautés

Le bureau de renseignements

Votre place

Les actualitésde la bibliothèque

La sélection du bibliothécaire

Accès au moteur de recherche

Les rayonnages en libre-accès pour le butinage

Les outils de fidélisationet de communication

accès

valorisation

services

accès

valorisation

accès

valorisation

accès

services

Page 23: 2013 bibnum ebd

Une collection de documents

Page 24: 2013 bibnum ebd

La chaîne de numérisation : qu’est-ce que numériser ?La chaîne de numérisation : qu’est-ce que numériser ?

Sélectionner

Scanner : Couleurs, niveaux de gris ou noir et blanc ? 72 dpi ? 300 ? 600 ? Quels formats ? Tiff, jpeg etc.

Océriser Pour chercher (texte uniquement) Pour afficher (faire correspondre texte et image => métadonnées) Pour vocaliser (qualité optimum ou garantie => comment évaluer la

qualité?) Pour transférer (le texte sans l’image , mais que le texte, sur un

format portable)

Décrire et organiser Le document (signalement) Les images constituant le document Les fichiers textes issus de l’ocr

Page 25: 2013 bibnum ebd

1- La chaîne de numérisation :

sélectionner

Page 26: 2013 bibnum ebd

•Estimation et analyse de besoins

•Recherche et collecte d’informations

•Sélection, acquisition des documents

•Traitement des documents

•Traitement intellectuel :•Catalogage et indexation•Analyse, résumé etc.

•Enregistrement de l’information

•Traitement matériel :•Enregistrement du document•Équipement, reproduction, conservation (reliure etc.)

•Classement

•Diffusion de l’information :•Prêt •Mise à disposition des produits secondaires (catalogue, bibliographies, revue de presse etc.)

Page 27: 2013 bibnum ebd

La chaîne de numérisationLa chaîne de numérisation

NumérisationNumérisation

En mode texteEn mode texte

RelectureRelecture encodageencodage

Compétences bibliothéconomiques

Compétences techniques

Pas de compétences particulières

SélectionSélection

AcquisitionAcquisition

SignalementSignalement

Mise en ligne

Mise en ligneIndexationIndexation

En mode imageEn mode image

structurationstructuration transformationtransformationContrôleContrôle

Prestataire

Page 28: 2013 bibnum ebd

La chaîne de numérisation, 1 : « sélection- acquisition»La chaîne de numérisation, 1 : « sélection- acquisition»

NumérisationNumérisation

En mode texteEn mode texte

RelectureRelecture encodageencodage

SélectionSélection

AcquisitionAcquisition

SignalementSignalement

Mise en ligne

Mise en ligneIndexationIndexation

En mode imageEn mode image

structurationstructuration transformationtransformationContrôleContrôle

Politique documentaire de la bibliothèqueOrganisation logistique

Page 29: 2013 bibnum ebd

« Sélection » : la politique documentaire« Sélection » : la politique documentaire

Politique documentaire

Collections de la bibliothèque Public visé

Objectifs & missions

Contraintes juridiques

et techniques

Numérisation de sauvegarde : les documents fragiles, en danger?

Numérisation à la demande des utilisateurs?

Numérisation pour la diffusion

Public de la bibliothèque?

Public à distance?

Grand public, chercheurs, étudiants?

Droits d’auteur

État physique des documents

Collection encyclopédique?

Collection spécialisée?

Types de supports

Types de documents

Programmes de numérisation

Page 30: 2013 bibnum ebd

Les programmes de numérisation à la BnFLes programmes de numérisation à la BnF

Collection encyclopédique

Documents libres de droits

Tout support Monographies, périodiques, images, son

Pour un public de Chercheurs, étudiants, érudits, « médiateurs » (enseignants, journalistes,

associations) Grand public de plus en plus ciblé

Grands axes : le patrimoine national (somme des œuvres et des connaissances dans

toutes les disciplines, philosophie, histoire, littérature, religion, sciences,…), des programmes à vocation internationale (rapprochement et

confrontation de corpus patrimoniaux portant sur le même sujet mais issus d’autres nationalités : presse quotidienne, documentation juridique, histoire et sciences auxiliaires telles que la généalogie, les langues et leur apprentissage,…)

un corpus d’œuvres et de documents consacrés spécifiquement à l’Europe dans tout ses aspects (philosophie politique, identités nationales, histoire, économie, commerce, le travail, les métiers les sciences et techniques, les questions sociales, les grands évènements culturels,…).

Page 31: 2013 bibnum ebd

La question des droits : considérer le contenuLa question des droits : considérer le contenu

Robert Doisneau (1912-1994) Epouvantails, 1964

Robert Doisneau (1912-1994)SAVIGNAC aux échecs. Paris, 1950

personneoeuvre

auteur

auteur

Page 32: 2013 bibnum ebd

La question des droits (http://print.google.com)La question des droits (http://print.google.com)

Recherche dans l’ensemble du texte, visualisation d’extraits

Page 33: 2013 bibnum ebd

La question des droits (http://www.persee.fr)La question des droits (http://www.persee.fr)

Blocage des images

Page 34: 2013 bibnum ebd

« Acquisition » : mettre à disposition les « Acquisition » : mettre à disposition les

originaux?originaux?

Une fois la sélection faite, il faut se procurer les documents

C’est en partie une question technique et financière Achat de document pour la numérisation Ou numérisation des documents originaux

Numériser le papier ou le microfilm ? Différence de prix, de rapidité et de qualité Question de préservation du document original

Numériser des originaux Le scanner tourne page ? Dérelier ou massicoter ? Différences de prix et de qualité

Problèmes logistiques liés à la numérisation patrimoniale Sortir les ouvrages des magasins Problèmes d’indisponibilité pour les lecteurs Le transport et la livraison (conditions de conservation) La numérisation sur site (coût)

Page 35: 2013 bibnum ebd

Filière Papier Filière Microformes

Reliés

Massicots

Films

Fiches

« Acquisition » : mettre à disposition les originaux?« Acquisition » : mettre à disposition les originaux?

Page 36: 2013 bibnum ebd

Les « objets » sont transportés dans des caisses scelléesLes « objets » sont transportés dans des caisses scellées

« Acquisition » : mettre à disposition les originaux?

Page 37: 2013 bibnum ebd

2- La chaîne de numérisation : signaler

Page 38: 2013 bibnum ebd

La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »

NumérisationNumérisation

En mode texteEn mode texte

RelectureRelecture encodageencodage

SélectionSélection

AcquisitionAcquisition

SignalementSignalement

Mise en ligne

Mise en ligneIndexationIndexation

En mode imageEn mode image

structurationstructuration transformationtransformationContrôleContrôle

Page 39: 2013 bibnum ebd

La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »

Page 40: 2013 bibnum ebd

La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »

Page 41: 2013 bibnum ebd

« Signalement » : la notion de métadonnées« Signalement » : la notion de métadonnées

Des données sur les données ...

– qui servent à organiser la connaissance et à utiliser et exploiter le document

• Métadonnées descriptives, contextuelles et structurelles

– Ex. : Notice bibliographique, indexation

– Ex. : Date et formats de numérisation

– Ex. : Données sur les fichiers pour reconstituer l’ouvrage (Cf. plus loin)

• initiales et ajoutées tout au long du cycle de vie du document numérisé

– qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès

• Métadonnées administratives et techniques

– Ex. : Droits de lecture en interne seulement ou droit sur Internet

• initiales et ajoutées tout au long du cycle de vie du document numérisé

– Ex. : passage d’un document protégé dans le domaine public

Page 42: 2013 bibnum ebd

Pourquoi a-t-on besoin de métadonnées? Pourquoi a-t-on besoin de métadonnées?

La déconstruction du document numériqueLa déconstruction du document numérique

Page 43: 2013 bibnum ebd

« Signalement » : les métadonnées« Signalement » : les métadonnées

?

Un livre numérisé, c’est une suite de fichiers sans lien entre eux : la numérisation déconstruit le livre

Métadonnées de structure

•rattacher les fichiers entre eux

•reconstituer la structure du document

Métadonnées descriptives

•rattacher le document à l’original

•donner accès à la copie numérisée

Métadonnées administratives

•gérer les droits d ’accès

•préserver les informations techniques nécessaires à la lecture des fichiers

identifiant unique

Page 44: 2013 bibnum ebd

Le document : notion de granularitéLe document : notion de granularité

Collection Document(notice

bibliographique)

Volume, tome, fascicule...

Page

• Notion de document complexe

• Un document peut avoir plusieurs niveaux d’accès

• Par ex. les périodiques :

Vue de détail

(article)

Page 45: 2013 bibnum ebd

3- La chaîne de numérisation : numériser

Page 46: 2013 bibnum ebd

La chaîne de numérisation, 3 : « Numérisation »La chaîne de numérisation, 3 : « Numérisation »

NumérisationNumérisation

En mode texteEn mode texte

RelectureRelecture encodageencodage

SélectionSélection

AcquisitionAcquisition

SignalementSignalement

Mise en ligne

Mise en ligneIndexationIndexation

En mode imageEn mode image

structurationstructuration transformationtransformationContrôleContrôle

Page 47: 2013 bibnum ebd

Numériser en mode imageNumériser en mode image

La numérisation en mode image s’intéresse à la forme et donc à la structure physique

Avantages : un fac-similé

préserve l’intégrité de l’original

Inconvénients : un seul point d ’accès : la

notice bibliographique

pas de possibilités de manipulation du texte

poids des images > stockage, temps de téléchargement

mise en place de chaînes de numérisation complexes

Page 48: 2013 bibnum ebd

Numériser en mode texteNumériser en mode texte

La numérisation en mode texte s’intéresse directement au contenu et donc à la structure logique

Avantages recherche plein texte et

autres manipulations souplesse et portabilité Accessibilité pour les

personnes en situation de handicap visuel

Inconvénients lourdeur de réalisation coût

Page 49: 2013 bibnum ebd

Numériser en mode texteNumériser en mode texte

Il y a deux techniques de création du mode texte…

La reconnaissance automatique de caractères ou OCR fortement conditionnée par la qualité de numérisation problèmes : caractères anciens, mal formés, caractères

spéciaux, titres, documents en mauvais état… recherches en cours, amélioration des logiciels mais correction manuelle obligatoire pour une qualité à

100%

La saisie saisie manuelle : coût en termes de ressources humaines « double saisie manuelle comparée »

Page 50: 2013 bibnum ebd

Numériser en texte et imageNumériser en texte et image

Il existe des solutions qui combinent les deux modes

Avantage Combiner les avantages du texte et de l’image

Inconvénients Difficulté de réalisation et de contrôle Globalement, cela revient à numériser deux fois… donc

deux fois plus de travail, et coûts élevés

Page 51: 2013 bibnum ebd

Numériser en texte et image Numériser en texte et image

(http://www.bium.univ-paris5.fr/histmed/medica.htm)(http://www.bium.univ-paris5.fr/histmed/medica.htm)

Liste des chapitres en mode texte

Pages en mode image

Page 52: 2013 bibnum ebd

Numériser en texte et image Numériser en texte et image

(http://www.persee.fr)(http://www.persee.fr)

Mode imageMode texte (OCR de

très bonne qualité, documents récents)

Page 53: 2013 bibnum ebd

Numériser en texte et image Numériser en texte et image

(http://books.google.fr/)(http://books.google.fr/)

Visualisation du mode image uniquement, mode texte issu d’OCR en sous-couche permettant la

recherche plein texte et le surlignage des résultats de la recherche

Page 54: 2013 bibnum ebd

L’OCRL’OCR

L’OCR est un processus automatique

La qualité comme la reconnaissance sont calculés par des machines

C’est le nombre de caractères suspects divisés par le nombre total de caractères sur une page.

Une page de dix caractères vaut autant qu’une page de 10000 caractères dans un même ouvrage.

Page 55: 2013 bibnum ebd

Kirtas APT 2400

Les ouvrages de la filière « reliés » sont numérisés soit…. AutomatiquementNumérisation à 90°

Numériser : l’équipement

Page 56: 2013 bibnum ebd

CopybookDigibook 2000LCSuprascan A0

Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livresNumérisation à plat

Numériser : l’équipement

Page 57: 2013 bibnum ebd

Les microformes sont numérisées sur des scanners de microfilms et de microfiches

Microfiches

Microfilms

Numériser : l’équipement

Page 58: 2013 bibnum ebd

Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vitesse

Plus de 6000 pages/heure

Docuscan 6000

Numériser : l’équipement

Page 59: 2013 bibnum ebd

Un opérateur contrôle le traitement des images sur le logiciel SpiFactory

Redressement

Binarisation (transformation des images de niveau de gris et couleur en noir et blanc)

Filtrage des formes(redressement des blancs, des lignes, des caractères à l’intérieur d’une image)

Recadrage des pages

Illustrations

Numériser : un exemple de traitement d’image

Page 60: 2013 bibnum ebd

4- La chaîne de numérisation : décrire et

organiser

Page 61: 2013 bibnum ebd

La chaîne de numérisation, 4 : « indexation - mise en ligne »La chaîne de numérisation, 4 : « indexation - mise en ligne »

NumérisationNumérisation

En mode texteEn mode texte

RelectureRelecture encodageencodage

SélectionSélection

AcquisitionAcquisition

SignalementSignalement

Mise en ligne

Mise en ligneIndexationIndexation

En mode imageEn mode image

structurationstructuration transformationtransformationContrôleContrôle

Page 62: 2013 bibnum ebd

« Indexation » : la création des accès« Indexation » : la création des accès

Le matériau indexable : les métadonnées – descriptives – structurées le texte – en grande quantité – de qualité variable

L’indexation permet de créer des accès aux documents Via un catalogue Via un moteur de recherche

le catalogue adapté pour la recherche avancée Classement par titre, auteur etc.

le moteur de recherche recherche simple conforme aux habitudes du web recherche fine (plein-texte) classement des résultats par pertinence

Page 63: 2013 bibnum ebd

« Mise en ligne » : la salle de lecture virtuelle« Mise en ligne » : la salle de lecture virtuelle

La « salle de lecture virtuelle » est un espace où l’on consulte les collections Elle met à disposition des lecteurs les instruments d’accès et de

renseignement bibliographique Elle propose des outils de présentation des collections (mise en

contexte, valorisation) : pages éditoriales Elle constitue un espace convivial (rencontres, expositions) Elle constitue un espace de confort pour travailler (lecture du

document) Elle offre des services de valeur ajoutée pour aider les lecteurs

dans leur travail

1. faire aussi bien que le livre

2. faire mieux que le livre

Page 64: 2013 bibnum ebd

5- La chaîne de numérisation : stocker et

conserver

Page 65: 2013 bibnum ebd

La conservationLa conservation

Une fois les documents numérisés, sont-il vraiment en sécurité ? Pour combien de temps ?

Sauvegarder n’est pas archiver

Surveiller et renouveler régulièrement les supports (de façon préventive)

Collecter toutes les informations nécessaires pour maîtriser le document (métadonnées)

Transformer le document dans une forme plus facile à conserver dans le temps (« migration »)

Collecter des environnements et des plateformes de références pour l’avenir (« émulation »)

Page 66: 2013 bibnum ebd

6- les services

Page 67: 2013 bibnum ebd

Le partage des données : OAI et coopérationLe partage des données : OAI et coopération

Interopérabilité des données (OAI-PMH, Entrepôts OAI) Initiative OAI : Open Archive Initiative (1999)

Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes

Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées

OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial

Collections partagées dans des architectures réparties

Interrogation centraliséeFournisseurs de données

Fournisseurs de services

Page 68: 2013 bibnum ebd

OAI et coopération : GallicaOAI et coopération : Gallica

BIUM3970 notices

Bibliothèques virtuelles humanistes

186 notices

363 notices

Library of Congress

serveur OAI

serveur OAI

serveur OAI

Consultation de ces documents sur les autres sites

site BIUM

site LOC

site BVH

Base de données

serveur OAI

CNUM91 notices

site CNUM

Universités de Strasbourg

serveur OAI

435 notices

site SICD Strasbourg

Syndicat national de l’édition

5546 notices

Editeurs

serveur OAI

serveur OAI

Page 69: 2013 bibnum ebd

Bibliothèques numériques : actualités,

gallica

Page 70: 2013 bibnum ebd

Hathi trustHathi trust

Page 71: 2013 bibnum ebd

L’actualité en 2004-2005L’actualité en 2004-2005

Oct. 2004 : annonce du lancement de Google Print à la Foire de Francfort (Google), rebaptisé Google Book Search/ Google Recherche de livres en nov. 2005

Janv. 2005 : article de JN Jeanneney dans Le Monde lance l’idée d’une Bibliothèque numérique européenne (BnF, Commission européenne)

Oct. 2005 : création du consortium Open Content Alliance (Internet Archive, Yahoo!, MSN, Bibliothèques, archives anglophones etc.)

Nov. 2005 : partenariat Microsoft-Bristish Library pour numérisation de 25 millions de pages ($2,5 M) et annonce MSN Live Search

Nov. 2005 : lancement de la World Digital Library par James Billington (Library of Congress + UNESCO) avec l’aide de Google ($3 M)

Page 72: 2013 bibnum ebd

L’actualité en 2006-2007L’actualité en 2006-2007

Sept. 2006 : réalisation par la BnF d’une maquette (Europeana) préfigurant des accès et services pour une bibliothèque numérique européenne

Déc. 2006 : lancement de MSN Live Search

Mars 2007 : lancement par la BnF du prototype Europeana au Salon du livre (hors ligne depuis fin 2007)

Juillet 2007 : reprise du projet Europeana au niveau européen (géré par EDL Foundation)

Oct. 2007 : lancement de Gallica 2

Mars 2010 : 1 millions de documents accessibles dans Gallica

Page 73: 2013 bibnum ebd

Google recherche de livres en 2012: 30 bibliothèques partenaires pour la numérisation de leurs collections 10 000 éditeurs et auteurs partenaires Interface dans 35 langues Pas de communication sur le nombre de documents (20 Millions

évoqués)

Arrêt du programme de numérisation de livres de MSN en mai 2008

Open Content Alliance en novembre 2008 : Open Library

Bibliothèques américaines (Boston Library consortium), canadiennes, universités, Sociétés de l’Internet (une cinquantaine de partenaires)

19,401,009 titres de livres numérisés dont 340,083 en plein-texte Documents également accessibles sur Internet Archive

http://www.hathitrust.org/ rassemble depuis 2008 les grandes bibliothèques américaines (NYPL, Yale, Cornell, Columbia…) 10,556,750 volumes

5,556,767 livres274,642 périodiques3,694,862,850 pages Dont 1 702 727 volumes dans le domaine public en 2010 et 1 437 886 en 2012

Que sont devenus ces projets en 2013?Que sont devenus ces projets en 2013?

Page 74: 2013 bibnum ebd

Google Recherche de LivresGoogle Recherche de Livres

Page 75: 2013 bibnum ebd

Hathi TrustHathi Trust

Page 76: 2013 bibnum ebd

Open Content AllianceOpen Content Alliance

Page 77: 2013 bibnum ebd

World Digital LibraryWorld Digital Library

Page 78: 2013 bibnum ebd

EuropeanaEuropeana

Page 79: 2013 bibnum ebd

Principales différences Principales différences entre ces différents entre ces différents

projets projets Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt

(Google, OCA)

Gouvernance centralisée (Google) versus Consortium ou Partenariats (OCA, Europeana, WDL)

Financements majoritairement publics (Europeana, Gallica) versus financements privés (Google, OCA)

Architecture centralisée (Google, OCA) versus architecture répartie (Europeana)

L’utilisateur va vers la ressource (Gallica, Google, Europeana, WDL) versus la ressource va vers l’utilisateur (OCA)

Modèles organisationnels et économiques différents

Page 80: 2013 bibnum ebd

Les enjeuxLes enjeux Enjeux culturels

Le Web comme média principal pour la diffusion de l’information et de la connaissance, enjeu de démocratisation culturelle

Nécessité de répondre aux attentes des utilisateurs, de s’adapter aux pratiques des internautes (recherche plein texte)

Enjeux technologiques Numérisation comme support de sauvegarde et de diffusion machines pour la numérisation de masse Mise en réseaux de ressources dispersées et nécessité

d’interopérabilité (coopération)

Enjeux économiques Enjeu commercial : plus de contenu pour attirer plus

d’internautes / Enjeu culturel : mission de diffusion et de valorisation des institutions

Besoin de contenu/besoin de financement Partenariats public/privé

Page 81: 2013 bibnum ebd

GallicaGallica

Page 82: 2013 bibnum ebd

Conclusion : que retenir de tout cela ?

Page 83: 2013 bibnum ebd

Règle n° 1 : « Règle n° 1 : « Numériser, ce n’est pas éditer »Numériser, ce n’est pas éditer »

Numériser ce n’est pas interpréter commenter améliorer

Numériser c’est reproduire donner à consulter aider à lire

Page 84: 2013 bibnum ebd

Règle n° 2 : « Règle n° 2 : « l’information n’est pas connaissance »l’information n’est pas connaissance »

Une bibliothèque numérique ce n’est pas Un entrepôt de données Un moteur de recherche Une librairie en ligne

Une bibliothèque numérique c’est Un ensemble organisé Des services Des informations structurées et contextualisées Un accès à toutes les informations contenues

dans un document

Page 85: 2013 bibnum ebd

Règle n° 3 : Règle n° 3 : « Numériser n’est pas seulement un acte technique »« Numériser n’est pas seulement un acte technique »

Les choix techniques ne sont pas Déterminés uniquement par les moyens financiers Déterminés par le prestataire qui numérise La première chose à décider

Les choix techniques sont Déterminants pour les conditions de consultation Déterminants pour l’interopérabilité Déterminants pour la conservation à long terme

Page 86: 2013 bibnum ebd

0010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011000100101110001101100011001000111001010110100010000000100000001000000011001100111000001110010011100000101110001101110011000000100000001000000010000000110010001100110011010100110010001011100011010000110101001000000010000000100000001000000010000000101101001100010010111000110110001101100010000000100000001000000010110100110111001011100110111001100100010000000100000001011010011000100111000001011100011011000110001001000000010000000101101001110000011000000101100011000000110000001000000010000000101101001110000011000000101110001100000011000000100000001000000010000000110001001000000010000000110100001100110010000000100000001000000011100100100000001000000010000000100000001110010011100000111001001011100011010000110010001000000010000000100000001000000010000000110001001101100010111000110000001100100010000000100000001000000010000000100000001101010011001100101110001110000011001100100000001000000010000000100000001000000011010100110110001011100011011000110010001000000010000000100000001000000010000000100000001101000010111000111000001100010010000000100000001000000010000000110111001110010011001100101110001101010011100000100000001000000010000000100000001000000010000000110011001011100011001100110100000010100010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011010100101110001101110011100000111000010110100010000000100000001000000011001100111000001110010011010000101110001101100011010000100000001000000010000000110010001101010011010000110110001011100011100000111000001000000010000000100000001000000010000001000000010110100111000001100000010

Bibliothèque physique et bibliothèque numériqueBibliothèque physique et bibliothèque numérique

Sélection

Acquisition

Description : Catalogage

Préparation à la

consultation : Équipement

Magasinage

Conservation

Communication

Valorisation

Sélection

Collecte / production

Description : Métadonnées /

indexation

Préparation à la

consultation : Empaquetage

Gestion

Préservation

Accès

Valorisation

Con

su

ltati

on

d’u

ne

collecti

on

Gesti

on

d’u

ne

collecti

on

Ran

gem

en

t et

con

serr

vato

pn

d’u

ne

collecti

on

Con

sti

tuti

on

d

’un

e

collecti

on

Page 87: 2013 bibnum ebd

Le rôle du bibliothécaire numériqueLe rôle du bibliothécaire numérique

Ce qui ne change pas : Il travaille à la constitution des collections et à l’élaboration des

instruments de référence qui permettent d’y accéder Il gère physiquement la collection, veille à son organisation, à

son bon état de conservation Il sert d’interface (au sens propre) entre le public et les

collections, fait fonctionner les services au public et la collection

Ce qui change Il acquiert des compétences techniques en informatique

(architecture Web, capacité à rédiger à cahier des charges – même si ce n’est pas lui qui met en œuvre)

Il comprend ce qu’est un document numérique, et la différence avec un document bibliographique et un document analogique, il connaît l’environnement juridique de la propriété intellectuelle

Il est capable de traduire en termes ergonomiques ses compétences de service public pour s’adapter à un public distant

Page 88: 2013 bibnum ebd

Quelques sitesQuelques sites

http://gallica.bnf.fr / http://gallica2.bnf.fr

http://www.europeana.eu

http://maquette.bnf.fr/labs/scenario/Europeana.demo.html

http://memory.loc.gov/ammem/index.html

http://www.gutenberg.org

http://cnum.cnam.fr/

www.bvh.univ-tours.fr

http://gdz.sub.uni-goettingen.de/de/index.html

http://www.persee.fr

http://elec.enc.sorbonne.fr/

http://books.google.fr/

http://www.openlibrary.org

Page 89: 2013 bibnum ebd

Quelques sitesQuelques sites http://www.wdl.org/fr/ http://bibliotheque-numerique.inha.fr http://www.gutenberg.org/browse/languages/fr http://www.europeana.eu/portal/ http://fr.wikipedia.org/wiki/Wikisource http://www.archive.org http://classiques.uqac.ca/ http://www.e-corpus.org http://www.livres-et-ebooks.fr/ http://www.cairn.info http://www.persee.fr http://www.revues.org/ http://www.erudit.org http://fr.wikisource.org/ http://web2.bium.univ-paris5.fr http://expositions.bnf.fr/livres/

Page 90: 2013 bibnum ebd

Quelques ressourcesQuelques ressources

Sur le site Numérisation du patrimoine culturel du Ministère de la Culture : La bibliographie :

http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_06.htm, Les fiches techniques :

http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm

Figoblog http://www.figoblog.org/

Affordance : http://affordance.typepad.com/mon_weblog/

Silex : http://scinfolex.wordpress.com/

Tour de toile du BBF (bibliothèques numériques et numérisation) http://blogbbf.enssib.fr/?Bib_num_numerisation

Bibliothèques sur le Web, BBF 2006 - Paris, t. 51, n° 3

Entretiens de la BnF, 7-8 décembre 2006 “Numérique et bibliothèques : le deuxième choc » http://www.bnf.fr/pages/infopro/journeespro/jp_entretiens06.htm

Dico illustré du Web 2.0 http://www.journaldunet.com/diaporama/0610-dicoweb2/index.shtml

http://www.bnf.fr/pages/zNavigat/frame/infopro.htm : rubrique en cours de mise à jour