travailler avec des archives audiovisuels numériques. première partie : le fonds audiovisuel des...
Post on 20-May-2015
304 Views
Preview:
DESCRIPTION
TRANSCRIPT
Travailler avec des archives audiovisuels numériques.
Première partie : Le fonds audiovisuel des AAR et sa publication-diffusion
Peter Stockinger, P.U.Fondation
Masion
des Sciences de l’Homme
(FMSH) -
ESCoMInstitut
National des Langues
et Civilisations
Orientales
(INALCO)
Université
de la Manouba
(UMA)
Institut Supérieur de Documentation de Tunis
Unité
de Recherche «
Bibliothèque numérique et patrimoine
»
Tunis, 24 Avril
2013
1.
Le Programme Archives Audiovisuelles de la Recherche (AAR)
–
présentation, enjeux et objectifs, réalisations et positionnement actuel
2
.
La banque des données ouvertes des AAR
3.
La publication-diffusion de la banque des données ouvertes des AAR
4.
Le genre de publication «
portail
»
5
.
Une nouvelle génération de portails réalisée avec le Studio ASA, l’environnement de travail (le «
lab
») des AAR
Les principaux points
Le Programme «
Archives Audiovisuelles de la Recherche
»
(AAR)
Le Programme Archives Audiovisuelles de la Recherche (AAR):
= programme de « recherche appliquée » …
… dans le contexte des archives/bibliothèques numériques pour la recherche, l’enseignement et la valorisation de patrimoines scientifiques et culturels
… élaboré en 2000 et mis en place concrètement à partir du mois d’avril 2002 …
… par l’ESCoM (Equipe Sémiotique Cognitive et Nouveaux Médias) à la FMSH (Fondation Maison des Sciences de l’Homme) à Paris.
Le programme AAR
2 objectifs sous-tendent le programme AAR:
Premier objectif:
Projet d’archivage audiovisuel numérique en SHS (sciences humaines et sociales)
a) Constituer
et préserver
des corpus audiovisuels numériques
qui documentent le patrimoine scientifique dans les différentes « disciplines » en SHS
– patrimoine scientifique réalisé par une communautéinternationale de chercheurs et enseignants-chercheurs …
b) Publier
et diffuser
en ligne une partie des corpus archivés …
sous forme d’événements (conférences, séminaires, entretiens, recherches de terrain, …)
et de collections (« dossiers ») d’événements scientifiques en français et dans d’autres langues (= portail AAR en accès libre).
Le programme AAR
Deuxième objectif:
Environnement numérique de travail (le « Lab(oratoire) »)
Deux aspects
1) Définir et valider une méthodologie et des procéduresexplicites (documentées) …
1.
…
de production
et de gestion-diffusion
d’archives audiovisuelles numériques en SHS.
2.
…
d’exploitation
(«
repurposing
») des données archivées
Le programme AAR
Deuxième objectif:
Environnement numérique de travail (« Lab(oratoire) »)
2) Développer un ensemble d’outils, d’instruments pour …
I.
…
la conception
et définition
de l’organisation d’une archive (collections, classements thématiques, thesaurus, …).
II.
…
la constitution de banques de données audiovisuelles numériques (d’
«
ingestion
»
de données audiovisuelles dans une archive)
.
III.
…
l’analyse
personnalisée
(de segmentation, de description et d’indexation) de corpus AV archivés.
IV.
…
la
publication/republication et de diffusion
personnalisées
des données AV et des métadonnées ainsi que d’une archive elle-
même sous forme d’un portail web adaptable.
Le programme AAR
Aujourd’hui, les Archives Audiovisuelles de la Recherche (AAR) forment à la fois :
1) une archive numérique enligne
stricto sensu: Les «
AAR
»
une banque de données ouvertes et d’accès ouvert qui est l’objet d’un projet d’archivage spécifique
objectif du projet d’archivage: constituer un patrimoine scientifique représentatif des recherches en SHS (>9000 heures de vidéos)
2) et un environnement de travail
–
un «
laboratoire
»: Studio ASA (Atelier de Sémiotique Audiovisuelle) …
sous forme d’une série d’Ateliers spécialisés (de logiciels, de ressources métalinguistiques, de guides, …) qui instrumentent un projet d’archivage AAR ainsi que son exploitation.
Le programme AAR
La banque des données des AAR
Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAIS) :
a) types de données
• Données vidéos • enregistrements bruts, • enregistrements traités a posteriori, • enregistrements montés, • documents filmiques édités (reportages, documentaires, …)
• Données visuelles statiques • captures brutes, • captures traitées à
posteriori,
• Données textuelles• (pré-)publications des contributeurs• CV, bibliographies, …
• Données structurées • Sur les contributeurs (> 2500), • Sur les abonnés à
la newsletter AAR (> 10.000),• Sur les visteurs/utilisateurs des AAR: questionnaires enligne (> 500)
• Données à
caractère juridique • contrats de mise en ligne
La banque des données des AAR …
Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAI) :
b) volume du fonds (vidéos seulement)
•
environ 9000 heures
de vidéos produites et/ou co-produites
par la FMSH-ESCoM et un réseau national et international de partenaires;
•
quelques 5600
heures de ressources AV en accès libre («
open access
») sur le portail général du programme AAR;
•
des milliers d’heures de ressources AV également librement accessibles sur une série de portails plus spécialisés (cf. plus loin);
c) formats des fichiers vidéo
•
données vidéos: wmv, flash, en partie avi,
•
en cours: encodage en mpeg4
La banque des données des AAR …
Banque des données numériques (= le fonds des AAR):
Quelques caractéristiques (des « ressources » au sens de DC/OAI) :
d) contributeurs: communauté
internationale
•
environ 2600
chercheurs-enseignants, artistes, journalistes, …
•
de quelques 85 pays du monde
e) fonds AAR par langue:
•
une très grande partie des vidéos est monolingue,
•
une petite partie est monolingue assorti d’un résumé
en une ou plusieurs autres langues,
•
une grande partie des vidéos est en français,
•
vidéos également en anglais, espagnol, allemand, chinois, etc.
La banque des données des AAR …
La publication-diffusion de la banque des données ouvertes AAR
Publications de la banque des données audiovisuelles ouvertes des AAR:
4 Genres de publication:
1.
Genre principal: l’événement: •
site d’événement ou encore site événementiel
2.
Collections
de sites d’événements•
corpus par discipline ou thème
3.
Portails
(portail général; portail à
thème)•
points d’accès aux événements et/ou collections d’événements
4.
Publications expérimentales
(issues de projets de R&D européens et français)
•
nouvelles formes spécialisées d’accès aux et d’explorations de ressources audiovisuelles
La publication-
diffusion des données AAR
Publication:
1) Genre central de publication: Evénement (site d’événement)
Un événement =
•
toute occasion
de collecte d’informations,
•
occasion doit posséder une valeur patrimoniale,
•
«
valeur patrimoniale
»:
définie par les missions/objectifs du projet d’archivage numérique
Genres d’événements filmés (dans le cadre des AAR):
•
Manifestations scientifiques: entretiens, conférences, colloques, workshops, …
•
Manifestations culturelles: concerts, expositions, …
•
Terrains de recherche: sociologiques, linguistiques, ;…
•
Et aussi: produits édités
(reportages, documentaires, films de fiction, …)
La publication-
diffusion des données AAR
Publication:
1) Genre central de publication: Evénement (site d’événement)
Exemple concret:
•
La fabrication du pain domestique au Portugal (15 juin 2006)
Structure typique d’un événement:
1.
un événement = un site
(dynamique) aussi appelé
«
mini-site
»,2.
page d’accueil
identifiant l’événement,3.
accès aux ressources
(vidéos, textes, images, …) documentant l’événement,
4.
«
page vidéo
»
de lecture et d’exploration d’une ressource vidéo.
Sur portail AAR:
•
environ 670 sites
(«
mini-sites
»)
événementiels,
•
en tout: 960 sites
sur tous les portails du programme AAR …
La publication-
diffusion des données AAR
Publication:
2) Le genre Collections
(d’événements)
« Collection » = ensemble cohérent de sites d’événements
•
Un ensemble de sites d’événements constitue un corpus publié
(enligne) d’événements
•
Attention: corpus publié
≠
corpus collecté
≠
corpus indexé
!!
Dans le cadre des AAR:
•
notamment corpora
publiés
par discipline
et/ou domaine
de recherche (environ 40
«
grands corpus
»)
Exemple:
•
Grand corpus
« Sociologie »: 160 sites d’événements
•
46 corpus spécialisés
qui font partie du grand corpus «
Sociologie
»
•
Sociologie urbaine (8); •
Sociologie de la culture (27), •
Sociologie des migrations (11), …
La publication-
diffusion des données AAR
Un corpus AAR est composé d’enregistrements divers …
•
…
d’entretiens
(avec chercheurs, experts, journalistes, témoins, …),
•
… de séminaires
et/ou de colloques
(tables rondes, journées d’étude, …),
mais aussi:
•
… de documentaires AV, …
•
… d’enregistrements de terrain
documentant le thème/le sujet,
•
… d’enregistrements d’événements
culturels (expositions, concerts, …)
•
… de prises de vue de
« scène de vie ».
Un corpus: •
est en général multilingue, •
reflète la recherche actuelle au niveau international
La publication-
diffusion des données AAR
Publication:
3) Le genre Portails (d’archive)
« Portail » =
1.
lieu d’accès
aux événements et/ou au corpus publiés d’événements d’une archive,
2.
lieu d’exploration
des ressources documentant un événement (notamment des ressources vidéos),
3.
lieu de visualisation
du fonds d’une archive
La publication-
diffusion des données AAR
Publication:
Les portails dans le cadre du programme AAR:
1) Portail web central•
Le portail des Archives Audiovisuelles de la Recherche (AAR)
en huit langues
2) Portails thématiquement spécialisés:
•
Averroès –
la médiathèque France-Maghreb,
•
Portail DLC –
Diversité
Culturelle et Linguistique,
•
Portail PCM –
Peuples et Cultures du Monde,
•
Portail SCC –
Semiotica, Cultura
e Comunicazione
(coopération avec l’Università
di Roma –
Sapienza)
Exemples concrets – cf. ci-après …
La publication-
diffusion des données AAR
Publication:
4) Le genre Publications expérimentales
Différents genres de publications expérimentales:
4.1) Les vidéo-lexiques
•
Corpus de segments assez brefs
de vidéos qui illustrent un terme, une notion, un domaine, …
•
Exemple:•
Le vidéo-lexique «
Peuples du monde
»
4.2)
Dossiers bilingues
•
Republication d’une vidéo (ou d’une partie d’une vidéo) dans une langue-cible différente
à
la langue-source
•
Exemples: •
Republication
(en arabe, chinois, anglais, italien, ….) d’un entretien en français avec Sabine Trebinjac
(CNRS) consacré
à
la musique ouïgoure
•
Tous les dossiers bilingues français –
arabe.
La publication-
diffusion des données AAR
Publication:
4) Le genre Publications expérimentales
4.3) Dossiers thématiques
•
analyse et explication des grandes thématiques
dans une prestation (entretien, séminaire, …)
les vidéos sont totalement délinéarisées!
•
Exemples:
•
Republication d’une conférence de Joëlle Allouche-Benayoun
(02/04/2008) sur La place de la femme dans le judaïsme
(passages thématiques –
encyclopédie –
lexique)
•
Accès à
l’ensemble des dossiers thématiques (par discipline).
La publication-
diffusion des données AAR
Publication:
4) Le genre Publications expérimentales
Quelques explications …
•
Publications pas intégrées
dans le «
processus standard de production –
diffusion.
•
Ce sont des republications
de données archivées et publiées («
repurposing
»).
•
Objectifs:
•
Adaptations à
des contextes d’usage
spécifiques (notamment: enseignement et valorisation).
La publication-
diffusion des données AAR
Présentation plus détaillée:
Le genre de publication «
portail
»
L’interface du portail général du programme AAR : principal point d’accès à et de visualisation de la banque des données AAR (5600 heures de vidéos en accès libre)
Le genre de publication «
portail
»
L’interface de la page d’accueil du portail général des AAR:
Les accès …
Accès « standards » à la banque des données ouvertes AAR :
1.
accès par «
nouveautés
»: publications les plus récentes; les « grands titres », …
2.
accès par domaines et disciplines
: évènements
publiés en …> sociologie (160)
> développement (11) ; mouvement social, groupes sociaux; conflits, …
3.
accès par types d’événements:> entretiens (360); séminaires (72); colloques (180); reportages (50); documentations audiovisuelles (20 = « archives provoquées »);
4.
accès par langue
(version originale des vidéos): évènements
publiés en …> français (682); anglais (107); espagnol (59); chinois, russe, arabe, …
Le genre de publication «
portail
»
L’interface de la page d’accueil du portail général des AAR…
Accès « standards » à la banque des données ouvertes AAR :
5.
accès par auteurs (2448): liste alphabétique + descriptif
6.
accès à
l’ensemble des événements
(682): par date d’enregistrement
7.
accès à
des dossiers hypermédias spécialisés issus d’un processus de republication de corpus audiovisuels
; > dossiers par discipline
> anthropologie culturelle; anthropologie de la santé; linguistique; musicologie; …
8
.
accès à
un ensemble de portails spécialisés
(i.e. de portails proposant à
leur tour des accès communs et/ou spécifiques à
une sélection du fonds audiovisuel de la banque des données ouvertes AAR) sous forme d’événements
(scientifiques, culturels, …):
1.
> AVERROES –
La médiathèque France-Maghreb2.
> DLC –
Diversité
Linguistique et Culturelle3.
> PCM –
Peuples et Cultures du Monde4.
> SCC –
Semiotica, Cultura
e Comunicazione
(avec Univ. di Roma)5.
> MDD –
Mondialisation et Développement Durable6.
> …
Le genre de publication «
portail
»
L’interface de la page d’accueil du portail Averroès – La médiathèque France –Maghreb
Même type de publication que le portail général AAR
Le genre de publication «
portail
»
Une «
nouvelle génération
»
de portails réalisés avec le Studio ASA (le «
lab
»
du Programme AAR)
Grace à un ensemble de projets de R&D européens et français (ANR) depuis 2006, le programme AAR a mis en place …
… une nouvelle « génération » de portails (bientôt en ligne, i.e. dès le 20 mai 2013):
Caractéristiques:
Accès sémantique à des corpora audiovisuels choisis (par thesaurus, thèmes ou sujets de discours, localisations géographiques et temporelles, références culturelles, etc.);
Descriptions et indexations très riches et détaillées des vidéos pour des usages dans l’enseignement et la recherche;
Republications « auteurs » totalement intégrées dans le processus de gestion éditorial d’un portail;
Customisation de l’interface physique et graphique et des accès aux corpus audiovisuels;
Intégration des médias sociaux dans chaque portail et chaque « page vidéo »;
Environnement de travail « unifié »: Studio ASA (cf. plus loin)
Une nouvelle génération de portails
Illustration: L’interface de la page d’accueil du portail AMSUR = un corpus AVd’environ 360 heures
Une nouvelle génération de portails
Illustration: La « Page vidéo » page permet l’exploration systématique d’une ressource vidéo
Une nouvelle génération de portails
Illustration: La Page « vidéo » s’adapte aux métadonnées disponibles
Une nouvelle génération de portails
Illustration: La Page « vidéo » donne accès aux « vidéos similaires »
Une nouvelle génération de portails
Illustration: Accès à un corpus publié de vidéos (!!) via le thesaurus propre àl’archive (« Lexique »)
Une nouvelle génération de portails
Illustration: Accès par localisation géographique:
Une nouvelle génération de portails
Illustration: Accès par collections filmiques:•
Ressources [(re)publiées] ….Vidéos par genre > Documentaires et reportages [(re)publiés]
Une nouvelle génération de portails
Illustration: Accès non-structuré à l’ensemble du corpus publié
Une nouvelle génération de portails
Remarques au sujet du corpus audiovisuel
AMSUR
Quelques remarques:
Le portail AMSUR donne accès à un corpus audiovisuel qui:
provient de la banque de données ouvertes AAR,est consacré à l’histoire et aux cultures de l’Amérique Latine.
Ce corpus:
… constitue donc une partie du fonds commun de la banque des données des AAR (> 360 heures)
Il est également accessible via le portail général des AAR …
… mais uniquement par le biais des accès généraux du portail (qui « valent » pour toutes les vidéos composant la banque des données AAR)
Sur le portail AMSUR, le corpus en question se présente …
sous une forme profondément retravaillé selon les objectifs éditoriaux propres au portail AMSUR.
Au sujet du corpus AMSUR
Un corpus audiovisuel « profondément retravaillé » veut dire que …
… les vidéos qui font partie du corpus sont ….
… localisées dans le fonds (AAR) et sélectionnées selon leur pertinence pour la politique éditoriale du portail
… redécoupées en segments pertinents (selon la politique éditoriale propre au portail)
… reclassées à l’aide d’un métalangage propre au portail (cf. les accès de ce portail: sujets, thesaurus, …)
… re-décrites et re-indexées à l’aide d’une bibliothèque de modèles de description propre au portail
… re-contextualisées (i.e. « mises en relation » avec d’autres données selon la politique éditoriale du portail)
… « mélangées » avec d’autres données afin de donner lieu à de nouvelles publications
Ci-après la problématique du « Repurposing » de données numériques archivées!
Au sujet du corpus AMSUR
Le «
Repurposing
»
de corpus audiovisuels –
un usage complètement central
pour toutes archives numériques
« Repurposing »:
Réutilisation de données numériques archivées.
Problématique centrale pour l’exploitation d’archives numériques dans le contexte de la recherche, de l’enseignement, de la communication, ….
Cas particuliers:
1.
Ré-description
et ré-indexation
de données archivées (cf. le corpus AMSUR)
2.
Ré-publication
de données archivées:
1.
Ré-publication concurrente
d’une donnée numériques archivée sur deux ou plusieurs portails
2.
«
Réunir, mélanger
»
différentes données
numériques archivées pour faire une nouvelle publication («
dossier thématique)
Le «
repurposing
»
de corpus audiovisuels
Exemple 1: Dossier thématique « Linguistique et langues amérindiennes » -dossier réunissant un corpus de vidéos autour de ce sujet
Le «
repurposing
»
de corpus audiovisuels
Exemple 2: Analyse, description et publication concurrente d’une même vidéo sur deux portails différents
Analyse et publication concurrentes d’un entretien avec Luiz Carlos Bresser-Pereira sur trois portails différents:
… sur le portail général des AAR : publication « de base »
… sur le portail AMSUR (cf. ci-après)
…. et sur le portail FMSH-AAR (cf. ci-après)
Le «
repurposing
»
de corpus audiovisuels
Republication sur AMSUR (réalisée par Manuela Papino, webmestre du portail AMSUR):
Le «
repurposing
»
de corpus audiovisuels
Republication sur FMSH-AAR (réalisée par Muriel Chemouny):
Le «
repurposing
»
de corpus audiovisuels
Caractéristiques d’une analyse/publication concurrente …
1.
Découpage
qui varie
systématiquement (l’analyste décide des segments –
chapitres –
dont il a besoin).
2.
Métalangages
utilisés sont différents (thesaurus par portail + bibliothèque de modèles de description propre à
chaque portail).
3.
Informations pragmatiques
et mises en relation différentes.
4.
Accès différents (et propres à
chaque portail).
5.
Interface
partiellement différente.
Le «
repurposing
»
de corpus audiovisuels
Pour terminer:
Les trois niveaux d’une archive numérique
Schéma simplifié les 3 niveaux à distinguer dans une archive numérique: Données – Corpus – Publication
Banque
de données
ouvertes
1
AAR
Corpus 1 ≅
Fonds
AARCorpus 2 = Sélection
thématique
Corpus n
= Sélection
Visualisation
Accès
1
(portail
général
des AAR)
Visualisation
Accès
2
(= portail
AMSUR)
Visualisation
Accès
3
(= portail
AMSUD)
Banque
de données
ouvertes
2 (N)
HAL (Canal U, …)
Les trois niveaux d’une archive numérique
top related