Tentatives de cartographies des besoins, solutions et sujets de recherche ouverts dans le domaine de l’ingénierie des connaissances
et du web sémantique
• 2000-2009 : une chronologie
• Une cartographie par fonctions
• Une cartographie par domaines d’utilisation
• Conclusion
DMOZ
Grand Ancêtre Wikipedia
Projets gestion des connaissances Usinor
2000
• Topic Maps – participation à la norme
2001
• Collaboration Labri (Université Bordeaux) et Cams (Ehess) – Thèse de Pascal Auillans sur la théorie des graphes et réseaux sémantiques
• 1er version logiciel gestion de base de connaissance
• Tentative de modélisation d’une base de connaissance sur la musique classique
2003
• Editeur Juridique : Wolters Kluwer Belgium
• OWL : participation de Bernard Vatant à la norme
• Projet européen Strabon: culture, tourisme, multilinguisme
2004
• Collaboration avec Temis (text mining)
• Collaboration Lalicc Paris IV – Thèse Florence Amardeilh sur l’acquisition automatique de connaissances et annotations des contenus
• Contrat Hachette
2005• Collaboration Lirmm (Université Montpellier)
Thèse Olivier Carloni sur le raisonnement à partir de graphes conceptuels
• Collaboration Leden (Paris 8) Thèse Laurence Noël sur la publication multimédia de contenus et connaissances
• Contrat avec Lexis Nexis France
• Partenariat avec moteur de recherche Antidot – projet Eiffel
2006
• SKOS – participation à la norme
• Projet européen TAO – Transitionning Application to Ontology - SOA
2007
• Travail avec GeoNames
• LOD (Linking Open Data) project
• Projet SMTS Serveur Multiterminologies de santé
2008• Collaboration Inserm Thèse Pierre Yves
Vandenbusche : modélisation d’ontologie pour des serveurs de terminologies médicales
• Normes CTS2 (Web service pour la gestion des référentiels)
• Contrat pour la gestion de 3 thésaurus de la commission européenne (26 langues)
• Utilisation de Triple Stores pour des services avancées de recherche / suggestion
2009• Contrat AP-HP : serveur de terminologies médicales
• Contrat BNF / TenPlus - Europeana : recherche sémantique multilingue – alignement
• Collaboration Modyco Paris X – thèse de Charles Tesseire sur la gestion de la temporalité
• Projet Voyages-sncf : fusion de ressources hétérogènes – ontologie tourisme – enrichissement par inférence
• Travail avec Knowledge consult pour construire une méthodologie
Une confrontation continue entre les standards, la recherche et les demandes de l’industrie
L’exigence de répondre à des besoins opérationnels présents ou anticipés
Bases de connaissances
Portails sémantiques
Référentiels Terminologies
ThésaurusTaxonomies
Linking Open Data
Annotation sémantique
des contenus
Référentiels Terminologies
ThésaurusTaxonomies
• Modélisation ontologie pour supporter plusieurs référentiels aux modélisations hétérogènes
• Alignements – Intersection de référentiels– Recouvrement multilingues
• Serveurs d’alignements
• Mise à jour partielle et incrémentale des serveurs multi-terminologies
• Multilinguisme : Gestion des concepts et des vocabulaires multilingues
• SKOS, CTS2, End-Point SparQL
• Construction de référentiels/ontologies à partir de ressources hétérogènes
• Classification • Text mining• Annotation par ontologie interne et ressources externes (LOD)• Enrichissement de l’ontologie / enrichissement des annotations
• RDF / MicroFormats / RDF-A• Schemas d’annotation complexes (Event ML, NewsML)
• Annotation multilingue• Annotation images• Semantic mashup
Annotation sémantique
des contenus
• Alignement d’URI
• Multilinguisme
• Serveurs d’alignement entre référentiels
• Création de services basés sur les contenus ouverts et les contenus propriétaires
Linking Open Data
• Modélisation d’ontologie de domaines• Réutilisation de modélisations• Evolution des modélisations
• Acquisition automatique des connaissances• Contrôle automatique à base de règles
• Interface utilisateurs de contribution et consultation (simplicité des interfaces versus complexité de la modélisation)
• Web 2.0
• Moteur de recherche texte, métadonnées, relations sémantiques• Inférence – suggestion par raisonnement• Semantic mashup
• Méthodologie
Bases de connaissances
Portails sémantiques
•Juridique•Administration publique
•Santé•Médical
•Culture
•Médias•Organisations collaboratives
•Tourisme
• Exigence de mise à disposition des données publiques : rôle des pouvoirs publics nationaux et européens
• Exigence d’information des citoyens
• Compétitions pour des services avancés d’accès aux contenus et connaissances : – grands groupes internationaux– administrations publiques
• Juridique• Administration
publique
• Science Sociale• Formalisme et traditions historiques• Culture nationale• Plusieurs domaines du droit avec des traditions
différentes• -> difficulté de modélisation, difficulté de réutilisation• Droit comparé -> Alignement de modélisations
d’ontologies
• Construction européenne – Multilinguisme– Multiculturalisme
• Accès personnalisé à l’information – Professionnels– Citoyens engagés– Citoyens
• Juridique• Administration
publique
• Enjeux économiques sur la gestion du dossier patient– Codage– Interopérabilité, transportabilité– Meilleurs soins
• Enjeux politiques– Accès à l’information
• médecins, • assurances sociales, • patients…
• Un projet mondial (Projet devenu prioritaire aux USA)
• Santé• Médical
• Des modélisations d’ontologies, des organisations de terminologies partageables au niveau international
• Des besoins de traduction et multilinguisme• Un travail international et collaboratif de mise à jour des
ontologies / terminologies de référence
• Santé• Médical
• Des besoins d’alignement• Granularité différente des descriptions de concepts dans les
différentes terminologies• Ponts entre différents type de codage
– Économique, clinique, gestion
• Simplicité du codage vs complexité des référentiels
• Des accès simples et uniformisés aux ontologies/terminologies par les applications utilisatrices
• Santé• Médical
• Temps réel
• Ontologies / terminologies pour décrire des domaines très hétérogènes
• Mélanger des ontologies très souples et des ontologies très détaillées
• Temporalité• Localisation
• Vers une annotation à partir de bases d’événements (EventML)
• Du local au global• Du global au local
• Interopérabilité / échanges
• Semantic mashup de ressources internes et externes
• Médias
• Spécialisation des tâches– Modélisation– Edition, enrichissement
d’ontologies/terminologies– Annotation– Utilisation des contenus et connaissances
• Juridique• Administration
publique
• Santé• Médical
• Médias
• Lafarge• Fédération Nationale des Parcs Régionaux• INRA• Directions de la SNCF – conduite du changement• Fédération des centres de gestion des collectivités
territoriales• Groupe ADEO / Leroy Merlin• PSA : conception véhicules• DGA : renseignement• Analyse Images satellitaires
• Organisations collaboratives
• Capitaliser et partager des connaissances• Portail sémantique• Formaliser des connaissances• Partager des concepts métiers (éventuellement dans différentes
langues)
• Travail collaboratif sur la modélisation, l’enrichissement, l’accès, les retours
• Modélisation de domaines très spécifiques - coût• Terminologies métiers spécifiques et locales - coût
• Organisations collaboratives
Vers une industrialisation
Une insertion en cours des outils de l’ingénierie des connaissances dans les systèmes d’information en s’appuyant
sur les standards développés dans le cadre du web sémantique
acquisition
modélisation
représentation
acquisition
modélisation
représentation
acquisition
modélisation
représentation
Temporalité
Espace
Evénements
Domaine X
acquisition
modélisation
représentation
Merci