Groupe de travail O3D Représentation des connaissances

De codatafrance-wiki
Aller à : navigation, rechercher

RETOUR GROUPES DE TRAVAIL O3D : Observatoire des données du développement durable

LIEN AVEC LE PROJET DES : Des données à une économie du savoir : méthodes et outils


Les groupes de travail O3D
Les groupes en activité
Les groupes en préparation
Retour à Groupe de travail O3D


SEE ENGLISH VERSION


Ce document est la synthèse à ce jour, du Groupe de Travail « Représentation des connaissances » de O3D, dont l’objectif est de définir une vue d’ensemble de ce domaine, de donner une bibliographie succincte des documents et sites web qui sont apparus comme les plus pertinents aux membres du groupe de travail, de lister les domaines complémentaires à aborder dans une démarche multidisciplinaire, de proposer des sujets d’études dans le cadre de thèses ou de mémorandums, d'indiquer des directions de décisions qui pourraient être prises dans l’avenir et des domaines possibles d’innovation.

Une première contribution est fournie par le contenu de la conférence qui a été faite au congrès du Lions Nord, le 14 avril 2012 : cette contribution est intégrée à ce document.

La conférence avait pour objet de présenter l'application aux données du développement durable de méthodes et outils issus du domaine de l'ingénierie des connaissances, en particulier les ontologies.



Membres du groupe de travail



Synthèse générale

Les informations qui figurent dans ce wiki seront à compléter et à enrichir au fur et à mesure des recherches effectuées dans ce domaine, ou des développements dont les membres auront connaissance.



La problématique liée aux données du développement durable

* Quelques exemples de sites fournissant des données (Accès 25 mai 2012) :

La Banque Mondiale : Data catalog

La CIA (Central Intelligence Agency) : CIA Library

Le Ministère de l'écologie, du développement durable et de l'énergie : http://www.developpement-durable.gouv.fr/-Donnees-indicateurs-et-.html


* Problèmes rencontrés :

- le temps nécessaire à la lecture …

- la détermination des critères de choix, de pertinence par rapport à ses besoins n'est pas toujours facile à faire

- comment vérifier la cohérence des résultats, compte tenu de leur nombre et de leur diversité, comment les comparer ?

- il n'est pas toujours facile de connaitre le contexte dans lequel les données ont été définies. Selon ce contexte, les données pourront être valides, ou non

- comment déterminer la validité dans le temps, la pérennité, comment savoir si les données sont encore valables ?

- les documents sont susceptibles d'être rédigés dans différentes langues : d'où des problèmes de compréhension.


* Comment faire ?

- Quels sont les outils susceptibles d’aider à « trier » ces données ? Existe-t-il de tels outils ?

- Y a-t-il d’autres personnes intéressées par le sujet et avec lesquelles échanger, partager des informations ou des points de vue sur des problèmes ?

- Est-il possible de faire une synthèse des informations existantes ?

- Comment arriver à bâtir des idées innovantes sur une telle masse d’informations ?



La représentation des connaissances dans le développement durable : la transition proposée par CODATA-O3D


Nous allons présenter ici quelques étapes du processus de transition et les problèmes que l'on rencontre :


- POINT DE DEPART : les données, sur lesquelles on réalise une analyse, en utilisant des outils : Google, Delicious, bibliographie ...  : il s'agit là d'un travail essentiellement personnel, isolé.


- ETAPE INTERMEDIAIRE  : Etape de réflexion, de traitement des données, par l'intermédiaire d'outils tels que blogs, wikis, cartes conceptuelles : il s'agit là d'un travail collectif, intégrant les résultats de discussions, de brain stormings, de confrontations d'idées. La démarche O3D prend naissance lors de ces étapes intermédiaires.

On obtient alors le schéma ci-dessous, traduisant une étape de cette transition. Il faut noter que, au fur et à mesure que le degré de structuration augmente, la complexité du problème à traiter augmente aussi.


MAIS ..... Plusieurs questions se posent alors :

- Comment vérifier la cohérence de mes résultats ?

- Comment savoir s’il y a des redondances, des oublis ?

- Est-il possible de transposer des méthodes et outils issus d’autres domaines, ou d’autres secteurs industriels ?

- Est-il possible de déduire de nouvelles informations, de nouvelles règles, de nouvelles méthodes à partir des données et informations existantes (innover) ?

- Comment comprendre, puis s’adapter au langage technique des autres professionnels ?

- Comment aider à l’interopérabilité ?

- Comment s’adapter à la mondialisation ?


- VERS L'ETAT FINAL : LA CONNAISSANCE .....

A la fin du processus de transition, on arrive à un état de "connaissances", caractérisé par différents facteurs :

- une organisation autour d'un partenariat, mettant en relation les spécialistes du domaine avec les utilisateurs, chacun partageant son expérience

- l'utilisation d'outils de type ontologies : permettant des vérifications des informations manipulées, en termes de cohérence, de complétude (déduction automatique éventuelle d'informations manquantes)

- Mais, ... la complexité est alors très élevée : nécessitant l'appel à des compétences externes.



Les ontologies

- Origine du terme :

Ontologie : étude de ce qui est

« Ontos » (être) et « logos » (science, langage)

Objectif : tenter de répondre aux questions :

Qu’est ce qui caractérise ce qui est ?

Eventuellement, qu’est-ce qu’être ?


- Qu'est-ce qu'une ontologie ?

Une description explicite d’un domaine, fournissant : des concepts, propriétés et attributs des concepts, des contraintes sur les propriétés et les attributs

- des individus (souvent, mais pas toujours)


Une ontologie définit : un vocabulaire commun ET une compréhension partagée (grammaire) : règles, axiomes


- Intérêt des ontologies : partage de contexte Schéma : M.A. Aufaure



Pourquoi ?

- Afin de mettre d'accord sur le sens des termes employés dans une organisation, une communauté, un métier (exemple : termes de charpente bois et de charpente métallique)

- Faire en sorte que les personnes et les logiciels se comprennent


Comment élargir le contexte partagé ?

Deux moyens fondamentaux :

- Le dialogue :

  • informel : discussion, email
  • formel : protocoles, formation

- l'utilisation d'une référence sémantique commune :

  • informelle : description textuelle, dictionnaire, ...
  • formelle : méta-données, ontologies, thésaurus, ...

- Ontologie = modèle formel utilisé pour la représentation des connaissances à partager



Exemples d'ontologies

  • Ontologie de la mobilité douce, développée à l'Université de Genève par Claudine Métral :


  • OTN : ontology of transport network, REWERSE Project :




- Construction d'une ontologie :

La méthode de construction est la suivante :

1) Spécifier : identifier le domaine et le but de l’ontologie

bien spécifier  : l'évaluation et la réutilisation possibles

2) Acquérir les connaissances  : expertise des experts, textes d’articles (text mining), méta-données de bases de données, etc.

dresser une liste de questions de compétences

3) Conceptualiser : identifier les concepts-clés du domaine, leurs propriétés et leurs relations ; identifier les termes du langage naturel ; structurer le savoir du domaine

4) Intégrer : utiliser ou spécialiser une ontologie existante

5) Encoder : choisir un langage de représentation formel : CL, Ontolingua, Logiques de description, Graphe conceptuel, RDF Schema, DAML OIL

6) Documenter : produire des définitions formelles, informelles, complètes, pour préciser la signification des termes de l’ontologie ; donner des exemples

7) Evaluer : déterminer l’adéquation de l’ontologie pour l’application visée ; évaluation à faire de façon pragmatique

critères : cohérence, complétude, concision (pas de redondance, bon degré de granularité), etc.




Pourquoi utiliser des ontologies ?

- Scenario 1 : Ontologie en tant que spécification

- Guider le développement de systèmes opérationnels et en faciliter la maintenance

- Permettre la réutilisation de connaissances pour un ensemble d’applications


- Scenario 2: Ontologie pour le partage de données

- Réduire le coût de développement d’applications et assurer l’interopérabilité

- Permettre l’accès à un ensemble de données hétérogènes dans un format unique


- Scenario 3: Ontologie pour la recherche d'information

- Fournir une méthode d’accès générique à des ressources particulières

- Fournir un index pour retrouver de l’information pertinente (annoter un document)

- Aider les utilisateurs à formuler une requête, une interrogation

- Fournir des capacités de raisonnement et de déduction permettant de vérifier la validité, l’exactitude, la cohérence des informations et aussi de compléter une information manquante




UTILISATION : intégration sémantique

  • On a l’impression d’utiliser un système centralisé et homogène ....
  • Mais le système réel (situé à droite sur la figure ci-dessous) peut être TRES complexe !




Quels sont les bénéfices de cette approche par construction d'étapes permettant une transition des données vers la connaissance ?

- Fournir un moyen puissant de maîtrise de l’information, associé à des outils de déduction automatique et de vérification de la cohérence de cette information

- On sait déjà faire ce type de travail avec des données numériques (traitements statistiques, par ex.… )

- Ici, le raisonnement porte sur des « concepts » (informations, connaissances, organisations) et non plus sur les données : C'est ce qui constitue le caractère innovant de l’approche CODATA F - O3D



Apports de CODATA France – O3D : fournir les méthodes et outils permettant de travailler sur ces concepts, afin d’apprendre à construire sa propre expertise


* Justification de l'application de l'approche aux données du développement durable : dans la mesure où ce type de données constitue un exemple d’application complet, mais aussi suffisamment complexe pour permettre la validation de la démarche




Bibliographie

  • Références sur les ontologies :

Des articles fondateurs : Ontologies, principles, methods and applications : http://www.starlab.vub.ac.be/teaching/uschold.pdf

http://www-ksl.stanford.edu/KSL_Abstracts/KSL-92-71.html

The International Association for Ontology and its Applications : http://www.iaoa.org/

Un grand nombre d'exemples d'ontologies (représentations de type "frame" ou OWL) sont proposés sur le site de l'éditeur d'ontologies Protégé : Protégé, exemples d'ontologies

Un moteur de recherche sémantique : SWOOGLE permet d'avoir accès à un grand nombre d'exemples d'ontologies et de documents relatifs aux ontologies


  • Références sur les données du développement durable :

Banque mondiale : http://data.worldbank.org/data-catalog

CIA : https://www.cia.gov/library/center-for-the-study-of-intelligence/csi-publications/csi-studies/index.htm

Ministère de l'écologie, du développement durable et de l'énergie : http://www.developpement-durable.gouv.fr/-Donnees-indicateurs-et-.html

FAO Country Profiles, geopolitical information : http://www.fao.org/countryprofiles/geoinfo.asp?lang=en


  • Action de recherche COST TU 0801 SEMCITY :

http://www.semcity.net/

http://semcity.unige.ch/semcity/doku.php/tu0801

Pour avoir une liste d'outils (tools) et d'ontologies du domaine de l'urbanisme (urban ontologies) :

http://semcity.unige.ch/semcity/doku.php



  • Blogs O3D :

http://codatao3dclubsebastopol.blogspot.com/p/clubs-codata-o3d.html

http://codatao3dclubsebastopol.blogspot.com/

http://clubo3dclubdegeneve.blogspot.com/

http://codatao3dclubsebastopol.blogspot.com/p/codata-france.html


  • CODATA International :

http://www.codata.org

Annexes

Notes