Ioannis KANELLOS1
Philippe KERVELLA et Eric GUIZIOU2
André HATALA et Sybile CLOCHET3
Olivier BRANELEC4

ioannis.kanellos@enst-bretagne.fr

 

 

Genres picturaux et catégories ontologiques. Structure des données pour l'indexation et la recherche d'information par le contenu adaptée au profil d'un visiteur de musée virtuel. Résultats du projet Knossos .

 

 

Objectif de la communication  :

Présenter les travaux et les conclusions du projet Knossos , un projet RNTL (Réseau National des Technologies Logicielles), dont l'objectif est de mettre sur pied un système générique d'indexation et de recherche d'information par le contenu de larges bases d'images, faisant appel à une conception particulière d'ontologie. L'organisation ontologique est réalisée sur fonds textuels et devient capable de prendre en compte différentes formes de parcours adaptées à des visiteurs virtuels. L'application est faite sur la collection des œuvres du musée du Louvre.

Contexte et Argument :

Dans l'imaginaire d'un musée virtuel, notion de plus en plus précise, le thème de parcours occupe une place prédominante. À regarder les choses de près, on se rend cependant compte que ce thème est toujours accompagné d'un autre, celui du profil du visiteur. En effet, le musée virtuel de demain est une construction autour d'un faisceau de parcours, adaptables au niveau, à l'objectif et à la pratique de chaque utilisateur.

Ces notions, plutôt vagues et ne bénéficiant d'aucun consensus scientifique, reformulent cette exigence récurrente d'un héritage culturel, enfin sans limites d'accessibilité, et à la portée de tous, grâce, précisément, aux Nouvelles Technologies d'Information et de Communication (NTIC). Même si le rêve est encore plus dominant que la réalité dans une telle conception, il ne reste pas moins que la modélisation du profil du « visiteur » transite systématiquement par la structure des données du système qui donne corps et fonction au musée virtuel.

Ainsi, le discours croise rapidement des termes comme « ontologie », « point de vue », « méta-données », « contenu », « hyperlien » etc . Ces termes, généralement inévitables, transcrivent un besoin récurrent : de rapporter le couple « profil/parcours » à des éléments d'information de base. Très tôt, on admet alors que la description des « objets » (généralement des images et des textes) formant les ressources virtuelles à « exposer », doivent contenir quelque sémantique. Une telle préoccupation amène inévitablement le thème d'indexation. Mais aussi sa classe de problèmes. En effet, l'indexation par le contenu, encore plus lorsqu'il s'agit d'items culturellement riches et complexes du point de vue de leur représentation, est une opération extrêmement coûteuse si l'on veut la mener avec souci de détail et de cohérence. De l'autre côté, on se rend compte de deux choses, point secondaires : i) que le parcours n'est qu'un cas particulier de recherche, et ii) que la recherche est fortement conditionnée par la structure d'indexation. Autrement dit, dès sa formulation, le problème d'un musée virtuel devient celui d'une corrélation fonctionnellement performante entre une structure d'indexation et les fonctionnalités de recherche qu'elle rend possibles pour réaliser un modèle du couple fondamental « profil/parcours ».

Études et réalisations :

Cette dernière idée définit un programme de recherche. Elle était constitutive du projet Knossos , qui a rassemblé autour d'un problème initial, celui de la promotion du site www.louvre.edu en authentique musée virtuel, un ensemble d'efforts de théorisation, de modélisation, de conception et, enfin, de réalisation informatique.

Plus concrètement, le projet Knossos propose une plate-forme informatique intégrant un poste d'indexation au-dessus d'une ontologie de domaine, ainsi qu'une série de potentialités de recherche d'images issues d'un corpus déterminé. Même si le cas de son étude concerne la collection des œuvres d'art du musée du Louvre, le système développé est configurable et peut supporter les mêmes fonctionnalités pour tout corpus d'images répondant à une classe d'exigences exprimées sur le plan de la représentation des connaissances (ontologie du domaine). Suivant un principe herméneutique (de la détermination du local par le global) le système est réglé par la notion de genre pictural , une donnée globale issue d'une extraction de connaissances expertes réalisée en amont, qui détermine l'organisation de l'ontologie (dans le cas de la peinture, il s'agit des genres « portrait », « nature morte », « scène mythologique », « scène religieuse », « paysage » etc .). Cette notion se décline en plusieurs points de vue (« plastique », « descriptif », « interprétatif », « documentaire » etc .) qui retracent des agrégats d'information de bas niveau, de type (Attribut, Valeur) .

Cette modélisation, typiquement top-down , et dont les idées directrices sont empruntées à la linguistique, plus précisément à une théorie de sémantique de l'interprétation, soutient l'ensemble des fonctionnalités d'indexation, et, plus avant, de recherche d'information par le contenu. La modélisation du contenu est effectivement médiatisée par du texte. En d'autres termes, la textualité est le support sémiotique pivot, tant en situation d'indexation qu'en situation de recherche. Le contenu des images est, au fond, le produit d'une exploitation textuelle. Par l'exploitation d'un ensemble de principes ergonomiques ainsi que certaines idées issues de la théorie de la typicalité en psychologie cognitive, le système offre un environnement de travail permettant une indexation massive, affinable à volonté et à faible coût (on peut, par exemple, indexer des classes entières d'items ressemblants, récupérer l'indexation d'images similaires calculées en temps réel par le système, voire hériter une partie de la structure d'indexation d'images typiques qui existent pour chaque genre ou sous-genre).

En effet, le poste d'indexation est résistant à des augmentations de corpus même importantes (plusieurs milliers d'images), dans la mesure où l'indexation devient pour une large partie le résultat d'associations décidées sur des principes de ressemblance par l'utilisateur. Sur le plan de la recherche par le contenu, à part les fonctionnalités de recherche désormais standard (généralement par mots-clés), il est possible de rechercher par genre (et, à terme, par texte), mais aussi de déclencher une séance d'échange avec le système, lequel, de manière anthropocentrée, glane de l'information et oriente l'utilisateur dans les fonds de son ontologie, de manière conviviale. Par ailleurs, l'utilisateur peut opter pour une visite virtuelle, qui n'est qu'une modalité de la recherche. Ce dernier peut se réaliser suivant plusieurs principes de navigation, en passant d'une image à une autre (ou d'un ensemble d'images à un autre ensemble d'images), en réglant ses propres paramètres de « déambulation virtuelle » (par proximité générale ou similitude par point(s) de vue, par association, et même par combinaison des paramètres etc .), de manière assistée ou non. Toutes ces opérations se fondent sur une exploitation des ressources ontologiques, qui font résolument appel à des structures textuelles et lexicales.

Généricité :

Le système est conçu pour être un middleware . Il permet, entre autres, et de manière toujours interactive, de façonner une nouvelle ontologie, propre à une autre catégorie picturale, et, après validation, d'être utilisé dans le cadre d'autres corpus d'images.

Techniques utilisées :

Techniquement, le système Knossos fait appel à des technologies actuelles (RDF et XML pour la structuration des données, F-Logic et une réalisation écrite au-dessus de la plate-forme SLRI pour la gestion des ontologies, l'exploitation du concept de « schéma descriptif » (MPEG-7) pour la modélisation des genres picturaux, le tout à travers une programmation sous Java).

 

1École Nationale Supérieure des Télécommunications de Bretagne ( ENST-B , pour la direction scientifique du projet)
2Société ATLANTIDE (SSII du groupe ALTRAN, pour le développement informatique)
3Société ODA-Pages Jaunes (partenaire industriel, initiateur du problème et propriétaire du site www.louvre.edu)
4Société HIPPOCAMPE (promotion industrielle et valorisation des résultats)