|
David Genest / Recherche / Recherche d'information |
||||||||
Recherche d'informationLa recherche d'information concerne les mécanismes qui facilitent l'accès à une base d'informations. Il existe un grand nombre de modèles de recherche d'information, et ces modèles diffèrent principalement sur la façon dont les informations disponibles sont représentées, et sur la façon d'interroger la base. À l'origine de l'utilisation d'un système de recherche d'information, il y a un besoin d'information. Une « recherche d'information » est une démarche faite par un utilisateur, pour, à partir de ce besoin, obtenir à l'aide du système les informations (ou les références vers les informations) qui peuvent répondre à son besoin. Pour cela, la plupart des modèles demandent à l'utilisateur d'exprimer son besoin en utilisant le langage de requête du modèle. À partir de la requête, la fonction de correspondance du modèle extrait de la base les informations qui sont susceptibles de répondre au besoin. Habituellement, cette fonction n'utilise pas les informations de la base, mais les indexations, qui sont des représentations des informations, dont le but est d'améliorer les performances de la fonction de correspondance (temps et qualité des résultats). Ainsi, le principal problème en recherche d'information concerne le choix de la représentation des informations, car de ce choix dépend la fonction de correspondance, et donc la qualité des résultats et la satisfaction des utilisateurs. Approche logique de la recherche d'informationDans un grand nombre de modèles, la recherche est effectuée par une estimation de la similarité entre la requête et chaque indexation. Les indexations qui ressemblent le plus à la requête sont estimées comme étant les plus pertinentes car plus proches de l'expression du besoin, et les informations qui correspondent à ces indexations sont présentées à l'utilisateur. D'autres modèles proposent que le mécanisme de recherche soit fondé sur un raisonnement. Ce raisonnement vise à simuler le comportement d'un expert qui aurait à juger la pertinence d'une information pour un besoin donné. Mes travaux s'inscrivent dans la deuxième approche, habituellement désignée sous le nom d'approche logique de la recherche d'information et introduite par van Rijsbergen. Dans les modèles basés sur l'approche logique, la représentation se fait par des formules logiques (ou en utilisant des modèles de représentation de connaissances) et la fonction de correspondance est basée sur la déduction (ou des opérations de raisonnement). Recherche d'information et graphes conceptuelsMes travaux visent à permettre d'utiliser le modèle des graphes conceptuels pour fournir une représentation des informations disponibles et des besoins des utilisateurs ainsi que l'opération de recherche. La principale particularité de ce modèle est la possibilité de représenter des connaissances sous forme graphique. La lisibilité due à la possibilité de « dessiner » des graphes conceptuels permet à des utilisateurs de comprendre, créer ou modifier directement les objets utilisés par le système pour représenter les informations (ou les besoins). Le recours à un « traducteur » entre une forme interne au système et une forme visible par l'utilisateur est alors évité. Ceci permet donc d'éviter les problèmes d'ambiguïté ou de perte de précision qui pourraient survenir lors de la traduction. L'autre particularité du modèle est de fournir des raisonnements sous la forme d'opérations de graphes, ce qui renforce la lisibilité du modèle puisque certains raisonnements peuvent aussi être présentés graphiquement à un utilisateur désireux de comprendre le cheminement suivi par le système. Il peut être intéressant de fournir un maximum d'indications qui permettent de se faire une idée précise de la pertinence réelle de l'information retrouvée par le système, sans avoir à consulter cette information. Un grand nombre de systèmes fournissent une information quantitative du type « pourcentage de pertinence ». Nous proposons ici une information qui peut décrire de façon précise la façon dont une information a été jugée pertinente (quelles parties de la requête sont traitées, quelles ne le sont pas, etc.). Un tel mécanisme ne permet certes pas d'améliorer la qualité des résultats d'une requête, mais il peut aider l'utilisateur dans sa démarche de recherche d'information. Car une telle démarche n'est pas simplement l'exécution d'une requête, mais plutôt un « dialogue » avec le système pour arriver jusqu'aux résultats effectivement pertinents. De telles informations sur le raisonnement suivi par le système font partie des mécanismes qui peuvent aider l'utilisateur à arriver plus rapidement aux informations lui permettant de résoudre son besoin. Cependant, les opérations du modèle des graphes conceptuels sont orientées « recherche de réponses exactes » et ne sont pas adaptées aux impératifs de la recherche d'information. Une extension du modèle a donc été proposée, dont la principale particularité est de permettre la recherche de réponses pertinentes en considérant des transformations de graphes. De nouvelles opérations sont définies, elles permettent de juger la pertinence d'informations traitant d'un sujet proche ou d'une partie du sujet exprimé dans la requête, et fournissent un classement des réponses. Participation à des projetsAfin de valider notre approche, nous avons construit une maquette de système basée sur notre modèle et le thésaurus Rameau. Ce système a été expérimenté en collaboration avec l'Agence Bibliographique de l'Enseignement Supérieur et la Bibliothèque Universitaire de Montpellier. Les résultats ayant été jugés satisfaisants, nous nous sommes ensuite intéressés à la recherche d'information dans des documents multimédias. La prise en compte des spécificités de ces documents se fait au sein d'un travail (le projet PRIAMM Opales) mené en collaboration avec l'Institut National de l'Audiovisuel, et les équipes Représentation de connaissances et raisonnements des graphes et Interaction homme machine du LIRMM. SAPHIR (Projet ANR RIAM 2006-2009) (Système d'Assistance à la Publication Hypermédia par spécification d'Intention et modélisation Rhétorique) Ce projet propose d'étudier et de valider un environnement interactif de construction de publication hypermédia de contenus audiovisuels permettant à un auteur/utilisateur de spécifier la publication visée par les intentions de discours qu'il poursuit. Les intentions sont exprimées de manière rhétorique et sémiotique à l'aide d'ontologies et de connaissances associées. Des mécanismes de raisonnement formalisés en graphes conceptuels permettent d'associer les contenus audiovisuels indexés aux structures rhétoriques et d'exploiter les ontologies. L'assistance produite par le système comportera les étapes suivantes : la recherche de contenus, l'élaboration d'une trame argumentative reflétant les intentions de l'auteur et les mises en forme hypermédias correspondant à différents supports, en particulier Web, CD, DVD, Mobile. La participation du laboratoire sur le projet peut se découper en plusieurs points :
LOGOS (Projet européen IST 2006-2009) Le but de ce projet est de faciliter l'apprentissage à distance à l'aide de
documents audiovisuels, en utilisant les moyens de communication actuels,
tels que la diffusion sur IP, mobile, et télévision numérique. Des modèles et
un environnement d'apprentissage seront construits pour faciliter la
construction de cours, en exploitant les spécificités de ces médias. Notre
participation concerne les aspects représentation de connaissances du projet.
Le modèle des graphes conceptuels sera utilisé pour l'indexation et la recherche au sein du projet. |
|||||||||