10e Journée scientifique de la C R L

organisée par la

Cellule de Recherche en Linguistique (CRL - Association loi 1901)

avec le concours du laboratoire LaLICC (Langages, Logique, Informatique, Cognitiion & Communication)

Samedi 7 octobre 2006

Sémantique, web sémantique et ontologies 

Journée préparée et coordonnée par Jean-Pierre DESCLES

Philippe LAUBLET (Paris IV-Sorbonne / CNRS - LaLICC)

Les ontologies au cœur du web sémantique

L’expression Web sémantique (WS), due au W3C (World Wide Web Consortium), fait d’abord référence à la vision du Web de demain comme un vaste espace d’échange de ressources entre êtres humains et machines permettant une exploitation, qualitativement supérieure, de grands volumes d’informations et de services variés. Pour arriver à ce résultat, le Web doit d’abord se munir de protocoles de communications communs et de langages informatiques de représentation de connaissances consensuels. Mais parmi les aspects centraux pour le WS, les  recherches portant sur les ontologies (au sens de l’utilisation de ce mot en ingénierie des connaissances) sont maintenant largement reprises et utilisées. Celles-ci sont proposées pour munir d'annotations et de métadonnées les ressources du Web, particulièrement les documents textuels et des fragments de ceux-ci et pour répondre à la vaste question de l'interopérabilité entre outils et ressources largement hétérogènes. Dans cette présentation nous insisterons sur ces aspects, en tentant de faire comprendre le WS,  qui est d'abord un vaste projet d'enrichissement des ressources du Web par une couche de représentation sémantique des contenus, même si cela ne saurait suffire à décrire l'ampleur et les impacts d'un tel projet. Nous terminerons en tentant de discuter de la portée réelle du WS et de différentes questions que pose une telle démarche.

Philippe Laublet, Chantal Reynaud, Jean Charlet, Sur quelques aspects du Web sémantique, Assises du GDR I3 , Editions Cépadues, Nancy, décembre 2002
http://www.lalic.paris4.sorbonne.fr/stic/articles/03-WebSemantique.pdf
Jean Charlet, Philippe Laublet, Chantal Reynaud, (Eds) Le Web Sémantique, Hors série de la revue I3 (Information, Interaction, Intelligence), Volume (4), N°1, Ed. Cépadues, 2004.
http://www.revue-i3.org/hors_serie/annee2004/
Jean Charlet, Philippe Laublet, Chantal Reynaud, Web Sémantique, Encyclopédie des systèmes d’information, Chapitre Intelligence artificielle, Daniel Kayser (éditeur), Vuibert 2005.


Nathalie AUSSENAC-GILLES & Anne CONDAMINES

(Université Paul Sabatier - Toulouse / IRIT)

Questions linguistiques liées au web sémantique, à la construction et à l’utilisation des     ontologies.

La mise en place du web sémantique repose sur l'hypothèse que l'on pourra disposer et utiliser des ressources conceptuelles et terminologiques telles que les ontologies. La bonne gestion de l'articulation de ces modèles de connaissances avec la langue en usage dans les textes disponibles sur le web est un des enjeux qui conditionne le succès du web sémantique. La linguistique, et particulièrement la linguistique de corpus, peuvent apporter un éclairage théorique mais aussi des principes d'analyse et des outils pour mieux appréhender ces questions, voire même pour signaler des limites aux hypothèses du web sémantique. Notre exposé illustrera ce propos à travers plusieurs questions liées au web sémantique. La première question est celle des corpus, de leur caractérisation et de l'intérêt de la notion de genre pour cadrer l'usage de techniques et de logiciels d'analyse. L'étude des genres permet d'anticiper les difficultés ou avantages que peuvent présenter certains textes du web. La deuxième question est celle de l'intérêt des approches linguistiques pour identifier dans les pages web des éléments de connaissances. Cette question se pose tant au moment de construire ou enrichir des ressources termino-ontologiques qu'au moment de les exploiter pour indexer ou annoter des documents à l'aide de représentations formalisées. En particulier, nous insisterons sur les approches par marqueur pour le repérage de connaissances à travers la caractérisation de phénomènes de langue. Nous montrerons comment ces contributions de la linguistique peuvent trouver leur place dans des méthodes de construction d'ontologies à partir de textes, dans des procédés d'indexation ou d'annotation à l'aide de méta-données.


Henri MADEC (Université de Franche-Comté / Centre Tesnière)

Construction d'une ontologie web XML portant sur la littérature antique: gestion et exploitation des données.

Pour comprendre, traduire certains passages de la Guerre des Gaules ( en particulier la guerre de César contre les Vénètes) il est nécessaire de pouvoir utiliser des ontologies sur la littérature et la civilisation romaines. La mise sous forme XML des informations est nécessaire pour disposer de bases de connaissances adéquates pour évaluer le sens des mots et déduire des informations de portée générale. L’exposé partira des données historiques apportées par la Guerre des Gaules de César et  cherchera  à comprendre le passage sur la guerre contre les Vénètes. Aujourd’hui on est incapable de situer géographiquement ce peuple, ni même de savoir s’il a existé.  Le texte de César reste flou, incertain et son récit contient de très graves contradictions, même s’il existe de « bonnes traductions » de cet ouvrage. Le but est de répondre à certaines questions que les recherches historiques laissent dans le flou. Les outils mis en place par XML/RDFS/OWL/  permettent de mettre des connaissances à la disposition des chercheurs. Les outils comme Xpath, Xquery, etc.. permettent les recherches d’informations dans les fichiers type XML.. Les outils de type PSM Problem Solver Method permettent de raisonner au mieux sur les ontologies et les bases de connaissances. Le traitement linguistique, lui, contribue à rendre plus précis les calculs associés aux fonctions associées aux mots traitant la forme des bateaux , leur comportement sur mer, informations mises dans les fichiers XML/RDFS/OWL. Ces résultats seront cohérents avec toutes les données calculées sur l’ensemble du texte et sur les passages amenant à construire une idée générale et cohérente logiquement et mathématiquement avec les événements dans leur totalité.

Brahim DJIOUA, Florence LE PRIOL (Paris IV-Sorbonne / CNRS - LaLICC) (transparents de l'exposé)

Annotation automatique selon des points de vue discursifs et indexation

Les recherches d’informations dans de grandes bases de documents textuels fermées ou ouvertes comme le Web sont basées essentiellement sur la co-présence de termes linguistiques. Nous proposons une nouvelle approche d'accès aux contenus qui se présente à travers deux machines :

(i) une machine d’annotation automatique d’informations discursives des textes basée sur la méthode d’Exploration Contextuelle,

(ii) une machine d’indexation des segments annotés permettant ainsi des recherches d’informations à travers des points de vue sémantiques et, dans certains cas, de constituer automatiquement des parties d’ontologies de domaines.

Jean-Pierre DESCLÉS (Paris IV-Sorbonne / CNRS – LaLICC) (transparents de l'exposé)

Schèmes sémantiques de temporalité et de spatialité

L’exposé présentera quelques éléments de la théorie générale des « lieux abstraits » et des schèmes sémantico-cognitifs qui y font appel. Cette modélisation s’inscrit dans le courant actuel de la sémantique cognitive (Jackendoff, Langacker, Talmy, Vandeloise aux USA ; Pottier, Culioli, Desclés, Abraham en France) avec des représentations formelles utilisant le l-calcul typé de Church et la logique combinatoire de Curry. Elle sera illustrée par des exemples autour de la polysémie verbale et de la représentation sémantique des prépositions relevant de la verbalisation spatio-temporelle ; ces exemples sont destinés à ouvrir une discussion sur les rapports entre les ontologies générales et les représentations formelles issues de l’analyse sémantique des langues naturelles et posera le problème suivant : les résultats des analyses sémantiques de la linguistique sont-ils utiles et ré-utilisables dans les constructions d’ontologies ?…

Jean-Pierre Desclés , Langages applicatifs, langues naturelles et cognition, Paris, Hermès, 1990.

Maryvonne Abraham, Jean-Pierre Desclés, Sémantique cognitive, ouvrage à paraître, 2006