Ontologies, modèles discursifs et web sémantique
resp. A. Jackiewicz, P. Laublet

On se propose de développer, d’une manière originale, les recherches de deux domaines et leurs convergences qui ont commencé à être construites depuis 2006 : le domaine des ontologies et du Web sémantique (WS) et celui de la linguistique textuelle (énonciation, modèles discursifs, …). Une double articulation est proposée, la première entre des ontologies de différents types, la deuxième entre modèles linguistiques et ontologies.

a) Ontologies du domaine et ontologies discursives : le WS s’appuie prioritairement sur la mise en place d’une couche descriptive constituée de structures sémantiques, graphes d’annotations contraints par des ontologies qui sont au cœur du WS. Mais les annotations sémantiques les plus souvent proposées sont limitées à des ontologies de domaine (contenu) et ne prennent que peu en compte les différentes dimensions du document : énonciation, structures discursives, actes discursifs… Pourtant, les études récentes sur l’ontologie OntoDiscours (Jackiewicz et Laublet 2007) ont permis d’explorer l’intérêt de cette articulation. Celle-ci permet en effet d’annoter des segments textuels d’un double point de vue: annotations discursives et de contenu en restituant ainsi les contextes énonciatifs d’origine (validité, évaluation, ….).

b) Modèles discursifs et ontologies : le passage des textes aux représentations formelles (ontologies) nécessite une phase de modélisation proprement linguistique. Dans le cas de la linguistique du discours, les modèles existants sont encore partiels et ne couvrent que certains aspects de la textualité (relations anaphoriques, certaines relations rhétoriques...). La catégorisation systématique des unités sémantiques supérieures à la phrase du point de vue de leur fonction dans l’énonciation est encore à développer. De même, certains actes fortement institutionnalisés, comme par exemple les actes d'évaluation n'ont pas fait, à notre connaissance, l'objet d'études approfondies à l'échelle du discours. Les modèles linguistiques sont le produit de réflexions théoriques et d’études fines de corpus. Les ontologies sont explorées en tant que représentations formalisées, intermédiaires entre ces modèles linguistiques et des processus soit d’annotation manuelle, soit semi-automatiques avec l’aide de chaînes de traitements informatiques.

Recherches proposées : elles nécessitent d’avancer simultanément sur les notions mobilisées, leurs articulations et les champs applicatifs choisis :

a) Ontologies de domaines : construction à partir de textes ; peuplement par extraction ; couplage WS et Web 2.0 (suite du projet Athena –EDF) ; évolutions des ontologies à partir de nouveaux textes et de nouvelles connaissances (projet ANR – Dynamo).

b) Modélisations discursives : relations sémantiques et énonciatives ainsi que leurs articulations à l'oeuvre dans l'acte discursif d'évaluation ; en particulier jugements d'évaluation portant sur (i) les discours rapportés dans des blogs et dans la presse de spécialité, (ii) la validité des raisonnements causaux (paralogismes, critères scientifiques de causalité) dans des textes scientifiques, (iii) la réputation des acteurs économiques dans des médias spécialisés.

c) Ontologies en linguistique du discours : modélisation ontologique de deux familles de relations de cohésion : relations de connexion et relations d'indexation ; Des développements plus poussés concerneront les relations causales pour la première famille et les cadres énonciatifs pour la deuxième. De plus, l’articulation de ces ontologies et de celles du domaine devra reposer sur un modèle d’annotation, bien formalisé, empruntant aux réalisations du WS.

d) Applications suite des recherches des responsables de l’opération : domaines applicatifs du projet ANR 2008 Dynamo (évolution des ontologies), application avec EDF R&D et Mondeca (Web sémantique et Web 2.0). Une partie importante des recherches futures portera sur l’étude des contenus « subjectifs » : conceptualisation des notions d’opinions et de jugements d’évaluation avec la construction de modèles linguistiques et d’une ontologie formelle qui seront utilisés dans des applications comme identifiées dans le projet Ontopitex soumis à l’ANR.