Catégories discursives et textuelles
resp. J.P. Desclés, A. Jackiewicz


L’analyse des documents textuels et non plus simplement des énoncés fait apparaître des organisations textuelles importantes de différentes nature : organisation physique du texte (titres, paragraphes, phrases …) ; organisation par des opérations de « mise en texte » (énumérations, soulignements, adresses aux lecteurs, instructions de navigation) ; organisations discursives (indications explicites d’annonces thématiques, de résultats et de conclusions, d’hypothèses, de citations …) . De telles organisations et opérations sont signalées par des marqueurs linguistiques explicites qu’il s’agit alors d’identifier. Ces marqueurs ont été utilisés pour annoter automatiquement des textes pour répondre à des applications finalisées précises : résumé automatique, construction automatique de fiches de synthèse, extraction d’informations à partir de point de vue de fouille (comme « rencontre », évaluation des renvois bibliographiques à un auteur …) (voir la plateforme EXCOM dans le bilan et l’opération 7 ci-dessous). Contrairement à l’annotation morpho-syntaxique de corpus, l’annotation discursive est encore à ses débuts. L’identification des catégories pertinentes dans le domaine du discours et de leurs corrélats linguistiques nécessite un travail considérable, nécessairement collectif, afin de mutualiser les résultats et atteindre un consensus minimal sur les catégories à retenir.

Jean-Pierre Desclés continuera à étudier les différentes catégories discursives qui prennent place, dans l’analyse du langage, à côté des catégories grammaticales (par exemple la catégorie aspecto-modale) et- lexicales (par exemple avec la polysémie) et à encadrer les travaux de thèse et de masters portant sur ce sujet. Il s’agit en particulier de constituer des ressources linguistiques, c’est-à-dire sous la forme de marqueurs linguistiques catégorisés dans des classes qui reçoivent des interprétations sémantiques de nature discursive, qu’il faut élaborer. Ces ressources seront intégrées dans la plateforme EXCOM d’exploration contextuelle et d’annotation automatique. Ce travail sera mené en étroite collaboration avec l’opération 7.

Dans la suite des travaux d’Agata Jackiewicz (2002-2007) sur la causalité, la sériation et le discours rapporté, elle se propose de réaliser une étude linguistique en corpus de l’acte discursif d’évaluation. Précieuse pour la fouille d'opinions (application du TAL en forte progression ces dernières années), la notion d'évaluation n'a pas encore reçu en linguistique de description unifiante, exhibant son fonctionnement à différents paliers du texte. Elle s’attachera à mettre au jour et à les organiser les uns par rapport aux autres, les différents types de jugement qui fonctionnent (avec une terminologie souvent flottante : « évaluation », « validation », « valorisation », « valeur », « norme », « appréciation », « préférence », « jugement », « différend ») sous l’appellation d'évaluation. Ce travail sera mené en liaison étroite avec le projet décrit dans l’opération n°6 : « Ontologies, modèles discursifs et web sémantique ».