Edito

Les spécificités et orientations scientifiques du laboratoire LaLIC (Langues, Logiques, Informatique, Cognition) peuvent être résumées à :

Une articulation pensée et voulue entre :

• des recherches fondamentales et théoriques autour du langage, de la catégorisation, de la cognition computationnelle, de la sémiotique avec des représentations formelles (logiques, mathématiques) et informatiques ;

• des recherches finalisées orientées vers des applications précises relevant de l’ingénierie linguistique, de l’ingénierie des connaissances et de la communication qui viennent nourrir les recherches théoriques en posant de nouveaux problèmes, notamment autour et à partir des textes.

Une interdisciplinarité interne au laboratoire, réalisée par :

• les chercheurs et enseignants chercheurs, les doctorants qui ont une formation soit linguistique, soit informatique, soit mathématiques et, pour un certain nombre d’entre eux, une double compétence, souvent reconnue par une qualification multiple au CNU ;

• des thèmes de recherche interdisciplinaires impliquant des conceptualisations transversales et des méthodologies souvent nouvelles (exemple : l’exploration contextuelle);

• une volonté affirmée de prendre en compte des problèmes plus généraux de la communication (aspects sociaux, épistémologiques, prise en compte des usagers), d’où les interactions, qui vont s’amplifier dans la prochaine période, entre les équipes du laboratoire.

Une interdisciplinarité externe manifestée avec des collaborations avec d’autres laboratoires

(LATTICE, LIMSI, CERTAL (EA de INALCO), CRIP5 à Paris V); ENSSIB, Département des études arabes à Lyon, ENST-Paris et ENST-Bretagne) et avec des entreprises (Lingway ; Xistos, MONDECA …), sous forme d’opérations communes, de contrats de recherche ou de contrats CIFRE.

Un souci de participer à des programmes internationaux

qui nourrissent les approches théoriques par des données et problèmes propres à des langues différentes, en particulier avec l’ère des Balkans (Bulgarie, Albanie), la République Tchèque, le Maroc, la Tunisie, l’Algérie, la Corée du Sud (projets internationaux).

Un souci constant d’une réflexion épistémologique sur l’interdisciplinarité

en cherchant à éviter d’éventuels dérapages, sur les rapports et tensions entre d’un côté les sciences humaines (en particulier les sciences du langage et la sémiotique) et d’un autre côté, les techniques informatiques et ses représentations formelles, ainsi que sur l’analyse des « besoins », « réalisations » et « effets sociaux » de l’informatisation et des présupposés qui traversent la société contemporaine. Notre laboratoire réalise donc, en son sein, une réelle interdisciplinarité (et pas une simple multidisciplinarité), souvent souhaitée par la communauté scientifique, autour des problèmes du langage et certaines de ses dimensions cognitives. L’étude du langage est appréhendée à travers quelques langues, le français en priorité, sous différents aspects, depuis des études de linguistique théorique et formelle en sémantique, jusqu’à une mise en œuvre effective par des processus informatiques d’analyse des textes et de filtrage sémantique des informations dans des applications concrètes (par exemple le résumé automatique selon différents points de vue). D’autre part, le laboratoire développe une analyse spécifique des langages, des formes textuelles et des conditions d’interprétation de ces textes suscités par le développement des médias informatisés, ainsi que des pratiques d’écriture qui se développent autour d’eux. L’enjeu de ces recherches est de permettre une approche des usages qui comporte la teneur sémiotique et cognitive éclairante pour l’analyse de la circulation des textes et des savoirs dans la société.

Deux autres caractéristiques de notre laboratoire doivent être signalées :

Le programme de recherche appuie des formations doctorales de Paris-Sorbonne,

le Master mention « Information et communication », Spécialité recherche : Informatique et Ingénierie de la Langue pour la Gestion de l’Information (IILGI) et Spécialité Professionnelle Ingénierie de la Langue pour la Gestion Intelligente de l’Information (ILGII). Ces formations constituent ainsi un vivier de jeunes chercheurs en puissance.

Certaines opérations de recherche sont menées en étroite collaboration avec des entreprises

dans le cadre de contrats CIFRE - peu fréquents en SHS -.

A partir de cette année (2010)

L'équipe Langues, Logiques, Informatique et Cognition (LaLIC), dirigée par Jean-Pierre Desclés, intègre l'équipe Sens, Texte, Informatique et Histoire (STIH), dirigée par Olivier Soutet, dans la composante Informatique et Linguistique.

Les points forts du programme sont les suivants :

- Elaboration d’un programme plus systématique où recherche et traitements morphologiques et syntaxiques seront mieux articulés avec les représentations sémantiques et discursives que par le passé, en particulier en travaillant dans un cadre multilingue. - Construire les outils formels qui permettront de mieux fonder les ontologies des domaines et les ontologies formelles sur des bases plus linguistiques.

- Mise en œuvre effective : d’analyses morphologiques et syntaxiques de plusieurs langues, d’extraction d’informations par annotations sémantiques automatiques dans des textes (plateforme EXCOM), de réponses concrètes, sur des bases théoriques, à des problèmes de société, en particulier ceux des personnes handicapées (ANR Handicap 2008).

- L’intégration dans les programmes de recherche d’étudiants en Master 1 et 2 (avec, si possible, des co-publications) et, bien entendu, des doctorants dont les sujets de thèses sont, la plupart du temps, étroitement articulés entre eux.

Les travaux scientifiques de LaLIC sont nettement orientés vers le texte (et le discours) et les représentations sémantiques induites. L’articulation entre texte et sens est théorisée dans le modèle polystratal de la GAC. Ce modèle implique des analyses fines des configurations linguistiques (séquences de morphèmes et de lexèmes, séquences discursives…) et des techniques à la fois algorithmiques (grammaires formelles de dépendances et grammaires catégorielles), des représentations logiques et sémantiques (logique combinatoire, schèmes) et des stratégies heuristiques (techniques d’exploration contextuelle). A partir du résultat de ces analyses, il devient possible de construire, par des voies calculatoires, des représentations sémantiques qui instancient des schèmes sémantico-cognitifs (SSC) mettant au jour des primitives structurantes de nature cognitive.

Si l’équipe LaLIC a choisi de rejoindre l’Equipe « Sens, Texte, Informatique et Histoire » (responsable : O.Soutet) de Paris-Sorbonne, c’est pour les domaines communs en interaction « Sens » et « Texte ». Nos apports à cette équipe sont d’une part, les représentations formelles et d’autre part, les traitements informatiques intégrés dans des modèles et des architectures où des calculs effectifs deviennent possibles, ce qui permet de relier explicitement les configurations textuelles aux représentations sémantiques analysées dans une perspective cognitive et d’aller vers des applications concrètes.

Axes de recherche

Responsable scientifique : Patrice Pognan, professeur à l’INALCO

Axe A : Modélisation cognitive et formelle du langage et des langues

Opération n°1 : Données des langues, corpus et applications en TAL - (P. Pognan)
Opération n°2 : Catégorisations grammaticales et syntaxiques - (D. Lemay, P. Pognan)
Opération n°3 : Catégories grammaticales et schèmes sémantico-cognitifs (GAC, temps, aspect, espace, énonciation…) - (M. Abraham, D. Battistelli, J.P. Desclés)
Opération n°4 : Catégories discursives et textuelles - (J.P. Desclés, A. Jackiewicz)
Opération n°5 : Modélisation sémantique et logique de la catégorisation - (A. Pascu, J.P. Desclés)

Axe B : Ingénierie linguistique et modélisation des connaissances : des théories aux réalisations

Opération n°6 : Ontologies, modèles discursifs et web sémantique - (A. Jackiewicz, P. Laublet)
Opération n°7 : Plateforme Excom : annotations sémantiques automatiques de textes et indexation - (J.P. Desclés, B.Djioua, F. Le Priol)
Opération n°8 : Handicap : les pictogrammes de la perception aux langues - (M. Abraham)