Plateforme Excom : annotations sémantiques automatiques de textes et indexation
resp. J.P. Desclés, B.Djioua, F. Le Priol

http://www.excom.fr

Comme le bilan l'a fait apparaître, la technique d'Exploration Contextuelle et sa réalisation effective pour les annotations automatiques est devenue opérationnelle pour de gros volumes avec EXCOM 2.

Nous devons continuer à développer le système d'indexation à partir des annotations discursives. Nous devons expérimenter de gros volumes ; procéder à des évaluations sur ces volumes ; améliorer les interfaces des différents types d'utilisateurs ; après la phase d'indexation, ordonnancer les réponses en tenant compte des annotations portées par les annotations.

Les « cartes sémantiques » apparaissent bien comme des « ontologies linguistiques » (plus exactement des « ontologies discursives »). Les annotations automatiques développées selon différents points de vue (identifications de définitions, citations –discours rapportés -; de relations causales, relations entre concepts – localisation, ingrédience, attribution, appartenance à une classe…. – relations entre événements ; repérages des renvois bibliographiques avec catégorisation des opinions s’y rapportant…) servent, entre autres, à construire les ontologies de domaines à partir d’extractions automatiques d’informations. Les annotations étant automatiques, elles sont utilisées pour la construction automatique de fiches de synthèses catégorisées et également pour la fouille sémantique de textes.

Nous proposons de participer à un projet transversal dans le cadre de l'université Paris-Sorbonne en expérimentant nos outils linguistiques et informatiques sur la base en ligne des thèses et articles. La collaboration avec la Corée (débutée en 2003) se poursuit activement avec des contrats en cours. Un contrat avec l'AUF associant plusieurs pays (Albanie, Maroc, France...) démarre fin 2008 pour plusieurs années. La plateforme EXCOM 2 et ses nouvelles possibilités d'indexation suscite plusieurs demandes de collaboration internationales : UQUAM au Canada (J.G. Meunier), Emirat Arabes Unis (traitement de l'arabe, J. Berri), Tunisie (R. Faiz)...Si le développement des plateformes EXCOM et EXCOM 2 est le résultat d’un réel travail interdisciplinaire d’une équipe aux multiples compétences (informatiques et linguistique), il entre dans une phase nouvelle qui nécessitera des partenaires nationaux et internationaux pour mieux expérimenter la fiabilité de la méthode et de la plateforme.