OMNIA

  • Projet ANR 2008 – 2011
  • Mots Clefs : Catégorisation et recherche par le contenu d’images, Apprentissage et classification multimodale, Analyse de données textuelles multilingues, UNL
  • Description : Le projet OMNIA vise à filtrer des documents contenant du texte et des images, dans un contexte de grandes masses de données, tels que ceux trouvés dans des intranets et sur Internet, et à les présenter aux utilisateurs dans un outil de traitement de contenu comme DocuShare (Xerox).
    L’originalité du projet est de travailler sur 3 dimensions : image, texte, émotion et dans un contexte multilingue. L’image et le texte donnent lieu à 2 catégorisations relatives aux aspects informationnels et aux aspects émotionnels spécifiques (provenant directement de l’image, ou afférents à sa perception exprimée dans le texte). Ces deux types de contenus seront traités indépendamment (annotation puis indexation et catégorisation), avec des techniques d’apprentissage, et ensuite fusionnés au niveau de l’outil de filtrage et d’interrogation. Leurs “primitives” seront reliées à une représentation interlingue des sens de mots fondée sur l’anglais (UNL), ce qui ouvrira la voie au multilinguisme de la “publication” des catégories des documents, et du traitement de questions dans les langues naturelles munies de dictionnaires UNL.
  • Participants : David Rouquet, Christian Boitet, Valérie Bellynck, Hervé Blanchon, Achille Falaise, Jérôme Goulian, Jean-Philippe Guilbaud, Hong-Thai Nguyen , Didier Schwab
  • Partenaires : XEROX, Xerox Research Center Europe, Luca Marchesotti
    LIRIS, Ecole Centrale de Lyon, Liming Chen
  • Publications :
    • 2010, Achille Falaise, David Rouquet, Didier Schwab, Hervé Blanchon, Christian Boitet, Ontology driven content extraction using interlingual annotation of texts in the OMNIA project, workshop CLIA, COLING, Bejin, China
    • 2010, David Rouquet, Achile Fallaise, Didier Schwab, Hervé Blanchon, Vallérie Bellynck, Christian Boitet, Emmanuel Dellandréa, Ningning Liu, Liming Chen, Alexandre Saidi, Sandra Skaff, Luca Marchesotti, and Gabriela Csurka, Classifiation multilingue et multimédia pour la recherche d’images dans le projet OMNIA,workshop RISE, Inforsid, Marseille, France
    • 2009, David Rouquet and Hong-Thai Nguyen, Interlingual annotation of texts in the OMNIA project, LTC09, Poznan, Poland
    • 2009, David Rouquet and Hong-Thai Nguyen, Multilinguïsation d’une ontologie par des correspondances avec un lexique pivot, TOTh09, Annecy, France

 

Groupe d'Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole