Le 20 novembre 2019, Damien Nouvel interviendra dans le cadre du séminaire du labex OBVIL, sur le sujet suivant:
"Les entités nommées, du prétraitement à la sémantique, théorie et pratique"
Résumé: Ces dernières décennies, le Traitement Automatique des Langues a bénéficié de nombreuses avancées sur le plan théorique et applicatif. Certains traitements ont aujourd'hui une robustesse suffisante pour être considérés matures dans certains contextes. Par exemple, l'étiquetage en parties du discours (POS tagging) est couramment utilisé en amont d'autres tâches, comme prétraitement.
À cet égard, il reste difficile d'établir un état des lieux fiable pour les entités nommées. Certaines applications les utilisent comme prétraitement syntaxico-sémantique, sur lequel elles s'appuient, présumant parfois de leur fiabilité. De nombreux travaux recherche sont menés pour mieux cerner ces unités linguistiques et les traiter automatiquement. Dans ce séminaire, nous présenterons diverses facettes des entités nommées, au travers des langues et des domaines, les tâches qui y sont associées (dont en particulier leur désambiguisation), ainsi que les résultats obtenus par les campagnes d'évaluation historiques et plus récentes. Nous évoquerons les approches et architectures utilisées et évoquerons l'apport des plongements de mots (embeddings). Enfin, nous discuterons des ambitions et limites de la désambiguisation des langues dans une perspective de compréhension.
Date et horaire: 20 novembre 2019, de 13h à 15h
Lieu: salle D323, Maison de la recherche, 28 rue serpente, 75006.
Séminaire organisé par Motasem Alrahabi et Glenn Roe.