Affiner les résultats
- Lederer Marianne23
- Boitet Christian20
- Israël Fortunato17
- Cardey-Greenfield Sylviane16
- Durieux Christine16
- Yvon François14
- Hamzé Hassan13
- Depecker Loïc12
- Besacier Laurent10
- Dichy Joseph10
- Gile Daniel9
- Gautier Laurent8
- Humbley John8
- Lerat Pierre8
- Seleskovitch Danica8
- Zinglé Henri8
- Collombat Isabelle7
- Levet Jean-Pierre7
- Qasem Fayza El7
- Szende Tamás7
- Ballard Michel6
- Blanchon Hervé6
- Ladmiral Jean-René6
- Morin Emmanuel6
- Schwenk Holger6
- Tutin Agnès6
- Barrault Loïc5
- Cristinoi-Bursuc Antonia5
- Daille Béatrice5
- Danlos Laurence5
- Estève Yannick5
- Grass Thierry5
- Guillaume Jean-Patrick5
- Hassoun Mohamed5
- Ibrahim Amr Helmy5
- Kraif Olivier5
- Maniez François5
- Masson-Vincourt Marie-Paule5
- Mejri Salah5
- Paoli Bruno5
- Pergnier Maurice5
- Plassard Freddie5
- Roman André5
- Zweigenbaum Pierre5
- القاسم فايزة5
- Banoun Bernard4
- Bensimon Paul4
- Bosredon Bernard4
- Cavalla Cristelle4
- Chiaramella Yves4
Search
1 - 1 sur 1
Nombre de résultats par page
- Auteur
- Marwa Hadj salah
- Résumé
- Lire le résumé
- Nous abordons dans cette thèse une étude sur la tâche de la désambiguïsation lexicale qui est une tâche centrale pour le traitement automatique des langues, et qui peut améliorer plusieurs applications telles que la traduction automatique ou l'extraction d'informations. Les recherches en désambiguïsation lexicale concernent principalement l'anglais, car la majorité des autres langues manque d'une référence lexicale standard pour l'annotation des corpus, et manque aussi de corpus annotés en sens pour l'évaluation, et plus important pour la construction des systèmes de désambiguïsation lexicale. En anglais, la base de données lexicale wordnet est une norme de-facto de longue date utilisée dans la plupart des corpus annotés et dans la plupart des campagnes d'évaluation.Notre contribution porte sur plusieurs axes: dans un premier temps, nous présentons une méthode pour la création automatique de corpus annotés en sens pour n'importe quelle langue, en tirant parti de la grande quantité de corpus anglais annotés en sens wordnet, et en utilisant un système de traduction automatique. Cette méthode est appliquée sur la langue arabe et est évaluée sur le seul corpus arabe, qui à notre connaissance, soit annoté manuellement en sens wordnet: l'OntoNotes 5.0 arabe que nous avons enrichi semi-automatiquement. Son évaluation est réalisée grâce à la mise en œuvre de deux systèmes supervisés (SVM, LSTM) qui sont entraînés sur les corpus produits avec notre méthode.Grâce ce travail, nous proposons ainsi une base de référence solide pour l'évaluation des futurs systèmes de désambiguïsation lexicale de l’arabe, en plus des corpus arabes annotés en sens que nous fournissons en tant que ressource librement disponible.Dans un second temps, nous proposons une évaluation in vivo de notre système de désambiguïsation de l’arabe en mesurant sa contribution à la performance de la tâche de traduction automatique.
- Disicipline
- Informatique
- Date
- Soutenue le 19/12/2018
- Sous la direction de
- Hervé Blanchon
- Mounir Zrigui
- Didier Schwab
- Organisme
- Université Grenoble Alpes (ComUE)
- Université de Sfax (Tunisie). Faculté des Sciences économiques et de gestion
- École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble)
