Affiner les résultats
- École doctorale Lettres, langues, linguistique, arts (Lyon)55
- École doctorale Langage et langues (Paris)54
- École doctorale Concepts et langages (Paris)26
- École doctorale Sciences du langage (Paris)23
- École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble)20
- École doctorale Langues, littératures et sociétés du monde (Paris)18
- École doctorale Sciences de l'homme et de la société (Villeneuve d'Ascq, Nord)18
- École doctorale langues, littératures et sciences humaines (Grenoble)17
- École doctorale langues, littératures et sciences humaines15
- École doctorale Humanités (Strasbourg ; 2009-....)13
- Ecole doctorale Informatique de Paris-Sud12
- École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)11
- 3la10
- École doctorale Arts, Lettres, Langues (Rennes)10
- École doctorale Connaissance, langage et modélisation (Nanterre)10
- ED Sciences de l'Homme et de la Société (n°473)9
- Ecole doctorale Langages, Espaces, Temps, Sociétés (Besançon ; 1991-2016)9
- École doctorale Arts, Lettres, Langues, Philosophie, Communication (Toulouse)9
- École doctorale Études anglophones, germanophones, et européennes (2009-2019 ; Paris)9
- École doctorale Civilisations, cultures, littératures et sociétés (Paris)8
- 622 - SCIENCES DU LANGAGE7
- École doctorale Sciences de la nature et de l'Homme - Évolution et écologie (Paris)7
- École doctorale Sciences et technologies de l'information et mathématiques (Nantes)7
- École doctorale mathématiques, sciences et technologies de l'information, informatique7
- École doctorale Érasme (Villetaneuse, Seine-Saint-Denis)7
- École doctorale 58, Langues, Littératures, Cultures, Civilisations6
- École doctorale 58, Langues, Littératures, Cultures, Civilisations (Montpellier ; 2015-....)6
- École doctorale Droit et Science politique (Cergy-Pontoise, Val d'Oise)6
- École doctorale Lettres, Communication, Langues, Arts6
- École doctorale Lettres, Communication, Langues, Arts (Dijon ; Besançon ; 2017-....)6
- École doctorale Mondes anciens et médiévaux (Paris)6
- École doctorale Sciences du langage (Paris ; 2019-....)6
- École doctorale 58, Langues, Littératures, Cultures, Civilisations (Montpellier ; ....-2014)5
- École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine5
- École doctorale Littérature française et comparée (Paris)5
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)5
- École doctorale SLTC - Sociétés, Langages, Temps, Connaissances (Lorraine)5
- École doctorale Sciences et technologies de l'information et de la communication5
- Ecole Doctorale Espaces, Cultures, Sociétés (Aix-en-Provence)4
- École doctorale 536 « Sciences et agrosciences » (Avignon)4
- École doctorale Comportement, Langage, Éducation, Socialisation, Cognition (Toulouse)4
- École doctorale Connaissance, langage et modélisation4
- École doctorale Europe latine et Amérique latine (Paris)4
- École doctorale Sciences de l'homme et de la société (Orléans)4
- École doctorale Sciences de l'homme et de la société (Tours ; 1996-2018)4
- 31 "Pratiques et théories du sens"3
- Arts, Lettres, Langues, Philosophie et Communication (ALLPH@)3
- Concepts et langages3
- Informatique, Automatique, Electronique-Electrotechnique, Mathématiques3
- École Doctorale de Biologie Moléculaire Intégrative et Cellulaire (Lyon)3
Search
Votre recherche :
Écoles Doctorales École doctorale Mathématiques et sciences et technologies de l\'information et de la communication (Rennes) Retirer
1 - 5 sur 5
Nombre de résultats par page
2019LEMA1016
Multimodal Machine Translation
- Auteur
- Ozan Caglayan
- Résumé
- Lire le résumé
- La traduction automatique vise à traduire des documents d’une langue à une autre sans l’intervention humaine. Avec l’apparition des réseaux de neurones profonds (DNN), la traduction automatique neuronale(NMT) a commencé à dominer le domaine, atteignant l’état de l’art pour de nombreuses langues. NMT a également ravivé l’intérêt pour la traduction basée sur l’interlangue grâce à la manière dont elle place la tâche dans un cadre encodeur-décodeur en passant par des représentations latentes. Combiné avec la flexibilité architecturale des DNN, ce cadre a aussi ouvert une piste de recherche sur la multimodalité, ayant pour but d’enrichir les représentations latentes avec d’autres modalités telles que la vision ou la parole, par exemple. Cette thèse se concentre sur la traduction automatique multimodale(MMT) en intégrant la vision comme une modalité secondaire afin d’obtenir une meilleure compréhension du langage, ancrée de façon visuelle. J’ai travaillé spécifiquement avec un ensemble de données contenant des images et leurs descriptions traduites, où le contexte visuel peut être utile pour désambiguïser le sens des mots polysémiques, imputer des mots manquants ou déterminer le genre lors de la traduction vers une langue ayant du genre grammatical comme avec l’anglais vers le français. Je propose deux approches principales pour intégrer la modalité visuelle : (i) un mécanisme d’attention multimodal qui apprend à prendre en compte les représentations latentes des phrases sources ainsi que les caractéristiques visuelles convolutives, (ii) une méthode qui utilise des caractéristiques visuelles globales pour amorcer les encodeurs et les décodeurs récurrents. Grâce à une évaluation automatique et humaine réalisée sur plusieurs paires de langues, les approches proposées se sont montrées bénéfiques. Enfin,je montre qu’en supprimant certaines informations linguistiques à travers la dégradation systématique des phrases sources, la véritable force des deux méthodes émerge en imputant avec succès les noms et les couleurs manquants. Elles peuvent même traduire lorsque des morceaux de phrases sources sont entièrement supprimés.
- Disicipline
- Informatique
- Date
- Soutenue le 28/08/2019
- Sous la direction de
- Paul Deléglise
- Loïc Barrault
- Organisme
- Le Mans
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)

- Auteur
- Edwin Simonnet
- Résumé
- Lire le résumé
- Cette thèse s'inscrit dans le cadre de l'émergence de l'apprentissage profond et aborde la compréhension de la parole assimilée à l'extraction et à la représentation automatique du sens contenu dans les mots d'une phrase parlée. Nous étudions une tâche d'étiquetage en concepts sémantiques dans un contexte de dialogue oral évaluée sur le corpus français MEDIA. Depuis une dizaine d'années, les modèles neuronaux prennent l'ascendant dans de nombreuses tâches de traitement du langage naturel grâce à des avancées algorithmiques ou à la mise à disposition d'outils de calcul puissants comme les processeurs graphiques. De nombreux obstacles rendent la compréhension complexe, comme l'interprétation difficile des transcriptions automatiques de la parole étant donné que de nombreuses erreurs sont introduites par le processus de reconnaissance automatique en amont du module de compréhension. Nous présentons un état de l'art décrivant la compréhension de la parole puis les méthodes d'apprentissage automatique supervisé pour la résoudre en commençant par des systèmes classiques pour finir avec des techniques d'apprentissage profond. Les contributions sont ensuite exposées suivant trois axes. Premièrement, nous développons une architecture neuronale efficace consistant en un réseau récurent bidirectionnel encodeur-décodeur avec mécanisme d’attention. Puis nous abordons la gestion des erreurs de reconnaissance automatique et des solutions pour limiter leur impact sur nos performances. Enfin, nous envisageons une désambiguïsation de la tâche de compréhension permettant de rendre notre système plus performant.
- Disicipline
- Informatique
- Date
- Soutenue le 13/02/2019
- Sous la direction de
- Yannick Estève
- Nathalie Camelin
- Organisme
- Le Mans
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)

2018LEMA1002
Factored neural machine translation
- Auteur
- Mercedes García Martínez
- Résumé
- Lire le résumé
- La diversité des langues complexifie la tâche de communication entre les humains à travers les différentes cultures. La traduction automatique est un moyen rapide et peu coûteux pour simplifier la communication interculturelle. Récemment, laTraduction Automatique Neuronale (NMT) a atteint des résultats impressionnants. Cette thèse s'intéresse à la Traduction Automatique Neuronale Factorisé (FNMT) qui repose sur l'idée d'utiliser la morphologie et la décomposition grammaticale des mots (lemmes et facteurs linguistiques) dans la langue cible. Cette architecture aborde deux défis bien connus auxquelles les systèmes NMT font face. Premièrement, la limitation de la taille du vocabulaire cible, conséquence de la fonction softmax, qui nécessite un calcul coûteux à la couche de sortie du réseau neuronale, conduisant à un taux élevé de mots inconnus. Deuxièmement, le manque de données adéquates lorsque nous sommes confrontés à un domaine spécifique ou une langue morphologiquement riche. Avec l'architecture FNMT, toutes les inflexions des mots sont prises en compte et un vocabulaire plus grand est modélisé tout en gardant un coût de calcul similaire. De plus, de nouveaux mots non rencontrés dans les données d'entraînement peuvent être générés. Dans ce travail, j'ai développé différentes architectures FNMT en utilisant diverses dépendances entre les lemmes et les facteurs. En outre, j'ai amélioré la représentation de la langue source avec des facteurs. Le modèle FNMT est évalué sur différentes langues dont les plus riches morphologiquement. Les modèles à l'état de l'art, dont certains utilisant le Byte Pair Encoding (BPE) sont comparés avec le modèle FNMT en utilisant des données d'entraînement de petite et de grande taille. Nous avons constaté que les modèles utilisant les facteurs sont plus robustes aux conditions d'entraînement avec des faibles ressources. Le FNMT a été combiné avec des unités BPE permettant une amélioration par rapport au modèle FNMT entrainer avec des données volumineuses. Nous avons expérimenté avec dfférents domaines et nous avons montré des améliorations en utilisant les modèles FNMT. De plus, la justesse de la morphologie est mesurée à l'aide d'un ensemble de tests spéciaux montrant l'avantage de modéliser explicitement la morphologie de la cible. Notre travail montre les bienfaits de l'applicationde facteurs linguistiques dans le NMT.
- Disicipline
- Informatique
- Date
- Soutenue le 28/03/2018
- Sous la direction de
- Yannick Estève
- Loïc Barrault
- Fethi Bougares
- Organisme
- Le Mans
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)

- Auteur
- Rémi Bouvet
- Disicipline
- Informatique
- Date
- En préparation depuis le 24/09/2019
- Sous la direction de
- Sylvain Meignier
- Organisme
- Le Mans
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)

- Auteur
- Thibault Prouteau
- Disicipline
- Informatique
- Date
- En préparation depuis le 22/09/2020
- Sous la direction de
- Sylvain Meignier
- Organisme
- Le Mans
- École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
