Affiner les résultats
- Paris 3178
- 134
- Lyon59
- Paris 456
- Lyon 246
- Paris 1137
- Paris 1034
- Montpellier 333
- Paris 732
- Paris, INALCO32
- Sorbonne Paris Cité32
- Paris 1331
- Besançon27
- Sorbonne université27
- Aix-Marseille 125
- Toulouse 225
- Lille 324
- Caen23
- Paris 823
- Grenoble22
- Strasbourg21
- Université Grenoble Alpes[remove]21
- Nice19
- Paris 619
- Grenoble 117
- Poitiers17
- Rennes 217
- Toulouse 317
- Université Grenoble Alpes (ComUE)17
- Artois16
- Université de Lorraine15
- Nantes14
- Rouen14
- Lyon 113
- Lyon 313
- Bordeaux 312
- Bourgogne Franche-Comté12
- Le Mans12
- Paris, EHESS12
- Université Paris-Saclay (ComUE)12
- Limoges11
- Paris 511
- Paris, EPHE11
- Université de Paris (2019-....)11
- Aix-Marseille10
- Orléans10
- Tours10
- Grenoble 39
- Avignon8
- Metz8
- Besacier Laurent4
- Kraif Olivier3
- Rossi Caroline3
- Schwab Didier3
- Blanchon Hervé2
- Chevrot Jean-pierre2
- Lecouteux Benjamin2
- Tutin Agnès2
- Antoniadis Georges1
- Bada Valérie1
- Bellynck Valérie1
- Boitet Christian1
- Bouattour Mohamed1
- Diab-duranton Salam1
- Esperanca-rodier Emmanuelle1
- Esteve Yannick1
- Gonon Laetitia1
- Goulian Jérôme1
- Lebarbe Thomas1
- Nardy Aurélie1
- Nikoulina Vassilina1
- Novakova Iva1
- Sorba Julie1
- Verbeek Jakob1
Search
1 - 10 sur 21
| Suivant »
Nombre de résultats par page
- Auteur
- Loïc Vial
- Résumé
- Lire le résumé
- La désambiguïsation lexicale (DL) et la traduction automatique (TA) sont deux tâches centrales parmi les plus anciennes du traitement automatique des langues (TAL). Bien qu'ayant une origine commune, la DL ayant été conçue initialement comme un problème fondamental à résoudre pour la TA, les deux tâches ont par la suite évolué très indépendamment. En effet, d'un côté, la TA a su s'affranchir d'une désambiguïsation explicite des termes grâce à des modèles statistiques et neuronaux entraînés sur de grandes quantités de corpus parallèles, et de l'autre, la DL, qui est confrontée à certaines limitations comme le manque de ressources unifiées et un champs d'application encore restreint, reste un défi majeur pour permettre une meilleure compréhension de la langue en général.Aujourd'hui, dans un contexte où les méthodes à base de réseaux de neurones et les représentations vectorielles des mots prennent de plus en plus d'ampleur dans la recherche en TAL, les nouvelles architectures neuronales et les nouveaux modèles de langue pré-entraînés offrent non seulement de nouvelles possibilités pour développer des systèmes de DL et de TA plus performants, mais aussi une opportunité de réunir les deux tâches à travers des modèles neuronaux joints, permettant de faciliter l'étude de leurs interactions.Dans cette thèse, nos contributions porteront dans un premier temps sur l'amélioration des systèmes de DL, par l'unification des données nécessaires à leur mise en oeuvre, la conception de nouvelles architectures neuronales et le développement d'approches originales pour l'amélioration de la couverture et des performances de ces systèmes. Ensuite, nous développerons et comparerons différentes approches pour l'intégration de nos systèmes de DL état de l'art et des modèles de langue, dans des systèmes de TA, pour l'amélioration générale de leur performance. Enfin, nous présenterons une nouvelle architecture pour l'apprentissage d'un modèle neuronal joint pour la DL et la TA, s'appuyant sur nos meilleurs systèmes neuronaux pour l'une et l'autre tâche.
- Disicipline
- Informatique
- Date
- Soutenue le 21/07/2020
- Sous la direction de
- Benjamin Lecouteux
- Organisme
- Université Grenoble Alpes
- École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble)

2020GRALM012
Une alternative aux modèles neuronaux séquence-à-séquence pour la traduction automatique
- Auteur
- Maha Elbayad
- Résumé
- Lire le résumé
- L'apprentissage profond a permis des avancées significatives dans le domaine de la traduction automatique.La traduction automatique neuronale (NMT) s'appuie sur l'entrainement de réseaux de neurones avec un grand nombre de paramètres sur une grand quantité de données parallèles pour apprendre à traduire d'une langue à une autre.Un facteur primordial dans le succès des systèmes NMT est la capacité de concevoir des architectures puissantes et efficaces. Les systèmes de pointe sont des modèles encodeur-décodeurs qui, d'abord, encodent une séquence source sous forme de vecteurs de caractéristiques, puis décodent de façon conditionne la séquence cible.Dans cette thèse, nous remettons en question le paradigme encodeur-décodeur et préconisons de conjointement encoder la source et la cible afin que les deux séquences interagissent à des niveaux d'abstraction croissants. À cette fin, nous introduisons Pervasive Attention, un modèle basé sur des convolutions bidimensionnelles qui encodent conjointement les séquences source et cible avec des interactions qui sont omniprésentes dans le réseau neuronal.Pour améliorer l'efficacité des systèmes NMT, nous étudions la traduction automatique simultanée où la source est lue de manière incrémentielle et le décodeur est alimenté en contextes partiels afin que le modèle puisse alterner entre lecture et écriture. Nous améliorons les agents déterministes qui guident l'alternance lecture / écriture à travers un chemin de décodage rigide et introduisons de nouveaux agents dynamiques pour estimer un chemin de décodage adapté au cas-par-cas.Nous abordons également l'efficacité computationnelle des modèles NMT et affirmons qu'ajouter plus de couches à un réseau de neurones n'est pas requis pour tous les cas.Nous concevons des décodeurs Transformer qui peuvent émettre des prédictions à tout moment dotés de mécanismes d'arrêt adaptatifs pour allouer des ressources en fonction de la complexité de l'instance.
- Disicipline
- Mathématiques et Informatique
- Date
- Soutenue le 23/06/2020
- Sous la direction de
- Laurent Besacier
- Jakob Verbeek
- Organisme
- Université Grenoble Alpes
- École doctorale mathématiques, sciences et technologies de l'information, informatique

- Auteur
- Iris Fabry
- Résumé
- Lire le résumé
- Étude phraséologique sinscrivant dans les domaines de la linguistique de corpus outillée et des humanités numériques, cette recherche vise à mettre au jour un usage des marqueurs discursifs alors considérés comme des unités phraséologiques caractéristique au genre épistolaire en français sur une période longue (du XVIIe au XXe siècle).
- Disicipline
- Sciences du langage Spécialité Linguistique Sociolinguistique et Acquisition du langage
- Date
- En préparation depuis le 02/10/2020
- Sous la direction de
- Julie Sorba
- Organisme
- Université Grenoble Alpes
- École doctorale langues, littératures et sciences humaines

- Auteur
- Sarah Daniel
- Résumé
- Lire le résumé
- La théorie de la métaphore conceptuelle (Lakoff & Johnson, 1980) a fait passer notre conception des expressions métaphoriques dun phénomène linguistique à un aperçu de des moyens que se donne la langue pour faciliter et influencer la compréhension. Néanmoins, la traductologie a continué à traiter les expressions métaphoriques comme une problème linguistique (Baker, 1992; Haywood, Thompson, & Hervey, 2009; Hervey & Higgins, 2002) et ce nest que récemment que la métaphore conceptuelle y a été intégrée (Aldhahi, Fernández-Parra, & Davies, 2018; Maalej, 2008; Mandelblit, 1995; Schaffner, 2004). Les expressions métaphoriques renferment des informations culturelles (Hiraga, 1991; Maalej, 2008) dont la compréhension représente souvent un défi pour les étudiants de langues, les traducteurs en formation et la traduction automatique. Pour les étudiants de L2 et de traduction les métaphores sont difficiles car elle se comprennent souvent de manière holistique et ne sont pas décomposables en unités individuelles (mots ou expressions) qui permettraient de les comprendre (Jiang & Nekrovska, 2007). Lintroduction des outils de traduction automatique neuronale a permis un gain qualitatif important (Poibeau, 2017), mais ils tendent à suivre le sens propre, qui est le plus fréquent dans les données dapprentissage, au lieu du sens figuré, ce qui limite leur utilité pour la traduction des métaphores. Cette étude vise à identifier les types dexpressions métaphoriques qui existent dans les textes journalistiques portant sur un sujet fréquemment abordé et lié à lexpression du déplacement (limmigration), et les stratégies utilisées par des traducteurs professionnels pour en rendre compte. Notre travail a pour point de départ une analyse des produits de traduction, en tant quelle pourra faciliter une interrogation plus ciblée des processus de traduction. Le choix des expressions comportant des verbes de mouvement se fonde à la fois sur le caractère fondamental et central de ces expressions au sein de la linguistique cognitive (qui en fait un bon point de départ pour lexpression non littérale) et sur la différence typologique avérée entre langlais, comme langue à satellites, le français et lespagnol, comme langues à cadre verbal (Talmy, 2003), ce qui implique a minima une reformulation au moment de la traduction. En sappuyant sur une comparaison entre traducteurs professionnels et étudiants en traduction, la question de savoir si, et en quoi la formation en traduction aide à développer la compétence en L2 sera abordée. Finalement la traduction automatique sera interrogée pour découvrir si ces outils aident ou gênent en la traduction des expressions métaphoriques. Pour répondre à ces questions ce travail sancre dans lanalyse de textes journalistiques sur limmigration, traduits du français et de lespagnol vers langlais. Le méthode MIP (Pragglejaz Group, 2007) sera utilisée pour identifier les expressions métaphoriques avec des verbes de mouvement et selon lHypothèse de la Traduction Cognitive (Mandelblit, 1995), ces expressions seront classées en fonction de leur niveau de comparabilité ou déquivalence fonctionnelle avec la culture cible. Les traductions publiées seront interrogées pour identifier les stratégies utilisées par les traducteurs professionnels (Mandelblit, 1995; Newmark, 1981) en sachant que lanalyse des textes ne révèle pas le processus de traduction, mais simplement les décisions finales prises, et des échantillons des même textes seront ensuite traduits par des étudiants de traduction pour trouver une typologie des différences dapproche de ces expressions entres les professionnels et les étudiants. Trois tâches seront proposées à quatre groups : des étudiants de licence en langues, des étudiants de licence et de Master en traduction et des traducteurs professionnels. Chaque participant va faire des tâches de compréhension écrite, de traduction et de post-édition. Linterrogation des résultats de la tâche de compréhension écrite signaleront leffet de la formation en traduction sur les compétences linguistiques et surtout sur la compréhension des expressions métaphoriques. Les deux groups appariés, les étudiants de licence en langues et en traduction permettront déduire si la formation en traduction améliore la compréhension écrite en L2. Pour explorer lutilité de la TA dans la traduction des expressions métaphoriques, loculométrie et des entretiens proposés après la tâche (protocoles de verbalisation) montreront la perception des participants de la difficulté de la tâche et de lutilité de loutil, ainsi que les parties du texte sur lesquelles ils auront passé le plus de temps. Ces données permettront détablir si les expressions métaphoriques ont pris plus de temps que le reste du texte, et le cas échéant, sil existe une échelle de difficulté au sein des expressions proposées. Les traductions produites par les groupes différents ; étudiants en langues, étudiants de traduction et traducteurs professionnels, sutiliseront pour identifier une typologie des différences dapproche de ces groupes. Les résultats signaleront des expressions métaphoriques qui représentent un défi pour les étudiants de langue et les traducteurs, défi dont les formateurs pourront sinspirer pour lélaboration de programmes de cours. En outre, si la formation en traduction a un effet important sur les compétences en langue seconde, cela remettra en jeu limportance de la traduction dans des cours des langues (Carreres, 2006; Carreres, Muñoz-Calvo, & Noriega-Sánchez, 2017). Pour les formateurs en post-édition, les résultats délimiteront des types dexpression qui posent problème pour la TA neuronale. Enfin, le projet contribuera à lélaboration dune typologie des expressions métaphoriques du mouvement en traduction du français et de lespagnol vers langlais, exploitable dans plusieurs champs de la traductologie appliquée.
- Disicipline
- Sciences du langage Spécialité Didactique et Linguistique
- Date
- En préparation depuis le 02/10/2019
- Sous la direction de
- Caroline Rossi
- Organisme
- Université Grenoble Alpes
- Université de Swansea
- École doctorale langues, littératures et sciences humaines

- Auteur
- Zae myung Kim
- Résumé
- Lire le résumé
- Only in english
- Disicipline
- Informatique
- Date
- En préparation depuis le 02/10/2020
- Sous la direction de
- Didier Schwab
- Laurent Besacier
- Vassilina Nikoulina
- Organisme
- Université Grenoble Alpes
- École doctorale mathématiques, sciences et technologies de l'information, informatique

- Auteur
- William Havard
- Résumé
- Lire le résumé
- Une tâche importante qui incombe à lenfant est de reconnaître puis de mémoriser les mots qui lui parviennent dans le flux de la parole environnante, afin de les utiliser dans ses propres énoncés. Confronté à un flux continu de parole, le jeune enfant doit donc en extraire des unités porteuses dune forme et effectuer ce quon appelle segmentation lexicale. Le but de cette thèse est dapprofondir plusieurs aspects du processus de segmentation par des simulations computationnelles fondées sur des méthodes dapprentissage machine non supervisé appliquées à des corpus langagiers de grande taille. Nous analyserons lémergence du lexique en contexte, via le traitement non supervisé de grands corpus de parole en relation avec des scènes visuelles. Des modèles computationnels pour lacquisition du lexique ont déjà été proposés mais ils sont le plus souvent limités au traitement des séquence de symboles (séquences de phonèmes issues dune transcription manuelle des signaux enregistrés). La première originalité de cette thèse est la proposition de modèles applicables directement sur le signal de parole. Pour cela, nous convoquerons les avancées récentes de lapprentissage profond (architectures neuronales de type « encodeur-décodeur» ou « end-to-end »). La seconde originalité de cette thèse est la volonté détudier lémergence du lexique à partir dun contexte. A cette fin, nous nous appuierons sur des corpus multimodaux préexistants, particulièrement le corpus synthétique SPEECH-COCO constitué de plus de 600.000 scènes visuelles décrites oralement ainsi que sur le corpus DylNet, collecté lors dinteractions denfants à lécole maternelle.
- Disicipline
- Sciences du langage Spécialité Informatique et sciences du langage
- Date
- En préparation depuis le 03/10/2017
- Sous la direction de
- Jean-pierre Chevrot
- Laurent Besacier
- Organisme
- Université Grenoble Alpes
- École doctorale langues, littératures et sciences humaines

- Auteur
- Chaeyoung Lee
- Résumé
- Lire le résumé
- Notre projet de thèse cherche à observer les routines sémantico-rhétoriques dans le discours scientifique oral en français, dont nous souhaitons faire la description et analyser les fonctions rhétoriques et/ou discursives spécifiques. Ensuite, parmi les différents types de routines, nous nous intéressons tout particulièrement à la modélisation de routines de « guidage de linterlocuteur », qui ont fonction dassurer un bon suivi du développement logique des idées du locuteur et de faciliter la compréhension des informations et des points de vue adoptés par le locuteur chez les interlocuteurs dans la communication scientifique, ce qui nous permettrait de mettre en comparaison les routines de guidage du lecteur dans le discours écrit et les routines de lauditeur dans le discours oral.
- Disicipline
- Sciences du langage Spécialité Didactique et Linguistique
- Date
- En préparation depuis le 08/01/2020
- Sous la direction de
- Agnès Tutin
- Organisme
- Université Grenoble Alpes
- École doctorale langues, littératures et sciences humaines

- Auteur
- Jirawan Kiatphotha
- Résumé
- Lire le résumé
- Cette recherche vise à étudier les expressions d'émotions afin de mettre en avant des motifs textuels, notions développées au laboratoire LIDILEM (projets EMOLEX et PHRASEOROM). Pour cela, nous récolterons des données issues du roman policier et sentimental en français et en thaï.
- Disicipline
- Sciences du langage Spécialité Didactique et Linguistique
- Date
- En préparation depuis le 02/09/2019
- Sous la direction de
- Iva Novakova
- Organisme
- Université Grenoble Alpes
- École doctorale langues, littératures et sciences humaines

- Auteur
- Emmanuelle Kelodjoue Nguemegne
- Résumé
- Lire le résumé
- Cette thèse s'intéressera donc à l'extraction automatique d'opinions dans des documents oraux transcrits. Il s'agira d'une part d'extraire la perception (positive, négative, réservée) qu'ont les locuteurs sur l'innovation étudiée selon les critères de l'expert et d'identifier les passages témoignant de l'expression directe ou indirecte de l'évaluation du critère ciblé afin de fournir une aide à l'expertise.
- Disicipline
- Informatique
- Date
- En préparation depuis le 25/04/2018
- Sous la direction de
- Jérôme Goulian
- Didier Schwab
- Organisme
- Université Grenoble Alpes
- École doctorale mathématiques, sciences et technologies de l'information, informatique

- Auteur
- Thi phuong hang Le
- Résumé
- Lire le résumé
- L'objectif de ce projet est de faire progresser l'état de l'art en matière de traduction automatique de la parole au texte (AST) de bout en bout. De tels systèmes traduisent un énoncé de parole dans une langue source en un texte dans une langue cible sans passer par une représentation intermédiaire telle que la transcription dans la langue source.
- Disicipline
- Mathématiques et Informatique
- Date
- En préparation depuis le 02/03/2020
- Sous la direction de
- Didier Schwab
- Benjamin Lecouteux
- Organisme
- Université Grenoble Alpes
- École doctorale mathématiques, sciences et technologies de l'information, informatique
