L'utilisation de grands corpus bilingues alignés pour la création d'outils d'aide à la traduction français-arabe de textes économiques
frDépôt légal électroniqueConsulter le texte intégral de la thèse (format PDF)
Ce travail est consacré à l'analyse contrastive de textes économiques du couple de langues français-arabe. Le corpus d'étude constitué dans le cadre de cette étude consiste à un ensemble de textes recueillis des sites des institutions internationales (ONU, FMI et Banque mondiale), textes portant sur la crise économique de 2008. Ce corpus d'un million de mots a permis d'effectuer des analyses fines au niveau du lexique de la langue économique, analyses des unités lexicales (emprunts, calques, périphrases, métaphores, sigles, récurrences, néologismes) et des unités phraséologiques (collocations, expressions figées et idiomes). Les résultats de ces analyses ont été attestées aussi dans un corpus de contrôle constitué de textes économiques relevés dans des journaux du Moyen Orient et du Maghreb afin de couvrir toutes les variétés régionales de la langue arabe. Le traitement automatique de ces deux corpus a permis la constitution de fiches terminologiques bilingues d'emprunts, de périphrases et des néologismes qui constituent avec deux bases de données créées, des outils d'aide à la traduction.
Mots-clés libres : Linguistique contrastive, linguistique de corpus, corpus bilingues alignés, outils d'aide à la traduction, logiciels TAL, bases de données terminologiques.
This research is devoted the contrastive analysis of economic texts written in Arabic and French. The study corpus compiled within the framework of this thesis consists of a body of texts culled from the web sites of international institutions (UN, IMF, World Bank), in a time-span following the financial and economic crisis of 2008. This corpus of 1 million words has helped to provide detailed analyses of the lexicon of the language of economics, of its lexical units (borrowings, calques, periphrases, metaphors, acronyms, recurrent expressions, neology) and phraseological units (collocations, multiword expressions, idioms). The results of the analysis have been checked against a control corpus of economic texts compiled form newspapers of the Near East and North Africa in order to cover several varieties of the Arabic language. The computerized analysis of both corpora has provided the opportunity to create a bilingual terminological database of borrowings, periphrases and neologisms, which, together with two new databases, comprise computer-assited translation tools.
Keywords : Contrastive linguistics, corpus linguistics, aligned bilingual corpora, CAT tools, NLP software, terminological databases.
Menu :
Annexe :
Université de Poitiers - 15, rue de l'Hôtel Dieu - 86034 POITIERS Cedex - France - Tél : (33) (0)5 49 45 30 00 - Fax : (33) (0)5 49 45 30 50
these@support.univ-poitiers.fr -
Crédits et mentions légales