Repository logo
 
Loading...
Thumbnail Image
Publication

A Design Proposal for a French-Finnish Translation System

Use this identifier to reference this record.
Name:Description:Size:Format: 
HEALY_Sean_20110517_Thesis.pdf611.39 KBAdobe PDF Download

Abstract(s)

This thesis proposes a machine translation system from French to Finnish. A practical application was built as part of an existing machine translation system, the LiSe Project, using a controlled version of the language for automatic translation in emergency situations. This added an agglutinating language to the inflecting and isolating languages already represented in the LiSe system. The proposed system is based on SyGuLAC theory (Systemic Grammar using a Linguistically Motivated Algebra and Calculus), according to which, tasks involving language can be broken down into a series of separate but interrelated microsystems. The phonology, morphology, and case for grammatical objects of transitive verbs of Finnish are summarized, in order to familiarize the reader with some of the concepts required for proper understanding of the algorithms. The micro-systems proposed for this system are then individually explained. Due to time constraints, a standalone program was implemented that did not need to be fully integrated into the rest of the LiSe system. Fifty randomly generated and screened sentences were tested and scored in Google’s translator and in LiSe, each sentence rated as “good” (3), “acceptable” (2), “incorrect” (1), or “nonsense” (0). Google’s average score was 0.94, with 12 sentences rated acceptable or better. The micro-system approach proposed in this thesis had an average score of 2.4, with 42 sentences rated acceptable or better. This suggests that the micro-system approach in general, and the LiSe Project in particular, can provide reliable machine translation between such typologically different languages as French and Finnish.
Ce mémoire propose un système de traduction automatique du français vers le finnois. Une application pratique a été construite dans le cadre d'un système de traduction automatique existant, le Projet LiSe, en utilisant une version contrôlée de la langue pour faire une traduction automatique en situation d'urgence. Ceci ajoute une langue agglutinante (le finnois) aux langues flexionnelles et isolantes déjà représentées dans le système LiSe. Le système proposé est basé sur la théorie SyGuLAC (Systemic Grammar using a Linguistically Motivated Algebra and Calculus), selon laquelle, les tâches linguistiques peuvent être décomposées en une série de microsystèmes qui sont distincts, mais interdépendants. La phonologie, la morphologie, et le cas grammatical pour les compléments d’objets des verbes transitifs en Finnois sont résumés, afin de familiariser le lecteur avec certains des concepts requis pour la bonne compréhension des algorithmes. Les microsystèmes proposés pour ce dispositif sont ensuite individuellement expliqués. En raison de contraintes temporelles, un programme indépendant a été mis en oeuvre qui n'a pas besoin d'être pleinement intégré avec le restant du système LiSe. Cinquante phrases générées d’une façon aléatoire ont été testées et notées dans le traducteur de Google et dans le nouveau système, avec les mentions de « bonne » (3), « acceptable » (2), « incorrecte » (1) ou « sans sens » (0). Le résultat moyen de Google était de 0,94 avec 12 mentions « acceptable » ou mieux. Le microsystème proposé dans ce mémoire avait la moyenne de 2,4 avec 42 mentions « acceptable » ou mieux. Ceci suggèrerait que l'approche microsystème en général, et le projet LiSe en particulier, peut fournir une traduction automatique fiable entre deux langues aussi typologiquement différentes que le français et finnois.
Esta dissertação propõe um sistema de tradução automática do francês para finlandês. Foi implementada uma aplicação prática, no enquadramento de um sistema de tradução automática já existente, o Projecto LiSe, utilizando uma versão controlada da língua para tradução em situações de urgência. Isso juntou uma língua aglutinante (o finlandês) às línguas flexivas e analíticas já representadas no sistema LiSe. O sistema proposto tem como base a teoria SyGuLAC (Systemic Grammar using a Linguistically Motivated Algebra and Calculus), segundo o qual, tarefas linguísticas podem dividir-se numa série de microsistemas separados mas interdependentes. Resumem-se a fonologia, a morfologia e os casos dos objectos directos dos verbos transitivos em finlandês, para familiarizar o leitor com alguns dos conceitos requeridos para a compreensão dos algoritmos. Depois apresentam-se os microsistemas propostos. Devido às limitações de tempo, foi implementado um programa independente, que não tinha de ser completamente integrado no sistema LiSe. Geraram-se cinquenta frases para testar o sistema; as frases foram traduzidas pelo Google e pelo sistema proposto. As frazes foram avaliadas com classificações de “bom” (3), “aceitável” (2), “inaceitável” (1), e “sem sentido” (0). O resultado médio do Google foi de 0,94, com 12 frases avaliadas como “aceitável” ou melhor. A abordagem microsistémica proposta nesta dissertação tinha um resultado médio de 2,4, com 42 frases avaliadas como aceitável ou melhor. Esse resultado sugere que a abordagem micro sistémica pode produzir uma tradução automática adequada entre línguas tão tipologicamente diferentes como o francês e o finlandês.

Description

Dissertação de Mestrado, Processamento de Linguagem Natural e Indústria de Língua, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve. Centre de Recherche Lucien Tesnière,Université de Franche-Comté, 2011

Keywords

Processamento de linguagem natural Tradução automática Língua controlada Baseado em regras Análise sistémica

Citation

Research Projects

Organizational Units

Journal Issue

Publisher

CC License