Name: | Description: | Size: | Format: | |
---|---|---|---|---|
2.44 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
In this project we have built a compansion (compression-expansion) system that
expands telegraphic language (utterances with only uninflected content words) into
natural language sentences in Catalan, in the context of an Augmentative and
Alternative Communication (AAC) software.
The system has been designed to improve the communication of AAC users, who
usually have severe speech or motor impairments and use pictogram-based
communication methods in their daily life. However, it can also be seen as a potential
tool to support Catalan literacy for these users and to help in the field of language
rehabilitation.
The compansion system has two main components: a syntactic-semantic
dependency parser and a generator that constructs the final sentence. A simile of an
input system has been built to allow the use of an existing AAC vocabulary (CACE).
This vocabulary has been enriched by syntactic and semantic information in view of
the parser and the generator. From the user’s input, the parser extracts sentence
patterns, based on a constraint grammar and a controlled vocabulary, taking into
account input words and their modifiers. It then assigns the remaining words to the
structural slots of those patterns, which correspond to the semantic roles of the
predicative elements and of other words’ complements. Then, the generator builds
the natural language sentence, from the resulting parse tree, reordering and
inflecting words and adding articles, prepositions and other necessary particles.
The system has been evaluated and results are most promising: 98,7% of the
sentences generated by the compansion system were considered correct by three
independent annotators.
Este projecto consiste na construção de um sistema de compressão-expansão (em inglês: compansion) que expande frases em linguagem telegráfica, isto é, frases formadas apenas por palavras plenamente significativas e sem informação de flexão, em frases em língua natural (Catalão), no contexto de uma aplicação em Comunicação Suplementar e Alternativa (CSA). O sistema foi projectado para melhorar a comunicação dos utilizadores de CSA, que normalmente apresentam graves perturbações motoras ou de fala e que usam métodos comunicativos baseados em pictogramas para as suas actividades quotidianas. Contudo, o sistema pode igualmente ser considerado como uma potencial ferramenta para apoiar a literacia em Catalão destes utilizadores e para ajudar na reabilitação da linguagem. O sistema de compansion tem duas componentes principais: um analisador sintáctico-semântico (parser) e um gerador, que constrói a frase de saída. Um simile de sistema de input foi construído de forma a permitir a utilização de um vocabulário de CSA já existente (o CACE). Este vocabulário foi enriquecido com informação sintáctica e semântica para poder servir tanto ao módulo de análise como de geração. A partir do input, o parser extrai os padrões frásicos, baseados numa gramática e vocabulários controlados, e com base na informação associada às palavras e seus modificadores. Em seguida, atribui as palavras remanescentes às diversas posições estruturais desses padrões frásicos, que correspondem aos papeis semânticos associados aos diversos elementos predicativos e aos complementos de outras palavras. Em seguida, o sistema gera a frase de saída a partir da árvore de análise resultante, reordenando e flexionando as diversas palavras, acrescentando artigos, preposições e outros elementos necessários a uma expressão adequada em língua natural. O sistema foi avaliado e os resultados são muito promissores: 98,7% das frases geradas pelo sistema foram consideradas correctas por três anotadores independentes
Este projecto consiste na construção de um sistema de compressão-expansão (em inglês: compansion) que expande frases em linguagem telegráfica, isto é, frases formadas apenas por palavras plenamente significativas e sem informação de flexão, em frases em língua natural (Catalão), no contexto de uma aplicação em Comunicação Suplementar e Alternativa (CSA). O sistema foi projectado para melhorar a comunicação dos utilizadores de CSA, que normalmente apresentam graves perturbações motoras ou de fala e que usam métodos comunicativos baseados em pictogramas para as suas actividades quotidianas. Contudo, o sistema pode igualmente ser considerado como uma potencial ferramenta para apoiar a literacia em Catalão destes utilizadores e para ajudar na reabilitação da linguagem. O sistema de compansion tem duas componentes principais: um analisador sintáctico-semântico (parser) e um gerador, que constrói a frase de saída. Um simile de sistema de input foi construído de forma a permitir a utilização de um vocabulário de CSA já existente (o CACE). Este vocabulário foi enriquecido com informação sintáctica e semântica para poder servir tanto ao módulo de análise como de geração. A partir do input, o parser extrai os padrões frásicos, baseados numa gramática e vocabulários controlados, e com base na informação associada às palavras e seus modificadores. Em seguida, atribui as palavras remanescentes às diversas posições estruturais desses padrões frásicos, que correspondem aos papeis semânticos associados aos diversos elementos predicativos e aos complementos de outras palavras. Em seguida, o sistema gera a frase de saída a partir da árvore de análise resultante, reordenando e flexionando as diversas palavras, acrescentando artigos, preposições e outros elementos necessários a uma expressão adequada em língua natural. O sistema foi avaliado e os resultados são muito promissores: 98,7% das frases geradas pelo sistema foram consideradas correctas por três anotadores independentes
Description
Dissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012
Keywords
Comunicação Linguagem computacional Processamento da linguagem Linguagem natural Língua catalã