Logo do repositório
 
A carregar...
Miniatura
Publicação

Um filtro para palavras exóticas frequentes em Português

Utilize este identificador para referenciar este registo.

Orientador(es)

Resumo(s)

As formas gráficas (tokens) que constituem as palavras de um texto são muitas vezes ambíguas, podendo frequentemente uma mesma forma corresponder a diferentes flexões de duas ou mais entradas lexicais distintas. Algumas dessas formas correspondem a palavras ‘exóticas’, isto é, palavras pouco frequentes ou até caídas em desuso. O objectivo deste estudo é a determinação, a partir do corpus do CETEMPúblico, das formas ambíguas mais frequentes de palavras exóticas do Português, com vista à construção de um filtro que, durante a fase de análise lexical, elimine o ‘ruído’ provocado por essas formas exóticas e que permita assim reduzir a ambiguidade formal dos textos, simplificando as fases posteriores do seu processamento automático.

Descrição

Palavras-chave

Processamento Computacional de Linguagem Natural Línguística de corpora

Contexto Educativo

Citação

Baptista, Jorge; Faísca, Luís. Um filtro para palavras exóticas frequentes em Português, Seminários de Linguística, 4, 1-24, 2001.

Unidades organizacionais

Fascículo

Editora

Universidade do Algarve

Licença CC