Utilize este identificador para referenciar este registo: http://hdl.handle.net/10400.1/4891
Título: Um filtro para palavras exóticas frequentes em Português
Autor: Baptista, Jorge
Faísca, Luís
Palavras-chave: Processamento Computacional de Linguagem Natural
Línguística de corpora
Data: 2001
Editora: Universidade do Algarve
Citação: Baptista, Jorge; Faísca, Luís. Um filtro para palavras exóticas frequentes em Português, Seminários de Linguística, 4, 1-24, 2001.
Resumo: As formas gráficas (tokens) que constituem as palavras de um texto são muitas vezes ambíguas, podendo frequentemente uma mesma forma corresponder a diferentes flexões de duas ou mais entradas lexicais distintas. Algumas dessas formas correspondem a palavras ‘exóticas’, isto é, palavras pouco frequentes ou até caídas em desuso. O objectivo deste estudo é a determinação, a partir do corpus do CETEMPúblico, das formas ambíguas mais frequentes de palavras exóticas do Português, com vista à construção de um filtro que, durante a fase de análise lexical, elimine o ‘ruído’ provocado por essas formas exóticas e que permita assim reduzir a ambiguidade formal dos textos, simplificando as fases posteriores do seu processamento automático.
Peer review: yes
URI: http://hdl.handle.net/10400.1/4891
ISSN: 0873-8467
Aparece nas colecções:FCH2-Artigos (em revistas ou actas indexadas)

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Um filtro para palavras exóticas frequentes em Português.pdf125,15 kBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.