Baptista, JorgeFaísca, Luís2014-07-312014-07-312001Baptista, Jorge; Faísca, Luís. Um filtro para palavras exóticas frequentes em Português, Seminários de Linguística, 4, 1-24, 2001.0873-8467AUT: JBA00689; LFA00717;http://hdl.handle.net/10400.1/4891As formas gráficas (tokens) que constituem as palavras de um texto são muitas vezes ambíguas, podendo frequentemente uma mesma forma corresponder a diferentes flexões de duas ou mais entradas lexicais distintas. Algumas dessas formas correspondem a palavras ‘exóticas’, isto é, palavras pouco frequentes ou até caídas em desuso. O objectivo deste estudo é a determinação, a partir do corpus do CETEMPúblico, das formas ambíguas mais frequentes de palavras exóticas do Português, com vista à construção de um filtro que, durante a fase de análise lexical, elimine o ‘ruído’ provocado por essas formas exóticas e que permita assim reduzir a ambiguidade formal dos textos, simplificando as fases posteriores do seu processamento automático.porProcessamento Computacional de Linguagem NaturalLínguística de corporaUm filtro para palavras exóticas frequentes em Portuguêsjournal article2014-07-30