Um filtro para palavras exóticas frequentes em Português

Baptista, Jorge; Faísca, Luís

http://hdl.handle.net/10400.1/4891

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
Um filtro para palavras exóticas frequentes em Português.pdf		125.15 KB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Baptista, Jorge

Faísca, Luís

Resumo(s)

As formas gráficas (tokens) que constituem as palavras de um texto são muitas vezes ambíguas, podendo frequentemente uma mesma forma corresponder a diferentes flexões de duas ou mais entradas lexicais distintas. Algumas dessas formas correspondem a palavras ‘exóticas’, isto é, palavras pouco frequentes ou até caídas em desuso. O objectivo deste estudo é a determinação, a partir do corpus do CETEMPúblico, das formas ambíguas mais frequentes de palavras exóticas do Português, com vista à construção de um filtro que, durante a fase de análise lexical, elimine o ‘ruído’ provocado por essas formas exóticas e que permita assim reduzir a ambiguidade formal dos textos, simplificando as fases posteriores do seu processamento automático.

Palavras-chave

Processamento Computacional de Linguagem Natural Línguística de corpora

URI

http://hdl.handle.net/10400.1/4891

Citação

Baptista, Jorge; Faísca, Luís. Um filtro para palavras exóticas frequentes em Português, Seminários de Linguística, 4, 1-24, 2001.

Projetos de investigação

Building a biological knowledge-base on fish lifecycles for competitive, sustainable European aquaculture

Projeto de investigaçãoVer mais

Editora

Universidade do Algarve

Coleções

FCH2-Artigos (em revistas ou actas indexadas)

Ver registo completo