Loading...
Research Project
COUPLING SEMANTICO-SYNTACTIC KNOWLEDGE WITH STATISTICAL MACHINE TRANSLATION
Funder
Authors
Publications
Parafraseamento automático de registo informal em registo formal na Língua Portuguesa
Publication . Barreiro, Anabela Marques; Rebelo-Arnold, Ida; Baptista, Jorge; Mota, Cristina; Garcez, Isabel
Este artigo apresenta o processo de automatização de parafraseamento em português e conversão de
construções típicas do registo informal ou da linguagem falada em construções de registo formal usadas na
linguagem escrita. Ilustraremos o processo de automatização com exemplos extraídos do corpus e-PACT,
que envolvem a colocação normalizada de pronomes clíticos quando co-ocorrem com compostos verbais.
A tarefa consiste em parafrasear e normalizar, entre outras, construções como vou-lhe/posso-lhe fazer
uma surpresa em vou/posso fazer-lhe uma surpresa.
Este artigo apresenta o processo de automatização de parafraseamento em português e conversão de construções típicas do registo informal ou da linguagem falada em construções de registo formal usadas na linguagem escrita. Ilustraremos o processo de automatização com exemplos extraídos do corpus e-PACT,que envolvem a colocação normalizada de pronomesclíticos quando co-ocorrem com compostos verbais.A tarefa consiste em parafrasear e normalizar, en-tre outras, constru ̧c ̃oes comovou-lhe/posso-lhefazeruma surpresaemvou/posso fazer-lheuma surpresa,em que o pronome cl ́ıticolhemigra de uma posi ̧c ̃aoencl ́ıtica imediatamente a seguir ao primeiro verbo docomposto verbal para uma posi ̧c ̃ao encl ́ıtica a seguirao verbo principal, que ́e o verbo respons ́avel pelasele ̧c ̃ao do argumento pronominal. O primeiro verbo ́e um verbo auxiliar ou um verbo volitivo, e.g.,querer.Este ́e um procedimento padronizado no processo de revisão em português europeu. Casos como este representam fenómenos linguísticos em que os estudantes de língua portuguesa e falantes em geral se confundem ou onde “tropeçam”. O artigo enfatiza a língua padrão em que os fenómenos observados ocorrem,descreve exemplos de interesse encontrados no cor-pus e apresenta uma solução automática, baseada na aplica ̧c ̃ao de gramáticas transformacionais genéricas,que facilitam a normalização de inadequações ou falhas sintáticas (registos informais) encontradas nas construções pesquisadas em construções padronizadas típicas da escrita formal ou escrita profissional.
Linguistic resources for paraphrase generation in portuguese: a lexicon-grammar approach
Publication . Barreiro, Anabela; Mota, Cristina; Baptista, Jorge; Chacoto, Lucília; Carvalho, Paula
This paper presents a new linguistic resource for the generation of paraphrases in Portuguese, based on the lexicon-grammar framework. The resource components include: (i) a lexicon-grammar based dictionary of 2100 predicate nouns co-occurring with the support verb ser de 'be of', such as in ser de uma ajuda inestimavel 'be of invaluable help'; (ii) a lexicon-grammar based dictionary of 6000 predicate nouns co-occurring with the support verb fazer 'do' or 'make', such as in fazer uma comparacao 'make a comparison'; and (iii) a lexicon-grammar based dictionary of about 5000 human intransitive adjectives co-occurring with the copula verbs ser and/or estar 'be', such as in ser simpatico 'be kind' or estar entusiasmado 'be enthusiastic'. A set of local grammars explore the properties described in linguistic resources, enabling a variety of text transformation tasks for paraphrasing applications. The paper highlights the different complementary and synergistic components and integration efforts, and presents some preliminary evaluation results on the inclusion of such resources in the eSPERTo paraphrase generation system.
Organizational Units
Description
Keywords
Contributors
Funders
Funding agency
Fundação para a Ciência e a Tecnologia
Funding programme
Funding Award Number
SFRH/BPD/91446/2012