Repository logo
 

Search Results

Now showing 1 - 7 of 7
  • Estimating lexical availability of European Portuguese proverbs
    Publication . Reis, Sónia; Baptista, Jorge
    This paper relates data on lexical availability with data on textual frequency of proverbs in European Portuguese. Each data source should provide different perspectives on the use of proverbs in the language. This should allow an empirically well-motivated selection of proverbs aiming at the development of NLP resources, specifically for applications for learning Portuguese as a Foreign Language and for the diagnosis/therapy of speech impairments/disabilities. A large database (over 114,000 proverbs and their variants) was independently classified by two annotators, according to intuitively estimated lexical availability. Next, a random, stratified sample was selected and lexical availability was then confirmed with an online survey. Frequency data was gathered from two web browsers and a large-sized, publicly available, corpus of journalistic texts. Results from the survey, the web and the corpus by and large confirm the initial intuitive classification and a core of commonly used proverbs was defined
  • Portuguese proverbs: types and variants
    Publication . Reis, Sónia; Baptista, Jorge
    Drawing on the methodology and previous results of Rassi et al. (2014) on the automatic identification of Brazilian Portuguese proverbs, this paper reports on an extension of that experiment, but now focused on the identification of the European Portuguese proverbs and their variants. Based on a large collection of over 56 thousand Portuguese proverbs and their variants, a database of proverb types was specifically built for natural language processing, along with the finite-state tools that allow for the identification of these strings in texts. Our aim is to make these linguistic resources and language processing tools publicly available, which will undoubtedly be deemed useful assets to other paremiologic studies.
  • Determinação de um mínimo paremiológico do português europeu
    Publication . Reis, Sónia; Baptista, Jorge
    O principal objetivo deste estudo é apresentar o ‘mínimo paremiológico’ do português europeu, isto é, a lista dos provérbios mais conhecidos e mais frequentemente utilizados pela generalidade dos falantes da comunidade linguística do português europeu. Para o estabelecimento do ‘mínimo paremiológico’ do português europeu foram utilizados diferentes procedimentos metodológicos ao longo de cinco anos. Numa primeira fase, coligiu-se uma base de dados digital com mais de 114.000 entradas (provérbios e variantes) e fez-se uma primeira seleção manual dos provérbios considerados mais usuais, tendo-se depois calculado a concordância entre anotadores, que foi bastante elevada. Procedeu-se também ao cálculo da frequência de provérbios e variantes (n. de ocorrências) em várias fontes: (1) em dicionários e coletâneas de provérbios; (2) num corpus de textos jornalísticos (CETEMPúblico, Santos & Rocha, 2001); (3) em manuais escolares de Português e de Português Língua não Materna; e (4) em dois motores de busca (Google e Bing). Procedeu-se ainda à aplicação de dois questionários distintos, online. Obteve-se assim uma lista de 318 provérbios – o mínimo paremiológico do português europeu. A lista dos 318 provérbios poderá́ ter diversas aplicações, quer para o desenvolvimento de instrumentos de diagnóstico ou terapia de certas patologias da linguagem, quer para a aprendizagem de português como língua estrangeira.
  • Os provérbios em manuais de ensino de português língua não materna
    Publication . Reis, Sónia; Baptista, Jorge
    Os provérbios apresentam uma grande variedade de estruturas e podem servir diversos propósitos comunicativos. Devido à sua riqueza cultural e linguística, prestamse ainda a múltiplos objetivos didáticos, nomeadamente no ensino de Português como Língua não Materna (PLNM). Neste trabalho, investigamos como são de facto utilizados os provérbios em manuais de PLNM, usando ferramentas e recursos de processamento computacional de linguagem natural (PLN). Os resultados são comparados com observações já feitas sobre um corpus de manuais de Português para falantes nativos.
  • Let's play with proverbs? NLP tools and resources for iCALL applications around proverbs for PFL
    Publication . Reis, Sónia; Baptista, Jorge
    Proverbs are an important form of cultural expression of a society and are related to various areas of knowledge and human experience (González Rey, 2002). While linguistic elements in widespread use, proverbs are very rich structures both from a cultural and from a linguistic point of view and can therefore contribute significantly to the teaching of languages, both native and foreign (Council of Europe, 2001). However, though there are extensive collections of Portuguese proverbs with tens of thousands of forms and its variants (Reis, in preparation), its automatic identification in texts is quite difficult, given its formal variation, both lexical and syntactic (Chacoto, 1994). Nevertheless, using real examples, where proverbs are used in a natural or spontaneous discourse context, is a more natural way to learn and teach the complex conditions and communicative situations that determine the use and meaning of these expressions. On the other hand, frequency indices associated with proverbs and its variants would allow one to select the most common expressions. These are precisely the most interesting forms from the point of view of their teaching/learning and could serve as a basis for the construction of educational games, particularly for learning Portuguese autonomously as a foreign language (PFL) assisted by computer. To make this possible, it is necessary, first of all, be able to recognize the occurrence of proverbs in the texts (Rassi et al. 2014), including the instances where these expressions are presented in a truncated or creatively modified form, for example, to better suit the communicative situation or to produce new and more expressive meanings. In this paper, we present an on-going project, which aims at automatic identification of proverbs in texts. In this interdisciplinary study, we combine natural language processing tools with questionnaires construction techniques for teaching purposes (Hoshino and Nakagawa 2005, Correia et al. 2010). This is illustrated here with different sets of formats that can be built based on the knowledge of the form and variation of proverbs, as well as their frequency in corpora.
  • O uso de provérbios no ensino de português
    Publication . Reis, Sónia; Baptista, Jorge
    Os provérbios, enquanto elementos linguísticos marcados pelo seu uso generalizado, são estruturas muito ricas, quer do ponto de vista cultural, quer do ponto de vista linguístico, daí o seu potencial como um importante contributo para o ensino das línguas. É neste sentido que se justifica a sua inclusão nos conteúdos programáticos de Português, em articulação com as respetivas Metas Curriculares. Apesar de os provérbios apenas constarem explicitamente dos conteúdos programáticos do ensino básico de português do 5º e 6º anos de escolaridade, os mesmos surgem disseminados nos manuais escolares até ao 12º ano de escolaridade. Neste trabalho, pretendemos, num primeiro momento, verificar em que alturas do percurso escolar são os provérbios referidos tanto nos textos ordenadores como nos manuais escolares, bem como determinar os fatores didáticos que promovem a sua utilização. Num segundo momento, pretendemos determinar quais os provérbios (e suas variantes) mais difundidos nos manuais escolares, com recurso a ferramentas do processamento de linguagem natural. Os resultados permitirão extrair índices de frequência e repartição dos provérbios nos manuais escolares e construir uma imagem mais clara da forma como são utilizados no contexto de ensino de língua e o potencial impacto que tal representação poderá ter na respetiva disponibilidade lexical.
  • O provérbio como estímulo num terapeuta virtual
    Publication . Reis, Sónia; Pompili, Annamaria; Abad, Alberto; Baptista, Jorge
    Os provérbios são elementos úteis no diagnóstico e terapia de certas patologias da linguagem, nomeadamente as que resultam de trauma, já que estão associados a estruturas da memória que são afetadas diferencialmente, mesmo quando a capacidade de falar é diminuída. Por esta razão, os provérbios têm vindo a ser utilizados como auxiliar de diagnóstico e de terapia, na medida em que constituem uma forma de exercício das estruturas cognitivas a partir da memória de longa duração. Apesar da sua ubíqua utilização por parte de terapeutas, a seleção dos provérbios para estímulo numa terapia ou num diagnóstico pode apresentar dificuldades, uma vez que não é fácil determinar se o não reconhecimento de um dado provérbio pelo paciente está associado a quadros patológicos ou ao mero desconhecimento do mesmo. Importa, por isso, que os provérbios e variantes a utilizar para estímulo sejam os de uso mais frequente e que possam ser reconhecidos pela generalidade dos falantes. Nesta comunicação, apresentamos a metodologia seguida na construção de um módulo de exercícios de diferentes tipos envolvendo provérbios a integrar num Terapeuta Virtual para o tratamento da Afasia (VITHEA).