Percorrer por autor "Antunes, David"
A mostrar 1 - 2 de 2
Resultados por página
Opções de ordenação
- Exploring few-shot approaches to automatic text complexity assessment in european portuguesePublication . Ribeiro, Eugénio; Antunes, David; Mamede, Nuno; Baptista, JorgeThe automatic assessment of text complexity has an important role to play in the context of language education. In this study, we shift the focus from L2 learners to adult native speakers with low literacy by exploring the new iRead4Skills dataset in European Portuguese. Furthermore, instead of relying on classical machine learning approaches or fine-tuning a pre-trained language model, we leverage the capabilities of prompt-based Large Language Models (LLMs), with a special focus on few-shot prompting approaches. We explore prompts with varying degrees of information, as well as different example selection approaches. Overall, the results of our experiments reveal that even a single example significantly increases the performance of the model and that few-shot approaches generalize better than fine-tuned models. However, automatic complexity assessment is a difficult and highly subjective task that is still far from solved.
- Processamento automático de expressões idiomáticas do português europeuPublication . Antunes, David; Baptista, Jorge; Mamede, NunoExpressões idiomáticas verbais são expressões multipalavra em que o verbo principal ´e distribucional mente fixo com um ou mais dos seus argumentos. O significado global destas expressões ´e, geralmente, não composicional, isto ´e, não pode ser regularmente inferido a partir do significado individual dos seus constituintes, quando usados separadamente. O principal objetivo deste trabalho ´e a construção de um sistema capaz de processar expressões idiomáticas do português europeu, integrado de forma fluida numa cadeia (pipeline) de processamento de linguagem natural. Para tal, foram desenvolvidas duas componentes fundamentais: (i) a criação de um corpus anotado com instancias de expressões idiomáticas verbais do português europeu, e (ii) o desenvolvimento de um sistema que gera regras de análise de dependência para identificar automaticamente expressões idiomáticas com base nas restrições linguísticas representadas numa matriz léxico-gramatical. O sistema foi avaliado com frases produzidas manualmente, frases geradas artificialmente (por um m´modulo específico do sistema) e usando documentos selecionados a partir de dois corpora e onde foram anotadas instâncias de expressões idiomáticas. Os resultados globais indicam que a Precisão do sistema ´e bastante satisfatória, enquanto a Abrangência (Recall) ´e menos favorável. Estes dados destacam a necessidade de direcionar esforços para melhorar o desempenho do sistema, nomeadamente das regras que permitem identificar automaticamente as expressões fixas em textos. Uma parte do corpus utilizado bem como das anotações de expressões idiomáticas são disponibilizados para a comunidade científica.
