Logo do repositório
 
Publicação

Avaliação automática do nível de complexidade de textos em Português Europeu

datacite.subject.sdg04:Educação de Qualidade
datacite.subject.sdg09:Indústria, Inovação e Infraestruturas
datacite.subject.sdg10:Reduzir as Desigualdades
dc.contributor.authorRibeiro, Eugénio
dc.contributor.authorMamede, Nuno
dc.contributor.authorBaptista, Jorge
dc.date.accessioned2026-04-27T13:27:39Z
dc.date.available2026-04-27T13:27:39Z
dc.date.issued2024-12-31
dc.description.abstractA avaliação da inteligibilidade de textos e a sua classificação por níveis de complexidade é essencial para o ensino de língua e para indústrias relacionadas com a linguagem que dependem de uma comunicação eficaz. O Quadro Europeu Comum de Referência para as Línguas (CEFR) é uma referência amplamente reconhecida para a classificação dos níveis de proficiência linguística. Este quadro pode ser utilizado não apenas para avaliar a proficiência de aprendentes de uma língua, mas também, de uma perspetiva de inteligibilidade, como um meio de identificar a proficiência necessária para compreender um texto. O objetivo deste estudo é desenvolver e avaliar modelos automáticos capazes de classificar textos em português europeu de acordo com os níveis de complexidade definidos pelo CEFR. Para tal, exploramos o ajuste de vários modelos de base pré-treinados em dados textuais utilizados para fins de avaliação de proficiência e exploramos abordagens que tiram partido da natureza ordinal dos níveis. Realizamos ainda uma análise preliminar da capacidade de base que modelos baseados em instruções têm para desempenhar esta tarefa. Nas experiências, os melhores modelos conseguem atingir mais de 80% de taxa de acerto e 75% de medida F1 mas têm dificuldade em generalizar para diferentes tipos de texto, o que revela a necessidade de dados de treino adicionais e mais diversificados.por
dc.identifier.doi10.21814/lm.16.2.449
dc.identifier.issn1647-0818
dc.identifier.urihttp://hdl.handle.net/10400.1/28780
dc.language.isopor
dc.peerreviewedyes
dc.publisherUniversidade do Minho
dc.relationInstituto de Engenharia de Sistemas e Computadores, Investigação e Desenvolvimento em Lisboa
dc.relation.ispartofLinguamática
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.subjectInteligibilidade
dc.subjectComplexidade textual
dc.subjectPortuguês europeu
dc.titleAvaliação automática do nível de complexidade de textos em Português Europeupor
dc.typejournal article
dspace.entity.typePublication
oaire.awardNumberUIDB/50021/2020
oaire.awardTitleInstituto de Engenharia de Sistemas e Computadores, Investigação e Desenvolvimento em Lisboa
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/6817 - DCRRNI ID/UIDB%2F50021%2F2020/PT
oaire.citation.endPage139
oaire.citation.issue2
oaire.citation.startPage115
oaire.citation.titleLinguamática
oaire.citation.volume16
oaire.fundingStream6817 - DCRRNI ID
oaire.versionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
person.familyNameBaptista
person.givenNameJorge
person.identifier.ciencia-id7010-5366-22C5
person.identifier.orcid0000-0003-4603-4364
person.identifier.ridH-7699-2013
person.identifier.scopus-author-id14035269500
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
relation.isAuthorOfPublicatione817fa28-a005-40e2-9ba4-03fdaedd7df3
relation.isAuthorOfPublication.latestForDiscoverye817fa28-a005-40e2-9ba4-03fdaedd7df3
relation.isProjectOfPublication0b14d63a-8f78-4e31-8a86-b72e1f07871f
relation.isProjectOfPublication.latestForDiscovery0b14d63a-8f78-4e31-8a86-b72e1f07871f

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
ambs,+07.pdf
Tamanho:
634.93 KB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
3.46 KB
Formato:
Item-specific license agreed upon to submission
Descrição: