Repository logo
 
Publication

Face and object recognition by 3D cortical representations

dc.contributor.advisordu Buf, J.M.H.
dc.contributor.advisorRodrigues, J.M.F.
dc.contributor.authorMartins, Jaime Afonso do Nascimento Carvalho
dc.date.accessioned2015-09-21T18:44:24Z
dc.date.available2015-09-21T18:44:24Z
dc.date.issued2013
dc.date.submitted2013
dc.description.abstractThis thesis presents a novel integrated cortical architecture with significant emphasis on low-level attentional mechanisms—based on retinal nonstandard cells and pathways—that can group non-attentional, bottom-up features present in V1/V2 into “proto-object” shapes. These shapes are extracted at first using combinations of specific cell types for detecting corners, bars/edges and curves which work extremely well for geometrically shaped objects. Later, in the parietal pathway (probably in LIP), arbitrary shapes can be extracted from population codes of V2 (or even dorsal V3) oriented cells that encode the outlines of objects as “proto-objects”. Object shapes obtained at both cortical levels play an important role in bottom-up local object gist vision, which tries to understand scene context in less than 70 ms and is thought to use both global and local scene features. Edge conspicuity maps are able to detect borders/edges of objects and attribute them a weight based on their perceptual salience, using readily available retinal ganglion cell colour-opponency coding. Conspicuity maps are fundamental in building posterior saliency maps—important for both bottom-up attention schemes and also for Focus-of-Attention mechanisms that control eye gaze and object recognition. Disparity maps are also a main focus of this thesis. They are built upon binocular simple and complex cells in quadrature, using a Disparity-Enery Model. These maps are fundamental for perception of distance within a scene and close/far object relationships in doing foreground to background segregation. The role of cortical disparity in 3D facial recognition was also explored when processing faces with very different facial expressions (even extreme ones), yielding state-of-the-art results when compared to other, non-biological, computer vision algorithms.por
dc.description.abstractA presente tese descreve uma nova arquitectura cortical integrada, com ênfase especial em mecanismos de atenção a baixo nível—baseados em conexões corticais que utilizam células retinais não-padronizadas—conseguindo agrupar diversas características visuais de baixo nível, ainda num estado pré-atencional, presentes nas áreas V1/V2, em formas específicas de “proto-objectos”. As formas em questão são extraídas em primeira mão através de combinações de células especializadas que detectam localmente cantos, rectas/arestas e curvaturas, funcionando extremamente bem para a detecção de objectos com formas geométricas. Posteriormente, no lobo parietal (provavelmente no córtex Lateral Intra-Parietal), já podem ser extraídas formas arbitrárias, através de padrões de activação de populações de neurónios, presentes em V2 (ou até em V3-dorsal), que codificam a periferia de objectos como “proto-objectos”—representações básicas de categorias específicas de objectos no cérebro. Ambas as formas extraídas nos dois tipos de processamento cortical (utilizando células específicas ou uma codificação de formas arbitrária) desempenham um papel importante na visão gist local, que tenta compreender o contexto geral da cena apresentada ao sistema visual, em menos de 70 ms, sendo esperado que para tal se usem tanto características visuais globais como locais. São também utilizados mapas de conspicuicidade, que permitem detectar linhas e arestas de objectos, atribuindo-lhes um peso baseado na sua saliência perceptual—utilizando para tal a codificação natural das células retinais, em que as cores são representadas por oponência: claro/escuro, vermelho/verde e amarelo/azul. Os mapas de conspicuicidade são fundamentais na construção posterior de mapas de saliência—importantes nos esquemas pré-atencionais de nível celular baixo e também para os mecanisix mos de Foco-de-Atenção que controlam o movimento ocular e reconhecimento de caras e objectos. Em paralelo, são também desenvolvidos os mapas de disparidade cortical, sendo estes também um dos maiores focos desta tese. Estes são baseados em células corticais binoculares simples e complexas, através de um processamento das últimas em quadratura—modelo denominado por “Disparity- Energy Model”. Estes mapas de disparidade são fundamentais na percepção de distâncias dentro de uma cena visual e também para resolver o problema da segregação objecto/fundo. O papel da disparidade cortical é também explorado no reconhecimento facial a 3D, em especial quando as faces a reconhecer apresentam expressões faciais de diversas formas e níveis de intensidade. O modelo utilizado apresentou resultados excelentes, atingindo o estado-da-arte, inclusivamente ficando acima de modelos de visão computacional não biológicos.por
dc.description.sponsorshipFundação para a Ciência e a Tecnologiapor
dc.description.sponsorshipComissão Europeiapor
dc.description.sponsorshipFP7–ICT–2009–6
dc.identifier.tid101289502
dc.identifier.urihttp://hdl.handle.net/10400.1/6815
dc.language.isoengpor
dc.relationFACE AND OBJECT RECOGNITION BY 3D CORTICAL REPRESENTATIONS
dc.relationA neuro-dynamic framework for cognitive robotics: scene representations, behavioural sequences, and learning.
dc.relationBlavigator: a cheap and reliable navigation aid for the blind
dc.subjectEngenharia de computadorespor
dc.subjectCórtex cerebralpor
dc.subjectAtençãopor
dc.subjectVisãopor
dc.subjectVisão computacionalpor
dc.subjectReconhecimento facialpor
dc.titleFace and object recognition by 3D cortical representationspor
dc.typedoctoral thesis
dspace.entity.typePublication
oaire.awardTitleFACE AND OBJECT RECOGNITION BY 3D CORTICAL REPRESENTATIONS
oaire.awardTitleA neuro-dynamic framework for cognitive robotics: scene representations, behavioural sequences, and learning.
oaire.awardTitleBlavigator: a cheap and reliable navigation aid for the blind
oaire.awardURIinfo:eu-repo/grantAgreement/FCT//SFRH%2FBD%2F44941%2F2008/PT
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/3599-PPCDT/PTDC%2FEIA%2F73633%2F2006/PT
oaire.awardURIinfo:eu-repo/grantAgreement/EC/FP7/270247/EU
oaire.awardURIinfo:eu-repo/grantAgreement/FCT/3599-PPCDT/RIPD%2FADA%2F109690%2F2009/PT
oaire.fundingStream3599-PPCDT
oaire.fundingStreamFP7
oaire.fundingStream3599-PPCDT
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.identifierhttp://doi.org/10.13039/501100008530
project.funder.identifierhttp://doi.org/10.13039/501100001871
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameFundação para a Ciência e a Tecnologia
project.funder.nameEuropean Commission
project.funder.nameFundação para a Ciência e a Tecnologia
rcaap.rightsopenAccesspor
rcaap.typedoctoralThesispor
relation.isProjectOfPublicationa1d4f5bc-904b-4333-8246-8bb492b24243
relation.isProjectOfPublication5080fe84-357b-4375-8a68-d4ad7d655b6c
relation.isProjectOfPublicationef5f67fa-93e7-4d9a-8157-a59c70c4e0d9
relation.isProjectOfPublication040b4096-32af-4e77-a386-6c3b5207882a
relation.isProjectOfPublication.latestForDiscoveryef5f67fa-93e7-4d9a-8157-a59c70c4e0d9
thesis.degree.disciplineCiências da Computação e Engenhariapor
thesis.degree.levelDoutorpor
thesis.degree.nameDoutoramento em Ciências da Computação e Engenhariapor

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
JM PhD Thesis.pdf
Size:
35.62 MB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.46 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections