Publication
Machine learning methods applied to the dots and boxes board game
| datacite.subject.fos | Engenharia e Tecnologia::Outras Engenharias e Tecnologias | pt_PT |
| dc.contributor.advisor | Oliveira, José Valente de | |
| dc.contributor.author | Costa, Giovani Pignaton da | |
| dc.date.accessioned | 2023-01-10T10:18:41Z | |
| dc.date.available | 2023-01-10T10:18:41Z | |
| dc.date.issued | 2022-03-03 | |
| dc.description.abstract | Pontos e Quadrados (Dots and Boxes na versão anglo-saxónica) é um jogo clássico de tabuleiro no qual os jogadores unem quatro pontos próximos numa grelha para criar o maior número possível de quadrados. Este trabalho irá inverstigar técnicas de aprendizagem profunda e aprendizagem por reforço, que torna possível um programa de computador aprender como jogar o jogo, sem nenhuma interação humana, e aplicar o mesmo ao jogo Dots and Boxes; a abordagem usada no DeepMind AlphaZero será analisada. O AlphaZero combina uma rede neural convolucional e o algoritmo Monte Carlo Tree Search para alcançar um desempenho super humano, sem conhecimento prévio, em jogos como o Xadrez, Go, e Shogi. Os resultados obtidos permitem aferir sobre a adequação da abordagem ao jogo Pontos e Quadrados. | pt_PT |
| dc.description.abstract | Dots and Boxes is a classical board game in which players connect four nearest dots in a grid to create the maximum possible number of boxes. This work will investigate deep learning techniques with reinforcement learning to make possible a computer program to learn how to play the game, without human interaction, and apply it to the Dots and Boxes board game; the approach beyond DeepMind AlphaZero being taken as the approach to follow. AlphaZero makes a connection between a Convolutional Neural Network and the Monte Carlo Tree Search algorithm to achieve superhuman performance, starting from no a priori knowledge in games such as Chess, Go, and Shogi. The results obtained allow to measure the approach adequacy to the game Dots and Boxes. | pt_PT |
| dc.identifier.tid | 203012054 | pt_PT |
| dc.identifier.uri | http://hdl.handle.net/10400.1/18772 | |
| dc.language.iso | eng | pt_PT |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | pt_PT |
| dc.subject | Adversarial search | pt_PT |
| dc.subject | Machine learning | pt_PT |
| dc.subject | Deep learning | pt_PT |
| dc.subject | Reinforce-ment learning | pt_PT |
| dc.subject | Dots and boxes | pt_PT |
| dc.subject | Rede neural artificial | pt_PT |
| dc.subject | Rede neural convolucional | pt_PT |
| dc.subject | Jogos | pt_PT |
| dc.subject | Alphazero | pt_PT |
| dc.subject | Deepmind | pt_PT |
| dc.subject | Jogos de tabuleiro | pt_PT |
| dc.subject | Auto aprendizado | pt_PT |
| dc.title | Machine learning methods applied to the dots and boxes board game | pt_PT |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| rcaap.rights | openAccess | pt_PT |
| rcaap.type | masterThesis | pt_PT |
| thesis.degree.grantor | Universidade do Algarve. Faculdade de Ciências e Tecnologia | |
| thesis.degree.level | Mestre | |
| thesis.degree.name | Mestrado em Engenharia Informática | pt_PT |
