Publication
Predictive analytics for sales forecasting in smes: a machine learning and bi integration
datacite.subject.fos | Ciências Sociais::Outras Ciências Sociais | |
dc.contributor.advisor | Ramos, Célia Maria Quitério | |
dc.contributor.author | Contreiras, Alexandre Miguel Guerreiro | |
dc.date.accessioned | 2025-05-23T09:42:37Z | |
dc.date.available | 2025-05-23T09:42:37Z | |
dc.date.issued | 2024-03-12 | |
dc.description.abstract | A previsão de vendas é um desafio significativo para empresas do setor turı́stico, uma vez que depende de vários elementos, como a sazonalidade, o comportamento dos turistas, as condições macroeconómicas e inclusive as condições meteorológicas. O Algarve é uma região central para o turismo em Portugal, atraindo turistas de diversas partes do mundo devido à sua extensa costa e condições favoráveis para atividades marı́timo-turı́sticas. Este trabalho tem como propósito investigar a integração de análise preditiva com técnicas de machine learning para a previsão de vendas numa pequena e média empresa no setor do turismo náutico. O estudo centra-se numa empresa que opera principalmente na oferta de passeios marı́timo- turı́sticos, localizada no Algarve. Para tal, desenvolveu-se um modelo preditivo que utiliza dados históricos de bookings, bem como outros conjuntos de dados suplementares, tais como chegadas ao aeroporto de Faro, estadias no distrito de Faro e tráfego no website da empresa, integrando-os num software de Business Intelligence, o Power BI. O principal objetivo deste estudo foi criar um modelo de previsão de vendas capaz de criar previsões precisas e de fácil interpretação referente aos lugares nas embarcações dos passeios da empresa em estudo. Estas previsões de vendas visam apoiar os gestores nas suas decisões operacionais e estratégicas. Com todo o desenvolvimento de modelos e análises dos datasets, não se pretende apenas realizar uma previsão de vendas, mas também fornecer informações úteis para a otimização de recursos e planeamento financeiro, que são fundamentais para melhorar a eficiência de pequenas e média empresas neste setor altamente competitivo. Assim, este estudo procura uma abordagem dinâmica que combina técnicas de machine learning com ferramentas de visualização de dados, permitindo que os gestores da empresa em estudo consigam compreender e aplicar conclusões em casos práticos na gestão da mesma. A metodologia deste estudo baseou-se no CRISP-DM (Cross-Industry Standard Process for Data Mining), uma metodologia amplamente utilizada no ramo de ciência de dados e data mining. Este processo compreende seis fases: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation e Deployment. A fase inicial envolveu uma análise aprofundada do setor e operadores do turismo náutico no Algarve, bem como uma revisão da literatura sobre previsão de vendas e técnicas de machine learning aplicadas ao turismo. A fase de Data Understanding, envolveu a recolha de dados provenientes de várias fontes. O dataset principal, consistiu em registos de reservas da empresa em estudo, recolhidos entre 2017 e 2024. Este conjunto de dados foi complementado com três datasets secundários: dados de chegadas ao Aeroporto de Faro, dados de estadias (dormidas) no distrito de Faro e dados referentes ao website da empresa. A integração destes conjuntos de dados proporcionou um contexto mais completo sobre os fatores que influenciam a procura turı́stica, permitindo uma modelação preditiva mais robusta. Durante a fase de preparação dos dados, foram aplicadas várias técnicas de extração, transformação e carregamento de dados, para garantir que estes apresentassem a qualidade desejada e demonstrando ser consistentes e prontos para análise. Além disso, foram criadas novas variáveis, como Lead Time (número de dias entre a data de reserva e a data de marcação) e Total PAX (número total de passageiros por reserva), para enriquecer o modelo. O tratamento de valores vazios e a remoção de outliers garantiram que o modelo estivesse preparado para gerar previsões fiáveis. A fase de Modeling envolveu a aplicação de várias técnicas de machine learning, incluindo Support Vector Regression, Random Forest e XGBoost. Os dados foram divididos em três granularidades de previsão: diária, semanal e mensal. Para cada escala temporal, foram desenvolvidos modelos separados e os seus desempenhos foram avaliados utilizando métricas como MAE, RSME, WAPE e R2. Os resultados mostram que o modelo Support Vector Regression apresenta o melhor desempenho na previsão diária, oferecendo previsões mais precisas para intervalos de curto prazo. O XGBoost, por outro lado, destacou-se nas previsões de vendas semanais e mensais, demonstrando a sua capacidade de capturar padrões mais amplos e de longo prazo no comportamento das vendas. Estes resultados demonstram que, ao combinar diferentes modelos de machine learning, é possı́vel obter previsões mais precisas dependendo do intervalo temporal em análise. Os modelos desenvolvidos foram implementados através do Power BI, permitindo a criação de quatro dashboards interativos. Cada um destes dashboards foi desenhado para responder a diferentes necessidades de gestão da empresa, fornecendo insights cruciais. O primeiro dashboard apresenta uma visão geral da performance da empresa. O segundo dashboard é focado na parte operacional da empresa. O terceiro dashboard auxilia na análise de desempenho financeiro, permitindo a visualização de receitas. Por fim, o quarto dashboard está focado nos resultados dos modelos, apresentando as métricas de desempenho e gráficos com as previsões geradas. Adicionalmente, foi integrado um gráfico de simulação de vendas que permite visualizar o impacto da alteração do preço da tour. O dashboard também inclui gráficos sobre as variáveis externas, proporcionando Sales forecasting is a signiicant challenge for companies in the tourism sector, as it depends on various factors such as seasonality, tourist behavior, macroeconomic conditions, and even weather conditions. The Algarve is a central region for tourism in Portugal, attracting tourists from various parts of the world due to its extensive coastline and favorable conditions for maritime tourism activities. This thesis examines the integration of predictive analytics and machine learning for sales forecasting in a small and medium-sized enterprise within the nautical tourism industry. The primary objective is to develop a robust forecasting model that helps the studied maritime tourism operator in the Algarve optimize resources and make informed business decisions. The methodology is based on the application of analysis and feature engineering, leveraging historical booking data along with secondary datasets, including district airport arrivals, overnight district stays, and website trafic. The data was processed, and the forecasting model, plus booking data, was integrated with Power BI to facilitate monitoring and operational planning. The results indicate that the SVR model is the most accurate for daily forecasting, while the XGBoost model demonstrates superior performance for weekly and monthly sales predictions. These models provide forecasts that support decision-making processes related to resource allocation and pricing strategies. The study also highlights the role of data storytelling in transforming raw data into actionable insights, allowing decision-makers to easily interpret and apply forecast results. This innovative approach contributes to the enhancement of sales forecasting models within the tourism sector, emphasizing the value of machine learning in improving financial efficiency and operational agility. uma visão mais abrangente dos fatores que podem influenciar as reservas. Esta integração com o Power BI facilita a interpretação dos resultados pelos gestores da empresa, permitindo-lhes ajustar rapidamente as suas operações com base nas previsões de vendas e comportamento do cliente, melhorando assim a eficiência operacional e a capacidade de resposta às mudanças no setor. Uma das principais contribuições deste estudo foi a combinação de machine learning com data storytelling através de ferramentas de visualização interativas, como o Power BI. Esta abordagem não só forneceu previsões de vendas, como também tornou os resultados acessı́veis e fáceis de interpretar para os gestores. Ao traduzir dados complexos em narrativas visuais, este estudo promoveu uma compreensão mais intuitiva das tendências de vendas e das necessidades operacionais. Este método contribui para o desenvolvimento de modelos preditivos mais sofisticados, que podem ser aplicados não só no turismo náutico, mas também em outros setores do turismo e hospitalidade. Em conclusão, este estudo demonstra o potencial das técnicas de machine learning para transformar o processo de previsão de vendas em PME do setor turı́stico, fornecendo ferramentas mais eicazes para a tomada de decisões. O uso de ferramentas de BI e análise preditiva oferece às empresas a capacidade de ajustar a sua estratégia de forma proativa, com base em dados, melhorando assim a competitividade num mercado em constante mudança. | por |
dc.description.abstract | Sales forecasting is a significant challenge for companies in the tourism sector, as it depends on various factors such as seasonality, tourist behavior, macroeconomic conditions, and even weather conditions. The Algarve is a central region for tourism in Portugal, attracting tourists from various parts of the world due to its extensive coastline and favorable conditions for maritime tourism activities. This thesis examines the integration of predictive analytics and machine learning for sales forecasting in a small and medium-sized enterprise within the nautical tourism industry. The primary objective is to develop a robust forecasting model that helps the studied maritime tourism operator in the Algarve optimize resources and make informed business decisions. The methodology is based on the application of analysis and feature engineering, leveraging historical booking data along with secondary datasets, including district airport arrivals, overnight district stays, and website traffic. The data was processed, and the forecasting model, plus booking data, was integrated with Power BI to facilitate monitoring and operational planning. The results indicate that the SVR model is the most accurate for daily forecasting, while the XGBoost model demonstrates superior performance for weekly and monthly sales predictions. These models provide forecasts that support decision-making processes related to resource allocation and pricing strategies. The study also highlights the role of data storytelling in transforming raw data into actionable insights, allowing decision-makers to easily interpret and apply forecast results. This innovative approach contributes to the enhancement of sales forecasting models within the tourism sector, emphasizing the value of machine learning in improving inancial eficiency and operational agility. | eng |
dc.identifier.tid | 203803086 | |
dc.identifier.uri | http://hdl.handle.net/10400.1/27157 | |
dc.language.iso | eng | |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Previsão de vendas | |
dc.subject | Analise preditiva | |
dc.subject | Turismo náutico | |
dc.subject | Machine learning | |
dc.title | Predictive analytics for sales forecasting in smes: a machine learning and bi integration | por |
dc.type | master thesis | |
dspace.entity.type | Publication | |
thesis.degree.grantor | Universidade do Algarve. Escola Superior de Gestão, Hotelaria e Turismo | |
thesis.degree.level | Mestre | |
thesis.degree.name | Mestrado em Gestão de PME |