Defesa de dissertação (18/03/2026): Nathália Carvalho Tito

Defesas

Discente: Nathália Carvalho Tito

Título: Análise de Desempenho e Características de Corredores para Predição de Resultados e Geração de Feedbacks Personalizados

Orientadores: Glauco Fiorott Amorim (Orientador) e Eduardo Bezerra da Silva (Co-orientador)

Banca: Glauco Fiorott Amorim (Cefet/RJ), Eduardo Bezerra da Silva (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ) e Cláudio Miceli de Farias (COPPE/UFRJ).

Dia/Hora: 18 de março de 2026 / 8h

Sala: https://teams.microsoft.com/meet/22404162370488?p=2x3lfHhn8JsNjYtQEL

Resumo: O aumento do número de praticantes de corrida de rua tem intensificado a demanda por soluções capazes de oferecer suporte individualizado ao treinamento, especialmente entre corredores amadores que carecem de acompanhamento profissional contínuo. Nesse contexto, este estudo propõe um modelo integrado de análise de desempenho baseado em técnicas de aprendizado de máquina, com o objetivo de compreender padrões de treino, prever o desempenho de corredores e gerar recomendações personalizadas a partir de variáveis controláveis. Foram utilizados dados provenientes de um questionário e de registros de atividades exportados de um aplicativo de corrida, envolvendo 26 atletas com diferentes níveis de experiência, permitindo uma visão multidimensional dos hábitos de treino e da experiência esportiva. A metodologia foi estruturada em três fases principais. Na primeira, realizou-se uma análise de clusterização utilizando algoritmos clássicos K-means, DBSCAN e Agglomerative Clustering aplicados a componentes principais responsáveis por 80\% da variabilidade dos dados. O modelo final selecionado identificou três perfis distintos: “Experientes Jovens”, “Pouco Experientes” e “Experientes Veteranos”, diferenciados por idade, maturidade esportiva e padrões de treino. Na segunda fase, desenvolveu-se um modelo preditivo baseado em \textit{gradient boosting}, utilizando o algoritmo XGBoost, tanto em uma configuração geral quanto em versões específicas para cada cluster. Modelos de Regressão Linear também foram testados como abordagem de referência; entretanto, o XGBoost apresentou desempenho superior em todos os cenários avaliados, evidenciando maior capacidade de capturar relações não lineares e interações complexas entre as variáveis. Os resultados indicaram ainda que cada grupo respondeu de maneira particular às variáveis de treino, reforçando que a segmentação aprimora substancialmente a capacidade preditiva e a adequação das recomendações. A interpretação dos modelos foi conduzida por meio da análise dos SHAP values, que permitiu identificar as variáveis de maior influência nas previsões. De forma geral, destacaram-se fatores diretamente relacionados ao desempenho e à estrutura do treino, como velocidades mínima e máxima, distância percorrida, variabilidade do ritmo e histórico recente de velocidade, além de variáveis contextuais como temperatura. A análise segmentada revelou padrões distintos entre os grupos, indicando que diferentes perfis de corredores apresentam sensibilidades específicas a aspectos como intensidade, regularidade e consistência do treinamento, o que reforça a importância da personalização das recomendações. Na terceira fase, aplicou-se um algoritmo de otimização para identificar combinações de variáveis controláveis capazes de maximizar o desempenho previsto em cada perfil. A avaliação dos resultados foi fundamentada na comparação com cenários baseline, nos quais não havia ajuste das variáveis de decisão, permitindo quantificar de forma objetiva os ganhos obtidos com a otimização. As recomendações derivadas mostraram coerência interna e alinhamento com características dos clusters: maior ênfase em intensidade e variedade para corredores jovens experientes; foco em regularidade, consistência e fortalecimento muscular para pouco experientes; e estratégias de manutenção, equilíbrio e controle de carga para veteranos. Os achados demonstram que a integração entre clusterização, modelagem preditiva e otimização forma uma abordagem consistente e promissora para o desenvolvimento de sistemas inteligentes de recomendação esportiva baseados em dados. Apesar das limitações relacionadas ao tamanho da amostra e à ausência de indicadores fisiológicos de maior granularidade, o estudo apresenta evidências iniciais de que modelos computacionais podem apoiar a personalização do treinamento de forma eficiente, acessível e escalável. Futuras pesquisas podem ampliar a base de dados, incorporar novas dimensões informacionais, validar o modelo em populações maiores e explorar sua aplicação em plataformas digitais. Conclui-se que a combinação de técnicas de ciência de dados e métodos de otimização contribui significativamente para a compreensão do desempenho em corrida e para o desenvolvimento de recomendações individualizadas que favorecem evolução, aderência e segurança na prática esportiva.