Defesa de Proposta de Dissertação (26/03/2026): André Igor Pereira
Discente: André Igor Pereira
Título: AranduFlow: Rumo ao uso de metadados de desempenho e domínio para prever e otimizar a execução de dataflows em ambientes de HPC
Orientadores: Rafaelli Coutinho (Orientadora) e Daniel de Oliveira (Co-orientador)
Banca: Rafaelli Coutinho (Cefet/RJ), Daniel de Oliveira (IC/UFF) , Diego Carvalho (Cefet/RJ) e Eduardo Ogasawara (Cefet/RJ)
Dia/hora: 26 de março de 2026, às 15h
Sala: https://teams.microsoft.com/meet/21171543786516?p=S3i661e69vhpMv2BPL
Resumo: A predição do tempo de execução é um desafio central para aplicações baseadas em dataflows executadas em ambientes de Computação de Alto Desempenho (HPC). A variabilidade nos dados de entrada, nos parâmetros de execução e nas configurações da infraestrutura faz com que o espaço de busca cresça exponencialmente, embora tais estimativas sejam fundamentais para decisões de seleção de recursos. Este trabalho apresenta o AranduFlow, um gateway agnóstico a dataflows que oferece suporte à submissão de dataflows e fornece predições de tempo de execução com base em dados históricos de execução e modelos de aprendizado de máquina. O AranduFlow complementa os escalonadores HPC existentes ao oferecer suporte preditivo à tomada de decisão sem interferir nas políticas de escalonamento ou na semântica de execução. A abordagem é avaliada utilizando um dataflow real de bioinformática executado em múltiplos clusters de HPC sob diferentes condições. Os resultados experimentais demonstram que o AranduFlow alcança predições precisas de tempo de execução, com modelos baseados em árvores de decisão oferecendo um equilíbrio favorável entre desempenho preditivo e interpretabilidade.