Defesa de dissertação (21/08/2024): Luis Carlos Ramos Alvarenga
Discente: Luis Carlos Ramos Alvarenga
Título: Dimensionamento de recursos para execução de workflows científicos em ambientes de computação de alto desempenho
Orientadores: Rafaelli de Carvalho Coutinho e Daniel Cardoso de Moraes de Oliveira
Banca: Rafaelli de Carvalho Coutinho (PPCIC), Daniel Cardoso de Moraes de Oliveira (UFF), Marta Lima de Queirós Mattoso (UFRJ), Pedro Henrique González Silva (PPCIC), Yuri Abitbol de Menezes Frota (UFF)
Dia/hora: 21 de agosto de 2024, às 9h.
Sala alternativa: https://meet.google.com/czq-gxkv-jdd?authuser=0
Resumo: Cientistas cada vez mais necessitam executar experimentos altamente exigentes em termos computacionais. Estes experimentos são frequentemente modelados como workflows científicos e são executados em ambientes de computação de alto desempenho (HPC). Tipicamente estes ambien tes fornecem uma grande variedade de recursos aos usuários. O dimensionamento adequado dos recursos para a execução de workflows científicos nestes ambientes é uma tarefa crucial. Um ambiente sub ou superdimensionado pode afetar diretamente o desempenho do experimento, gerando impactos negativos relacionados ao tempo e ao custo financeiro da execução. Com isso, pesquisas envolvendo estimação de recursos para execução de experimentos em ambientes de HPC vem sendo realizadas, como a heurística GraspCC, que usa o procedimento de busca adaptativa randomizada gulosa (GRASP). O objetivo deste trabalho é investigar a execução de workflows científicos em ambientes de alto desempenho, tais como clusters e nuvens de computadores, com o intuito de estimar eficientemente os recursos necessários considerando o tempo e os custos financeiros associados. O problema foi definido a partir da proposta de estruturação do workflow em estágios ou níveis paralelos de tarefas semelhantes entre si e que operam de maneira independente, chamada Layered-Bucket (LB). Para resolver o problema, foram propostas uma formulação de programação matemática inteira e uma adaptação da heurística GraspCC para considerar a abordagem LB, chamada GraspCC-LB. A abordagem proposta foi avaliada utilizando traces reais de workflows das áreas de bioinformática e astronomia. As estimativas de recursos produzidas pela GraspCC-LB foram comparadas com o uso real de recursos em um ambiente HPC do mundo real para avaliar sua eficácia. Os resultados mostram a eficácia do GraspCC-LB como uma abordagem robusta para otimização de recursos no contexto de workflows científicos de grande escala que requerem capacidades HPC, apresentando-se como uma importante ferramenta de apoio à tomada de decisões.