Defesa de dissertação (21/08/2024): Luis Carlos Ramos Alvarenga

Discente: Luis Carlos Ramos Alvarenga

Título: Dimensionamento de recursos para execução de workflows científicos em ambientes de computação de alto desempenho

Orientadores: Rafaelli de Carvalho Coutinho e Daniel Cardoso de Moraes de Oliveira

Banca: Rafaelli de Carvalho Coutinho (PPCIC), Daniel Cardoso de Moraes de Oliveira (UFF), Marta Lima de Queirós Mattoso (UFRJ), Pedro Henrique González Silva (PPCIC), Yuri Abitbol de Menezes Frota (UFF)

Dia/hora: 21 de agosto de 2024, às 9h.

Local: https://teams.microsoft.com/l/meetup-join/19%253aafLsm4pQ8LA4BQvp0ARudoFA5U9d26I1HIyxCW0qO5w1%2540thread.tacv2/1721171058293?context%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%252254af42a0-5f30-4905-ac8d-10b96c6db26b%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw0kLstrc7AyYeq7jI–b_7E

Sala alternativa: https://meet.google.com/czq-gxkv-jdd?authuser=0

Resumo: Cientistas cada vez mais necessitam executar experimentos altamente exigentes em termos computacionais. Estes experimentos são frequentemente modelados como workflows científicos e são executados em ambientes de computação de alto desempenho (HPC). Tipicamente estes ambien tes fornecem uma grande variedade de recursos aos usuários. O dimensionamento adequado dos recursos para a execução de workflows científicos nestes ambientes é uma tarefa crucial. Um ambiente sub ou superdimensionado pode afetar diretamente o desempenho do experimento, gerando impactos negativos relacionados ao tempo e ao custo financeiro da execução. Com isso, pesquisas envolvendo estimação de recursos para execução de experimentos em ambientes de HPC vem sendo realizadas, como a heurística GraspCC, que usa o procedimento de busca adaptativa randomizada gulosa (GRASP). O objetivo deste trabalho é investigar a execução de workflows científicos em ambientes de alto desempenho, tais como clusters e nuvens de computadores, com o intuito de estimar eficientemente os recursos necessários considerando o tempo e os custos financeiros associados. O problema foi definido a partir da proposta de estruturação do workflow em estágios ou níveis paralelos de tarefas semelhantes entre si e que operam de maneira independente, chamada Layered-Bucket (LB). Para resolver o problema, foram propostas uma formulação de programação matemática inteira e uma adaptação da heurística GraspCC para considerar a abordagem LB, chamada GraspCC-LB. A abordagem proposta foi avaliada utilizando traces reais de workflows das áreas de bioinformática e astronomia. As estimativas de recursos produzidas pela GraspCC-LB foram comparadas com o uso real de recursos em um ambiente HPC do mundo real para avaliar sua eficácia. Os resultados mostram a eficácia do GraspCC-LB como uma abordagem robusta para otimização de recursos no contexto de workflows científicos de grande escala que requerem capacidades HPC, apresentando-se como uma importante ferramenta de apoio à tomada de decisões.