Defesa de dissertação (11/12/2020): Daniel Ferreira de Oliveira
Discente: Daniel Ferreira de Oliveira
Título: Riographx: um portal científico de apoio as pesquisas em teoria espectral de grafos
Orientadores: Leonardo Silva de Lima (orientador) e Eduardo Bezerra da Silva (coorientador)
Banca: Leonardo Silva de Lima (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ), Virgínia Maria Rodrigues (UFGRS), Claudia Marcela Justel (IME)
Dia/hora: 11 de dezembro de 2020, às 16h
Resumo: A Teoria Espectral de Grafos (TEG) é uma parte da matemática discreta que estuda as propriedades de um grafo a partir das informações fornecidas pelos autovalores e autovetores da matriz associada a este grafo. Esta teoria vem atraindo um maior interesse de pesquisadores desde a decada de 80, em virtude da sua aplicação em diversas áreas, como na Química, na Matemática, na Engenharia e na Ciência da Computação. Com o crescimento exponencial do volume de dados a que se tem disponível atualmente, o processamento das informações em ambientes de execução de tarefas em paralelo e distribuído é crucial para uma melhor produtividade e desempenho. Com o objetivo de construir uma ferramenta WEB que dispensa o uso de recursos de processamento por parte do usuário, propomos o RioGraphX. Um portal científico desenvolvido utilizando o Apache Spark, que tem como objetivo obter todos os grafos que otimizam uma função matemática envolvendo invariantes de um grafo com possíveis restrições. Um workflow com sete etapas foi desenvolvido de modo a obter o máximo de tarefas possíveis executando no ambiente para computaçãoo paralela e distribuída do Apache Spark. Como o Spark fornece API para Scala, Java e Python, neste estudo foram desenvolvidos dois codigos-fontes: um na linguagem Java e outro em Python devido à abundância de bibliotecas de apoio. Em seguida, foram realizados dois testes: um de validação e outro de desempenho. A partir dos testes, cálculos de speedup e Eficiencia compondo um comparativo de execução de tarefas em ambiente de processamento paralelo e distribuído com ambiente monoprocessado evidenciaram a superioridade do código desenvolvido em Java e a avaliação destas métricas de desempenho demonstram a importância da alocação dinâmica de recursos do Spark levando em consideração o tamanho da base de dados. Os tempos de execução do Portal se mostraram satisfatórios tendo em vista o volume de dados processados.