Categoria:Defesas

Defesa de dissertação (11/12/2024): Fabio da Silva Gregório

Discente: Fabio da Silva Gregório

Título: LexRank guiado para recuperação avançada em análise jurídica

Orientador: Eduardo Bezerra da Silva

Banca: Eduardo Bezerra da Silva (Cefet/RJ – PPCIC), Altigran Soares da Silva (IComp / UFAM), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Gustavo Paiva Guedes e Silva (PPCIC / CEFET-RJ).

Data: 11 de dezembro de 2024, às 16h

Link da sala do MS Teams: https://teams.microsoft.com/v2/?meetingjoin=true#/l/meetup-join/19:OnS4EZKGpsKeGa50vaGxvZZ604acCFsazTfC-LTdwYE1@thread.tacv2/1730395539949?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d&anon=true&deeplinkId=830cfb45-96fe-4604-9c5d-13b1ffa801ee

Resumo: A Constituição Brasileira prevê mecanismos para que cidadãos peticionem ao Judiciário, incluindo o chamado recurso especial. Esse tipo específico de recurso visa uniformizar a interpretação jurídica da legislação brasileira. O tratamento de recursos especiais é uma das tarefas diárias no Judiciário, regularmente apresentando demandas significativas em seus tribunais. Propomos um método, baseado em aprendizado de máquina não supervisionado, para auxiliar o analista jurídico a classificar um recurso especial em um tema de uma lista disponibilizada pelo Superior Tribunal de Justiça (STJ). Como parte desse método, propomos uma modificação do algoritmo LexRank baseado em grafos, que chamamos de Guided LexRank. Esse algoritmo gera o resumo de um recurso especial. O grau de similaridade entre o resumo gerado e diferentes temas é avaliado usando o algoritmo BM25. Como resultado, o método apresenta um ranking de temas mais adequados ao recurso especial analisado. O método proposto não requer rotulagem prévia do texto a ser avaliado e elimina a necessidade de grandes volumes de dados para treinar um modelo, como normalmente ocorre em modelos supervisionados. Avaliamos a eficácia do método aplicando-o a um corpus de recurso especial previamente classificado por especialistas humanos.

Dissertação

Defesa de dissertação (10/12/2024): Jéssica Barbosa de Souza Costa

Discente: Jéssica Barbosa de Souza Costa

Título: Um Novo Método Híbrido de Detecção de Anomalias Baseado em EMD e ARIMA

Orientadores: Eduardo Ogasawara (Orientador) e Ronaldo Alves (Co-orientador)

Banca: Eduardo Ogasawara (Cefet-RJ / PPCIC), Ronaldo Alves (Fiocruz), Kele Belloze (Cefet-RJ / PPCIC), Fabio Porto (LNCC), Cristiano Boccolini (Fiocruz)

Data: 10 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3apSO9WbZ1YPXvTg8M8nxnUCqUHTtoL1r-dXbVdbYffHo1%40thread.tacv2/1729787552506?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%220534c83a-4cef-4129-9f9f-e8b8c3d50019%22%7d

Resumo: Anomalias são definidas como desvios comportamentais em relação a padrões esperados e identificá-las é um desafio importante. A detecção de anomalias é uma atividade fundamental na análise de séries temporais. Ela permite a tomada de decisões baseada em dados em muitas atividades de controle e monitoramento, como cuidados de saúde, qualidade da água, análise de reflexão sísmica e exploração de petróleo. Existem muitos métodos de detecção de anomalias, mas escolher os métodos apropriados é complexo devido à natureza intrínseca das séries temporais. Há uma demanda por métodos de detecção de anomalias que sejam robustos, minimizem falsos positivos e adaptáveis a cenários não estacionários. Este trabalho introduz a Decomposição de Modo Empírico Refinada (REMD, do inglês Refined Empirical Mode Decomposition) como uma abordagem híbrida para atender a essa necessidade, integrando os modelos de Decomposição de Modo Empírico (EMD, do inglês Empirical Mode Decomposition) e Autoregressão Integrada de Médias Móveis (ARIMA, do inglês Autoregressive Integrated Moving Average). A concepção do REMD visa otimizar os pontos fortes de ambos os métodos e superar suas limitações. Ele é avaliado em comparação com métodos de ponta em diversos conjuntos de dados. O REMD demonstra desempenho superior, com pontuação até três vezes melhor no F1.

Dissertação

Defesa de dissertação (09/12/2024): Mateus do Amor Devino Pereira

Discente: Mateus do Amor Devino Pereira

Título: Uma Comparação de Workflows para Análise de dados de scRNA-seq para Identificação de Genes Diferencialmente Expressos em Câncer de Mama

Orientadores: Eduardo Bezerra da Silva (orientador) e Kele Teixeira Belloze (co-orientadora)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Pedro Henrique González Silva (PPCIC / UFRJ), Fabrício Alves Barbosa da Silva (FIOCRUZ)

Data: 09 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aCa_etTt2B_WMpjpSaAVT301MmiLnMg4N81AYVe__dMA1%40thread.tacv2/1731407636571?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Nos últimos anos, pesquisas com dados multiômicos desempenhou um papel importante no entendimento da biologia celular. Em particular, a análise de dados de sequenciamento de RNA de células únicas contribuiu para a descoberta de medicamentos e na identificação de biomarcadores de doenças complexas, como o câncer. No entanto, quando se trata de analisar dados de scRNA-seq, várias etapas do processamento podem ser feitas de maneiras diferentes. Este estudo fornece uma comparação de diferentes combinações de técnicas em um workflow de scRNA-seq, evidenciando como cada uma dessas etapas impacta os resultados. Realizamos experimentos em três conjuntos de dados transcriptômicos de diferentes magnitudes de número de amostras. Nossos experimentos consistem em aplicar um conjunto de técnicas de pré-processamento e agrupamento a dados de scRNA-seq de câncer de mama. Também realizamos um estudo de ablação para entender como cada técnica influenciou os resultados do experimento.

Dissertação

Defesa de dissertação (02/12/2024): Leandro de Mattos Bento Soares

Discente: Leandro de Mattos Bento Soares

Título: Detecção de quedas de soldados combatentes por meio de redes neurais artificiais

Orientadores: Eduardo Bezerra da Silva (orientador) e Diego Nunes Brandão (co-orientador)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Diego Nunes Brandão (PPCIC / CEFET-RJ), Pedro Henrique González (PPCIC / CEFET-RJ), Pablo Rangel (IPqM), Cláudio Miceli de Farias (PESC / UFRJ)

Data: 02 de dezembro de 2024, às 9h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aerNEcB95_5BX8BvwWi0MfdotZi1WhNCtKjL_mHyNdHg1%40thread.tacv2/1730395201113?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Durante operações militares envolvendo soldados combatentes, estes enfrentam uma série de desafios físicos devido à natureza das atividades, incluindo lesões que podem resultar em choque hemorrágico hipovolêmico e, em casos extremos, levar ao óbito. Assim, é fundamental que os centros de controle dessas operações sejam rapidamente informados sobre a condição dos combatentes, permitindo a agilização do resgate e a preservação de suas vidas. Nesse contexto, a Marinha do Brasil desenvolveu o projeto “Combatente do Futuro”, que tem como objetivo criar modelos capazes de detectar situações que demandem socorro imediato ao combatente, bem como outras ocorrências relevantes, como conflitos ou situações de risco, que possam ser identificadas automaticamente a partir das variações inerciais dos combatentes. Para a coleta dessas variáveis inerciais, foram escolhidos dispositivos específicos: um modelo de smartwatch, posicionado nos pulsos direito e esquerdo, e um modelo de smartphone, posicionado no peito do soldado. Dentro desse projeto, destaca-se a investigação de métodos para detecção de quedas de soldados, dividida em duas etapas principais. A primeira etapa consiste na implementação de um modelo de rede neural para detectar padrões de queda, enquadrando o problema como uma tarefa de classificação. Já a segunda etapa busca propor um classificador binário, com o objetivo de diferenciar quedas operacionais de quedas causadas por ferimentos. Esta dissertação concentra-se na detecção de quedas, pertencente à primeira etapa. Para a realização desta pesquisa, foram coletados dados de atividades de vida diária, atividades de quedas e atividades militares com porte e sem porte de arma de 15 militares da Marinha do Brasil, simulando as entradas para o modelo de rede neural a ser implementado e testado em situações de campo. A partir desse conjunto de dados, foram estabelecidos 12 cenários experimentais para cada posição dos sensores, explorados nos domínios do tempo e da frequência, com o objetivo de identificar o conjunto de variáveis inerciais, a posição dos sensores e o domínio que apresentassem o melhor desempenho na classificação de eventos de queda. O conjunto de configurações escolhido foi implementado na arquitetura de rede neural CNN1D, cujos hiperparâmetros foram ajustados por meio de otimização bayesiana.

Dissertação

Defesa de dissertação (14/11/2024): Augusto José Moreira da Fonseca

Discente: Augusto José Moreira da Fonseca

Título: Interpolação de Precipitação por Redes Neurais Convolucionais para Grafos

Orientadores: Eduardo Bezerra da Silva (orientador) e Fabio Andre Machado Porto (coorientador)

Banca: Eduardo Bezerra da Silva (Cefet/RJ – PPCIC), Fabio Andre Machado Porto (LNCC), Eduardo Soares Ogasawara (Cefet/RJ – PPCIC), Mariza Ferro (UFF), Leonardo Silva de Lima (UFPR)

Data: 14 de novembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3ArAguK974ED0IdDp27h1nAIKVWH01aj88d1JUGZ5NLhc1%40thread.tacv2/1723817716556?context=%7B%22Tid%22%3A%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2C%22Oid%22%3A%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7D

Resumo: O monitoramento e a previsão das condições climáticas atmosféricas têm implicações significativas em diversos campos, como agricultura, transporte e segurança pública. Previsões eficazes das condições climáticas podem ajudar a mitigar e prevenir os impactos adversos de eventos climáticos severos, incluindo a perda de vidas humanas. Com os avanços tecnológicos, existem vários instrumentos disponíveis para observação atmosférica, como satélites, radares e estações de superfície. Esses instrumentos fornecem observações em tempo real e, em alguns casos com alta resolução espacial e temporal, tornado-se insumo ideal para o treinamento de modelos de previsão do tempo baseados em Aprendizado de Máquina (AM). Por outro lado, um desafio acerca dos dados meteorológicos é a disponibilidade e distribuição espacial das estações de superfície. Por conta de sua distribuição desigual, certas áreas acabam com monitoramento insuficiente. Métodos de interpolação são comumente usados para inferir valores de precipitação para áreas não cobertas. No entanto, esses métodos frequentemente negligenciam o contexto e a física da atmosfera, resultando em discrepâncias entre os dados interpolados e os observados. Além disso, esses métodos não levam em consideração o espaço e o tempo simultaneamente. Este estudo tem como objetivo implementar uma Rede Convolucional Espaço-Temporal de Grafos (STGCN, na sigla em inglês) para interpolar dados de precipitação, que é uma variável significativamente desbalanceada. A STGCN é adaptada para realizar a interpolação da precipitação, aprendendo os padrões e a física da atmosfera em séries temporais multivariadas de múltiplos instrumentos meteorológicos. O objetivo é melhorar a precisão da interpolação, especialmente em áreas com cobertura limitada de estações de superfície. Comparamos os resultados alcançados pela STGCN com os de um método tradicional de interpolação, o Inverse Distance Weighting (IDW). Os resultados alcançados apontam que, comparado ao IDW, a STGCN é capaz de obter melhor acurácia em eventos mais extremos de precipitação e alcançam resultados promissores em eventos de menor magnitude. Em alguns casos, nosso modelo chegou a alcançar uma acurácia para eventos mais extremos entre 40% e 80% maior que o método IDW. No entanto, identificamos que o desbalanceamento dos dados de precipitação e a relativa baixa quantidade de exemplos de eventos extremos podem prejudicar a acurácia da STGCN em alguns cenários. Nosso método se mostra promissor e abre caminho para futuras pesquisas.

Dissertação 

Defesa de dissertação (23/10/2024): Lucas Ferreira Pinheiro

Discente: Lucas Ferreira Pinheiro

Título: Programação Linear Inteira Aplicada a Otimização Multiobjetivo da Topologia de Redes de Sensores Sem Fio Heterogêneas

Orientadores: Felipe da Rocha Henriques (Orientador) e Laura Silva de Assis (Co-orientadora)

Banca: Felipe da Rocha Henriques (PPCIC), Laura SIlva de Assis (PPCIC), Pedro Henrique González Silva (Cefet/RJ, UFRJ), Fábio Luiz Usberti (Unicamp)

Data: 23 de outubro de 2024, às 8h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aNtfud0ospBiDiIADR3hlcoSvSU9aQhJvx0nyYOrTQ3w1%40thread.tacv2/1728505028194?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22fae0cef4-35a7-472b-a664-720c350c49cc%22%7d

Resumo: Redes de Sensores Sem Fio (RSSF) possuem grande potencial para aplicações nas mais diversas áreas, tais como indústria, segurança, saúde pública e agricultura. Em geral, o desempenho ótimo de uma RSSF depende do dimensionamento correto de parâmetros fundamentais, tais como área de cobertura, conectividade e consumo de energia. Neste trabalho, é proposto um modelo de Programação Linear Inteira (PLI) multiobjetivo para resolver o Problema de Alocação de Sensores (PAS), considerando uma RSSF heterogênea com posições candidatas à alocação de nós sensores predefinidas em uma região de interesse. O objetivo do modelo proposto é minimizar o consumo energético, ao passo que busca-se maximizar a cobertura da rede na região de monitoramento. A validação do modelo foi realizada através de 225 experimentos computacionais com instâncias de pequena e média escala, utilizando linguagem Python e o solver Gurobi. Apesar da alta complexidade combinatória inerente ao PAS, o modelo proposto apresenta resultados factíveis e se mostra útil para auxiliar projetos de aplicações reais de RSSF. Os resultados obtidos servem como referência e podem ser utilizados para fins comparativos em desdobramentos deste estudo.

Dissertação 

Defesa de dissertação (19/09/2024): Danielle Rodrigues Pinna

Discente: Danielle Rodrigues Pinna

Título: Identificação de Falhas em Turbinas Eólicas: Uma Abordagem de Aprendizado de Máquina Centrada em Dados

Orientadores: Diego Nunes Brandão e Rodrigo Franco Toso

Banca: Diego Nunes Brandão (PPCIC),  Rodrigo Franco Toso (Microsoft), Rafaelli de Carvalho Coutinho (CEFET/RJ), Gustavo Silva Semaan (UFF), Ângela Ferreira (IPB/Portugal)

Dia/hora: 19 de setembro de 2024, às 11h.

Local: https://www.google.com/url?q=https%3A%2F%2Fteams.microsoft.com%2Fl%2Fmeetup-join%2F19%253a-qUeEmHzEwuC1rP6u6u-jU8-7KbVGBqlNGxLrMSku4Q1%2540thread.tacv2%2F1724725037596%3Fcontext%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%2522b1b7c333-2713-4523-9eae-7d94d8adcbe5%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw3gZemiUGozr78s2dtlO9V0

Resumo: Os últimos anos têm sido marcados pela transição da matriz energética mundial, predominantemente com as fontes eólica e solar, que são consideradas energias limpas. As turbinas eólicas, responsáveis pelo processo de conversão energética, se constituem por equipamentos complexos e de alto custo, suscetíveis a diversas falhas devido a múltiplos fatores operacionais e ambientais. O monitoramento contínuo dos componentes das turbinas é essencial para a detecção precoce de falhas, o que pode reduzir significativamente os custos de manutenção e aumentar a eficiência operacional. Este trabalho foca na aplicação e comparação de técnicas de aprendizado de máquina para a detecção de falhas em turbinas eólicas, utilizando uma abordagem centrada em dados. A pesquisa enfatiza a importância do pré-processamento dos dados, destacando técnicas de balanceamento de classes, particionamento de dados e seleção de atributos. Além disso, são comparados diferentes algoritmos de aprendizado de máquina, com foco na otimização de hiperparâmetros. Os resultados demonstram que um pré-processamento adequado dos dados é crucial para o desempenho dos modelos de aprendizado de máquina. Também é evidenciada a importância do tempo computacional na otimização dos hiperparâmetros e na seleção do algoritmo mais apropriado para o contexto específico do problema.

 

Dissertação 

Defesa de dissertação (21/08/2024): Luis Carlos Ramos Alvarenga

Discente: Luis Carlos Ramos Alvarenga

Título: Dimensionamento de recursos para execução de workflows científicos em ambientes de computação de alto desempenho

Orientadores: Rafaelli de Carvalho Coutinho e Daniel Cardoso de Moraes de Oliveira

Banca: Rafaelli de Carvalho Coutinho (PPCIC), Daniel Cardoso de Moraes de Oliveira (UFF), Marta Lima de Queirós Mattoso (UFRJ), Pedro Henrique González Silva (PPCIC), Yuri Abitbol de Menezes Frota (UFF)

Dia/hora: 21 de agosto de 2024, às 9h.

Local: https://teams.microsoft.com/l/meetup-join/19%253aafLsm4pQ8LA4BQvp0ARudoFA5U9d26I1HIyxCW0qO5w1%2540thread.tacv2/1721171058293?context%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%252254af42a0-5f30-4905-ac8d-10b96c6db26b%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw0kLstrc7AyYeq7jI–b_7E

Sala alternativa: https://meet.google.com/czq-gxkv-jdd?authuser=0

Resumo: Cientistas cada vez mais necessitam executar experimentos altamente exigentes em termos computacionais. Estes experimentos são frequentemente modelados como workflows científicos e são executados em ambientes de computação de alto desempenho (HPC). Tipicamente estes ambien tes fornecem uma grande variedade de recursos aos usuários. O dimensionamento adequado dos recursos para a execução de workflows científicos nestes ambientes é uma tarefa crucial. Um ambiente sub ou superdimensionado pode afetar diretamente o desempenho do experimento, gerando impactos negativos relacionados ao tempo e ao custo financeiro da execução. Com isso, pesquisas envolvendo estimação de recursos para execução de experimentos em ambientes de HPC vem sendo realizadas, como a heurística GraspCC, que usa o procedimento de busca adaptativa randomizada gulosa (GRASP). O objetivo deste trabalho é investigar a execução de workflows científicos em ambientes de alto desempenho, tais como clusters e nuvens de computadores, com o intuito de estimar eficientemente os recursos necessários considerando o tempo e os custos financeiros associados. O problema foi definido a partir da proposta de estruturação do workflow em estágios ou níveis paralelos de tarefas semelhantes entre si e que operam de maneira independente, chamada Layered-Bucket (LB). Para resolver o problema, foram propostas uma formulação de programação matemática inteira e uma adaptação da heurística GraspCC para considerar a abordagem LB, chamada GraspCC-LB. A abordagem proposta foi avaliada utilizando traces reais de workflows das áreas de bioinformática e astronomia. As estimativas de recursos produzidas pela GraspCC-LB foram comparadas com o uso real de recursos em um ambiente HPC do mundo real para avaliar sua eficácia. Os resultados mostram a eficácia do GraspCC-LB como uma abordagem robusta para otimização de recursos no contexto de workflows científicos de grande escala que requerem capacidades HPC, apresentando-se como uma importante ferramenta de apoio à tomada de decisões.

 

Dissertação 

Defesa de dissertação (27/06/2024): Érica Carneiro Queiroz da Silva

Discente: Érica Carneiro Queiroz da Silva

Título: Abordagens Baseadas em Ontologias para Análise de Sentimentos em Português do Brasil

Orientadores: Kele Teixeira Belloze (orientadora) e Gustavo Paiva Guedes e Silva (co-orientador)

Banca:  Kele Teixeira Belloze (Cefet/RJ), Gustavo Paiva Guedes e Silva (Cefet/RJ), Eduardo Bezerra da Silva (Cefet/RJ) e Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora: 27 de junho de 2024, às 13h

Local: https://teams.microsoft.com/l/meetup-join/19%3aa81e7d39098f4209a8d14dcaebac0e60%40thread.tacv2/1717788256837?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Com os avanços do Aprendizado de Máquina (AM), muitas soluções estatísticas foram desenvolvidas para resolver problemas de Análise de Sentimentos (AS) e Processamento de Linguagem Natural (PLN). No entanto, até o momento, nenhum processo de classificação estatística seria capaz de resolver relações semânticas e linguísticas da mesma forma que o cérebro humano. De acordo com a literatura, somente ferramentas extremamente robustas seriam capazes de gerar correlações entre os sentidos das palavras, trazendo o real significado simbólico aos textos. Ontologias são capazes de representar estruturas semânticas de modo a correlacionar conceitos em um domínio específico, assim como seres humanos associam palavras e recebem mensagens de acordo com sua realidade cultural, histórica e social. Apesar de recorrentes na área de Ciência da Computação, ontologias são raramente aplicadas à AS, com exceção de alguns exemplos na língua inglesa, cujos estudos apresentaram resultados promissores ao classificar sentimentos. O Brasil, atualmente não possui nenhum framework robusto que execute tarefas de AS com aspectos de abordagem ontológica ou base de conhecimento e poucas são as pesquisas utilizando a metodologia na língua portuguesa. Este trabalho apresenta uma comparação de métodos entre abordagens léxicas e bases de conhecimento com aspectos ontológicos, além de um novo corpus paralelo em português – inglês. Para tanto, efetuou-se, inicialmente, uma revisão de métodos com abordagens ontológicas aplicadas à AS com o objetivo primário de levantar discussões sobre possíveis estratégias de expansão para o campo de AS no Brasil. Espera-se, assim, despertar novas reflexões e um olhar mais profundo sobre humanidades digitais e suas abordagens híbridas, incluindo ontologias, no cenário luso-brasileiro.

Dissertação 

Defesa de dissertação (23/05/2024): Jorge Eugenio Medeiros Anselmo

Discente: Jorge Eugenio Medeiros Anselmo

Título: Plataforma para Mapeamento de Áreas de Risco para Veículos Automotores baseada e Aprendizado de Máquina associada a Geolocalização

Orientador: João Quadros

Dia: 23 de maio de 2024

Resumo: Diante do ambiente de incertezas financeiras e redução nas oportunidades de trabalho, agravados ainda mais pela pandemia de covid 19, ocorrem, como uma das consequências o aumento no índice de criminalidades, em especial, roubos e furto de veículos. Dentro desse contexto, podem aparecer questões, tais como: Quais os modos para prevenir ou ajudar a recuperarem veículos furtados, ou roubados? Este estudo visa apresentar embasamento teórico e prático para uma proposta de uma solução IOT , que possibilitará aos usuários bloquearem seus veículos, sinalizando um roubo/ furto, de modo que esses dados coletados sejam utilizados para um mapeamento, através de uma solução baseada em aprendizado de máquina, apresentando quais lugares são mais propensos a essas ocorrências de furtos ou roubos, permitindo criar alertas aos demais motoristas , podendo ainda, essa plataforma, ter sua base obtida compartilhada com demais setores da sociedade, como polícia, seguradoras entre outros.

Dissertação 

Defesa de dissertação (30/04/2024): Thiago Barral Fernandes Reis

Discente: Thiago Barral Fernandes Reis

Título: Detecção de Distúrbios do Sono em Dados de Polissonografia Através de Aprendizado de Máquina

Orientadores: Felipe da Rocha Henriques (orientador) e Michel Pompeu Tcheou (co-orientador)

Banca: Felipe da Rocha Henriques (Presidente), Michel Pompeu Tcheou (UERJ), Laura Silva de Assis (Cefet/RJ) e Tadeu Nagashima Ferreira (UFF)

Dia/hora: 30 de abril de 2024, às 15h

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3acM8gB1egyod9il6Gi3k6jMW0Kvs94-hEjUtZ_HeuOPU1%40thread.tacv2/1713785050693?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22fae0cef4-35a7-472b-a664-720c350c49cc%22%7d

Resumo: Um sono de boa qualidade, ou seja, sem interrupções e com períodos de tempo adequados para cada etapa, é imprescindível para a restauração apropriada das funções biológicas, neurológicas e psicológicas. Um indivíduo que se encontra em privação do sono pode apresentar comprometimento à saúde. A doença mais recorrente relacionada ao distúrbio do sono é a apneia do sono, a qual afeta a qualidade do sono, acordando o paciente do sono mais profundo e restaurador. Até hoje, o principal exame para diagnóstico de distúrbios do sono é conhecido como polissonografia, que é tradicionalmente realizado ao se passar uma noite de sono sob monitoramento em uma clínica especializada, e sua realização é muito complexa. Entretanto, a evolução da área de Internet das Coisas possibilitou a captação, através de dispositivos vestíveis, de vários dados que também são monitorados no exame tradicional de polissonografia. Desta forma, de uma maneira geral, este trabalho investiga a interseção entre a Ciência da Computação e a área da saúde. Mais especificamente, pretende-se avaliar a aplicação de algoritmos de aprendizado de máquina para a detecção de distúrbios do sono, de sorte a possibilitar um diagnóstico mais rápido do paciente. Como procedimento metodológico, quatro algoritmos de aprendizado de máquina foram avaliados em dados provenientes de uma base de dados reais de polissonografia (advindos de treze sinais). Além disso, também investigou-se o impacto da redução do número de sinais no desempenho dos algoritmos, cujo objetivo é facilitar a criação de um teste inicial (com menos sinais, por exemplo, utilizando-se dispositivos vestíveis) para complementar o exame de polissonografia. Os resultados indicaram que o algoritmo Random Forest foi o mais promissor, com desempenho satisfatório inclusive quando um menor número de sinais é considerado.

 

Dissertação 

Defesa de dissertação (07/03/2024): Andre Carlos Teixeira Vasconcellos

Discente: Andre Carlos Teixeira Vasconcellos

Título: Dispositivo IoT para atuar contra o desperdício de alimentos

Orientador: João Quadros

Dia: 07 de março de 2024

Resumo: Um terço dos alimentos produzidos anualmente para o consumo humano são perdidos ou desperdiçados globalmente. Os alimentos são em grande parte desperdiçados na fase de consumo, sendo que eles possuem a carga nutricional intacta, mas são de aparência desagradável e, por isso, são descartados. Isso acontece ainda no processo de respiração do alimento, o que significa que ocorre o descarte quando ainda são adequados para consumo humano. Os alimentos na fase de senescência iniciam o processo de decomposição da matéria orgânica por ação de organismos heterótrofos como bactérias e fungos. Como resultado desse processo, ocorre a liberação de água, amônia, gás carbônico e metano para o meio ambiente. Como os gases liberados estão associados à fase de maturação do alimento, existe a ideia de identificar os aclives e declives dos gases emitidos, durante sua decomposição, justamente para que se possa avaliar se o alimento ainda está disponível para consumo, ou precisa ser descartado de todo. Esta pesquisa consiste no desenvolvimento de uma plataforma (de hardware e software), composta de uma caixa com dispositivo IoT, e sensores, além de um software com algoritmo de Machine Learning, denominado de C0NT3NT3, que vem a ser um container inteligente com um aplicativo para dispositivo móvel, para indicar a um usuário comum, uma cozinheira caseira por exemplo, se o alimento na fase de senescência é próprio ou impróprio para o consumo.

 

Dissertação 

Defesa de dissertação (14/12/2023): Ryan Dutra de Abreu

Discente: Ryan Dutra de Abreu

Título: Um Estudo sobre a Integração de Algoritmos de Filtragem Colaborativa e Detecção de Comunidades para Melhoria do Desempenho das Recomendações

Orientadores: Laura Silva de Assis (orientadora) e Douglas de Oliveira Cardoso (co-orientador)

Banca: Laura Silva de Assis (Cefet/RJ), Douglas de Oliveira Cardoso (IPT),  Diego Nunes Brandão (Cefet/RJ) e João Nuno Vinagre Marques da Silva (NESC TEC / Universidade do Porto)

Dia/hora: 14 de dezembro de 2023, às 11h

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3aWfXqePNzHUyNHsKx_j1mGEKCA8uCBTA5fBbU9lGpm781%40thread.tacv2/1701372300703?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2291e505cb-28d8-40f6-a547-adfd127dabca%22%7d

Resumo: A recomendação de itens em sistemas de recomendação é uma técnica amplamente utilizada para auxiliar os usuários na descoberta de conteúdo relevante. Tradicionalmente, os algoritmos de recomendações baseados em filtragem colaborativa são os mais utilizados no campo devido ao seu bom desempenho frente às demais abordagens. Esses algoritmos buscam identificar padrões globais de similaridade entre usuários ou itens para gerar recomendações. Neste trabalho, investigamos como a combinação das tarefas de recomendação e detecção de comunidades  pode levar a recomendações melhores do que aquelas obtidas sem considerar comunidades implícitas. Para isso, avaliamos experimentalmente várias combinações de métodos para detecção de comunidades e algoritmos de recomendação, os quais foram submetido à experimentos computacionais considerando tanto conjuntos de dados sintéticos quanto reais. O objetivo intrínseco deste esforço foi o de revelar padrões interessantes no comportamento dos sistemas resultantes. Os resultados obtidos mostram que a inclusão de detectores de comunidades no sistema pode melhorar significativamente tanto a eficácia quanto a eficiência dos algoritmos de recomendação em alguns cenários. Essas descobertas podem ser usadas para ajudar pesquisadores e profissionais de ciência de dados a compreender melhor os benefícios e limitações dessa metodologia. Por fim, as descobertas aqui obtidas podem ser aplicadas em menor ou maior grau em diversos domínios onde a personalização de recomendações em nível local pode ser uma abordagem eficaz para melhorar a experiência do usuário, sobretudo em situações onde exista uma grande estrutura de redes e comunidades bem definidas.

 

Dissertação 

Defesa de dissertação (05/12/2023): Willian Pitter Cardoso Lima

Discente: Willian Pitter Cardoso Lima

Título: Uma Análise de Partidos Políticos Baseada em Discursos no Congresso Nacional Brasileiro

Orientadores: Laura Silva de Assis (orientadora) e Douglas de Oliveira Cardoso (co-orientador)

Banca: Laura Silva de Assis (Cefet/RJ), Douglas de Oliveira Cardoso (IPT),  Eduardo Bezerra da silva (Cefet/RJ) e Rafael Lima de Carvalho (UFT)

Dia/hora: 05 de dezembro de 2023, às 10h

Link da sala: https://events.teams.microsoft.com/event/5d3a930e-2018-4da1-9afa-505d795c2917@8eeca404-a47d-4555-a2d4-0f3619041c9c

Resumo: Discursar é parte intrínseca do trabalho dos parlamentares, onde eles expõem fatos, pontos de vista e opiniões sobre assuntos diversos. Este trabalho tem como objetivo analisar as relações entre parlamentares de acordo com os discursos proferidos por membros da Câmara dos Deputados do Brasil. O período considerado no presente estudo compreende o mandato entre 2011 e 2015. Para atingir esse objetivo, a metodologia proposta baseada em técnicas de Processamento de Linguagem Natural, Term Frequency–Inverse Document Frequency e Universal Sentence Encoder foi utilizada com intuito de avaliar as relações pareadas entre congressistas, as quais foram analisadas sob a ótica de Redes Complexas. Neste trabalho, para a representação do problema em estudo, foi construído um grafo completo em que cada nó representa um deputado, e os pesos associados às arestas que conectam estes nós representam as semelhanças entre os seus posicionamentos políticos, obtidos a partir de seus respectivos discursos. O agrupamento de nós foi utilizado para avaliar múltiplas medidas de distância baseadas nos discursos entre cada par de congressistas, bem como a coesão resultante de seus partidos políticos. Os resultados experimentais mostraram que uma das medidas propostas neste trabalho, que é baseada na agregação de semelhanças entre cada par de discursos, se mostrou superior a uma alternativa previamente estabelecida na literatura, a qual considera concatenações dos discursos relativos a cada indivíduo com o objetivo de agrupar os parlamentares organicamente.

 

Dissertação 

Defesa de dissertação (05/12/2023): Janio de Souza Lima

Discente: Janio de Souza Lima

Título: Uma Análise do Uso de Lotes Deslizantes na Detecção de Eventos em Séries Temporais em Streaming

Orientadores: Eduardo Ogasawara (orientador) e Rafaelli Coutinho (co-orientadora)

Banca: Eduardo Ogasawara (Cefet/RJ), Rafaelli Coutinho (Cefet/RJ), Eduardo Bezerra (Cefet/RJ), João Eduardo Ferreira (IME/USP)

Dia/hora: 05 de dezembro de 2023, às 14h

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3ab6903dd0475949a39ed4c32029e7b4d4%40thread.tacv2/1698066576348?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%220534c83a-4cef-4129-9f9f-e8b8c3d50019%22%7d

Resumo: Detecção de eventos em séries temporais se refere à identificação de pontos em uma série que se diferenciam do comportamento esperado. Em cenários de alta conectividade, onipresença da internet, presença de gêmeos digitais e tráfego de dados em nuvem observa-se o aumento da velocidade e do volume de geração dos dados de séries em streaming. Assim, a detecção de eventos em séries em streaming é fundamental para a tempestividade na tomada de decisões para correção e prevenção de situações indesejadas. Apesar de existir uma miríade de métodos, ainda há escassez de trabalhos que abordem diretamente ferramentas para integração e avaliação de métodos voltados para o streaming. Mesmo em trabalhos existentes, não se identifica formas de analisar o comportamento dos métodos ao longo do streaming. A especificidade dos métodos existentes para determinados comportamentos das séries, a necessidade de equilibro entre o custo do processamento online e acurácia permitem levantar a questão: o uso de lotes deslizantes, que consigam lidar com subsequências menores da série, na detecção de eventos em séries em streaming pode resultar em detecção precoce e redução do custo computacional do processamento? Outras questões relevantes são: Como é possível avaliar o tempo decorrido entre o momento em que uma observação na série é lida e sua detecção como evento? É possível avaliar o comportamento dos métodos ao longo do streaming? Como o comportamento dos métodos podem contribuir para identificar sua resiliência na série temporal em streaming? Para explorar as lacunas existentes na literatura, o presente trabalho propõe uma análise do uso de lotes deslizantes na detecção de eventos em séries temporais em streaming, avaliando seus impactos na detecção precoce de eventos. Além disso, o trabalho apresenta o framework Nexus para integração de métodos de detecção de eventos em streaming e métricas para avaliação de atraso na detecção e do comportamento dos métodos ao longo do streaming.

 

Dissertação 

Defesa de dissertação (02/10/2023): Leon Victor Medeiros de Lima

Discente: Leon Victor Medeiros de Lima

Título: Portfólio Diversificado com Múltiplas Restrições de Cardinalidade

Orientador: Pedro Henrique González Silva

Dia: 02 de outubro de 2023

Resumo: Os mercados financeiros e investimentos desempenham um papel crucial na economia. Além disso, os avanços na tecnologia e a disponibilidade de serviços abertos estão afetando a integração dos mercados financeiros e das instituições financeiras. Isso tem tornado os processos de tomada de decisão financeira ainda mais complexos, à medida que são aplicados métodos precisos para lidar com restrições específicas. O problema de seleção de portfólio (PSP) é um dos problemas mais importantes e relevantes no campo das finanças. O objetivo é escolher um conjunto de ativos que maximizem ou minimizem o retorno ou risco, respectivamente. Este trabalho apresenta uma nova formulação do problema de seleção de portfólio com um único objetivo e restrições de cardinalidade, visando minimizar o risco do portfólio considerando várias categorias de ativos. O objetivo é compor um portfólio multiativo com um número fixo de três categorias de ativos diversas (ações brasileiras, ações americanas e REITs) para minimizar o risco do portfólio, dado um retorno esperado. Além disso, este trabalho utiliza as Redes Neurais Recorrentes de arquitetura Long Short-Term Memory (LSTM) e os algoritmos de Regressão de Vetor de Suporte (SVR) para prever o retorno esperado dos ativos. Também apresenta modelos matemáticos para a realização do processo de composição da carteira, juntamente com experimentos computacionais que validam o proposto. Nossos resultados principais validaram o modelo proposto mostrando que é possível obter portfólios diversificados dado um nível de retorno, superando os índices de mercado.

Dissertação 

Defesa de dissertação (18/09/2023): Renato de Oliveira Rodrigues

Discente: Renato de Oliveira Rodrigues

Título: Uma abordagem para Simulação da Dispersão de Efeitos Sensoriais com Dinâmica de Fluidos Computacional

Orientadores: Joel André dos Santos Ferreira (orientador) e Diego Nunes Brandão (co-orientador)

Banca: Joel André dos Santos Ferreira (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ), Glauco Fiorott Amorim (Cefet/RJ), Celso Alberto Saibel Santos (PPGI – UFES)​​​​​​​,  Gheorghita Ghinea (Brunel University)​​​​​​​

Dia/hora: 18 de setembro de 2023, às 10h30.

Resumo: A inclusão de efeitos sensoriais em aplicações multimídia tem o potencial de aumentar a Qualidade da Experiência (QoE) e melhorar a imersão do usuário. No entanto, criar tais aplicações apresenta desafios decorrentes da necessidade de controlar a renderização de efeitos sensoriais no ambiente físico juntamente com a apresentação de efeitos sensoriais no ambiente virtual e a constante mudança de estado do efeito sensorial de acordo com a interação do usuário. Técnicas de dinâmica dos fluidos computacional podem ser usadas para simular os efeitos sensoriais em um ambiente virtual e usar os dados gerados para criar aplicações mais imersivas. Neste trabalho propomos uma abordagem usando o método SPH que permite renderizar uma variedade de efeitos sensoriais, como borrifo de água, vento, neblina, cheiro, etc., em uma aplicação interativa onde os usuários podem explorar os efeitos sensoriais em diferentes cenários em tempo real.

 

Dissertação 

Defesa de dissertação (15/09/2023): Renata Fonseca da Silva

Discente: Renata Fonseca da Silva

Título: O uso de Jogos Educacionais e Sistemas Tutores Inteligentes como ferramentas no combate às Fake News: Uma Revisão Sistemática de Literatura

Orientadores: Jorge de Abreu Soares e Ronaldo Ribeiro Goldschmidt

Banca: Jorge de Abreu Soares (Cefet/RJ), Ronaldo Ribeiro Goldschmidt (IME), Joel André Ferreira dos Santos (Cefet/RJ), Paulo Marcio Souza Freire (IME)

Dia/hora: 15 de setembro de 2023, às 9h.

Local:  Cefet/RJ – Unidade Maracanã, Bloco E, sala E-520

Resumo: As Fake News cresceram em volume e compartilhamento, de forma absurda nos últimos tempos. Este fato, deu-se pela evolução das mídias sociais e o acesso a internet. Todavia, o número de Fake News compartilhadas na internet sem uma análise crítica das informações, tem ocorrido sem precedentes. Ressalta-se que práticas de Alfabetização Midiática e Informacional, vêm senmdo adotadas no combate às Fake News. Nesse contexto, os Jogos Educacionais e Sistemas Tutores Inteligentes, têm obtido êxito para capacitar pessoas a reconhecerem esses tipos de notícias. O objetivo deste estudo é identificar e analisar os métodos e características descritos e implementados por projetos de Jogos Educacionais e Sistemas Tutores Inteligentes, ferramentas de Alfabetização Midiática e Informacional mais utilizadas durante o processo educativo para identificação de Fake News. Para isso, foi utilizada a metodologia de Revisão Sistemática de Literatura, onde foi possível observar, por exemplo, que cerca de 94\% das ferramentas desenvolvidas correspondiam a Jogos Educacionais e, apenas três estavam disponibilizadas em língua portuguesa. Concluiu-se também que, houve um decréscimo no número de estudos publicados que envolviam o uso dessas ferramentas no combate às Fake News.

 

Dissertação 

Defesa de dissertação (14/09/2023): Uriel Merola Minage e Silva

Discente: Uriel Merola Minage e Silva

Título: Métodos de detecção de fake news: Comparativo entre abordagens crowd signals e métodos de comitê

Orientadores: Jorge de Abreu Soares e Ronaldo Ribeiro Goldschmidt

Banca: Jorge de Abreu Soares (Cefet/RJ), Ronaldo Ribeiro Goldschmidt (IME), Eduardo Bezerra da Silva (Cefet/RJ), Paulo Marcio Souza Freire (IME)

Dia/hora: 14 de setembro de 2023, às 10h30.

Local:  Cefet/RJ – Unidade Maracanã, Bloco E, sala E-520

Resumo: O aumento significativo da disseminação de Fake News, deve-se à facilidade de criação e consumo de informações nas redes sociais. Várias abordagens baseadas em aprendizado de máquina (AM) foram propostas para detectar e combater esse tipo de informação maliciosa. Entre as principais abordagens para detectar fake news existe uma baseada em Hybrid Crowd Signals (HCS). Para identificar informações falsas, esta abordagem combina sinais (i.e opiniões sobre se a informação é falsa ou não) coletados tanto dos usuários de redes sociais quanto de classificadores de AM. Embora promissora, até onde pudemos observar, a HCS emprega um método ingênuo (Naive Bayes) para combinar os sinais e inferir quais notícias são falsas. Assim, o presente trabalho levanta a hipótese de que métodos ensemble aplicados para combinar as opiniões fornecidas pelos classificadores de AM usados na HCS e as opiniões implícitas dos usuários fornecidas nas redes sociais, podem resultar em modelos de classificação com melhor desempenho. Os experimentos conduzidos neste trabalho fornecem indícios da validade da hipótese levantada.

Dissertação 

Defesa de dissertação (13/09/2023): Jéssica da Silva Costa 

Discente: Jéssica da Silva Costa

Título: Métodos Baseados em Homologia e Aprendizado de Máquina para Identificação de Proteínas Essenciais

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (CEFET/RJ), Eduardo Bezerra (CEFET/RJ), Diogo Antonio Tschoeke (Coppe/UFRJ), Victor Ströele de Andrade Menezes (UFJF)

Dia/hora: 13 de setembro de 2023, às 8:00.

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3a8bd040fc5e004447b6a1fa09484d81d0%40thread.tacv2/1694208843103?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: 

O desenvolvimento de um fármaco costuma ser um processo complexo e demorado. Principalmente na fase inicial, a seleção de um alvo para desenvolvimento de fármacos pode demorar muitos anos. Genes e proteínas essenciais são entidades biológicas responsáveis por processos biológicos de sobrevivência e reprodução dos organismos. Genes e proteínas com relação de ancestralidade, em organismos de espécies diferentes, costumam conservar a função. Além disso, estudos indicam que genes essenciais tendem a ter maior expressão e codificam proteínas que se envolvem em mais interações proteína-proteína. Todas essas características tornam proteínas  essenciais potenciais alvos de fármacos. Muitos trabalhos na literatura propõem abordagens biológicas e computacionais para identificação de essencialidade. Diante disso, este trabalho apresenta dois workflows para identificação de características de essencialidade em proteínas para alvos de fármacos do organismo alvo S. mansoni. Para isso foram abordados um método baseado em homologia e outro método baseado em aprendizado
de máquina com os organismos modelos modelo S. cerevisiaeC. elegans e D. melanogaster. O método baseado em homologia identificou cerca de 11 proteínas candidatas a essenciais com o grupo de organismos modelo e o organismo S. mansoni. Entre os pares, a maior quantidade de candidatas foi com S. cerevisiae onde foram identificadas 726 proteínas candidatas a essenciais. Já o método baseado em aprendizado de máquina, experimentos realizados com três algoritmos baseados em árvore, com características baseadas em contexto (PPI) e baseadas em sequência, apontaram melhores valores de recall com o uso da técnica de Undersampling. Em termos quantitativos, cerca de 4000 proteínas foram preditas como essenciais nos algoritmos XGBoost e GradientBoosting e 3800 proteínas  para o algoritmo Random Forest. Cerca de 3300 proteínas  foram preditas como essenciais pelos três algoritmos trabalhados, o que demonstrou certa semelhança entre os resultados dos algoritmos.

 

Dissertação