Categoria:Notícias

Defesa de dissertação (30/12/2024): Alexandre Emílio Manhães Pardelinha

Discente: Alexandre Emílio Manhães Pardelinha

Título: Aplicação de Técnicas de Aprendizado de Máquina na Determinação de Estoque de Carbono no Solo

Orientadores: Diego Nunes Brandão e Laura Silva de Assis

Banca: Jorge de Abreu Soares e Marcos Bacis Ceddia

Dia/Hora: 30 de dezembro de 2024, às 14pm;

Resumo: Os solos representam o mais significativo estoque de carbono orgânico (SOCS) nos ecossistemas terrestres, sublinhando a importância crítica de estimar com acurácia o carbono orgânico do solo para garantir a preservação das funções do solo e a mitigação das alterações climáticas globais. Este estudo emprega uma metodologia baseada em dados para estimar os estoques de carbono em solos brasileiros, comparando técnicas de aprendizado de máquina com diversas estratégias de otimização de hiperparâmetros. Após a seleção de atributos pelos métodos de Correlação de Pearson e Wrapper, o conjunto de dados referente à Amazônia consistiu em 479 observações de SOCS e 5 covariáveis de solo. Os desempenhos do modelo foram avaliados usando um procedimento de validação cruzada de 5 vezes. Os melhores desempenhos foram obtidos usando o algoritmo Random Forest (RMSE=0,938 com a técnica de otimização Random Search e MAE=0,706 com a técnica de otimização Successive Halving). Quase todos os resultados dos desempenhos nas três técnicas de otimização de hiperparâmetros apresentaram maior acurácia do que os desempenhos sem utilizar a estratégia de otimização. Os resultados demonstram o papel fundamental da seleção e processamento de dados, juntamente com a otimização de hiperparâmetros, na resolução deste problema, resultando em melhorias notáveis nas análises do erro médio absoluto (MAE) e da raiz do erro quadrático médio (RMSE).}

Defesa de dissertação (30/12/2024): Lucas Daflon Scoralick

Discente: Lucas Daflon Scoralick

Título: Aprimoramento da Detecção de Conluios com Aprendizado de Máquina: Explicabilidade e Análise dos Resultados

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Flavia Cristina Bernardini (UFF)

Dia/hora: 30 de dezembro de 2024, às 10h.

Local: https://teams.microsoft.com/l/meetup-join/19%3afeb680f8d4e047d69e7cdb88a09be338%40thread.tacv2/1734221163372?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Conluios são acordos ou combinações secretas entre duas ou mais partes, geralmente para ganhar vantagem em algo ou prejudicar terceiros. A prática de conluios em licitações públicas perturba o equilíbrio de preços do mercado, impactando negativamente tanto os custos quanto a qualidade dos serviços públicos. Neste estudo, propõe-se uma metodologia para aprimorar os modelos de classificação de conluio, utilizando variáveis estatísticas combinadas com a análise de modelos explicáveis para explicação dos resultados. Os resultados mostraram uma melhora no desempenho de 0,04 à 0,25, utilizando a estratégia de balanceamento Smote, método de validação holdout 80% e 20% (treinamento e teste) e MCC como métrica de desempenho. A utilização dos modelos explicáveis SHAP, importância de atributos e LIME foram úteis para confirmar a contribuição das variáveis estatísticas para os modelos de aprendizagem de máquina. Além disso, a explicação de amostras com LIME demonstra potencial para explicação dos limites de decisão de classificação para atributos numéricos.

Dissertação

Defesa de dissertação (27/12/2024): Luiz Augusto de Souza Perciliano

Discente: Luiz Augusto de Souza Perciliano

Título: Detecção de Eventos Adversos em Mídia Social: uma revisão de literatura e experimentos utilizando o MetaMap para o Português do Brasil

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ), Jairo Francisco de Souza (UFJF)

Dia/hora: 27 de dezembro de 2024, às 10h.

Local: https://teams.microsoft.com/l/meetup-join/19%3a524f2c9ca84d45e79a0cab9dd1e61674%40thread.tacv2/1734221450946?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Nos últimos anos, a área da saúde tem experimentado transformações tecnológicas substanciais, refletidas na expansão de bases de dados biomédicas em virtude de fatores como o aumento populacional, o surgimento de novas doenças, medicamentos e terapias. Além disso, a adesão de países a organizações biomédicas internacionais tem favorecido a implementação de protocolos mais rigorosos e eficientes. No entanto, no contexto da farmacovigilância, ainda há desafios significativos, como a complexidade e a limitação de acesso às bases de dados oficiais mantidas pela Organização Mundial da Saúde (OMS), que recebem contribuições de mais de 140 países. Com o aumento da circulação global de pessoas e a crescente demanda por medicamentos e vacinas, também cresce o número de Reações Adversas a Medicamentos (RAM). Apesar dos avanços, as autoridades responsáveis pela segurança dos medicamentos enfrentam dificuldades para registrar todos os Eventos Adversos (EA) e Reações Adversas a Medicamentos (RAM) reportados, bem como para realizar buscas ativas que reduzam riscos para a população. A dificuldade em acessar e processar essas informações, somada à subnotificação de (EA)s e RAM, impulsiona a busca por novas fontes de dados. Devido às barreiras no acesso às bases de dados oficiais, as mídias sociais têm se mostrado uma alternativa relevante para pesquisas em saúde. Essas plataformas oferecem informações valiosas para auxiliar na tomada de decisões, que podem incluir notificações a fabricantes para ajustar bulas, recolhimento de lotes ou até mesmo suspensão de medicamentos. Diante deste cenário, este trabalho tem como objetivos: i) apresentar uma revisão bibliográfica sobre o tema; ii) explorar o uso de mídias sociais, especificamente o Twitter (atual X), para a detecção de eventos adversos no contexto brasileiro; e iii) executar um experimento utilizando a ferramenta biomédica Metamap, em conjunto com a base de dados Unified Medical Language System (UMLS) adaptada para o português do Brasil. A pesquisa visa mapear termos e conceitos médicos presentes em tuítes, buscando identificar Sinais de Farmacovigilância (SF) e contribuir para a área de segurança de medicamentos no país. O trabalho obteve sucesso na criação de um modelo (UMLS) em português do Brasil, um passo fundamental para a análise de dados em português na área de saúde. Foram coletados e analisados milhares de tuítes sobre medicamentos para enxaqueca e sintomas de dengue. Por meio da ferramenta Metamap, foi possível mapear os termos médicos presentes nos tuítes para conceitos da (UMLS), evidenciado a viabilidade do uso da ferramenta para a detecção de sinais de farmacovigilância em português. Os resultados obtidos fornecem insights sobre o uso de medicamentos e a percepção da população sobre eles. O modelo (UMLS) em português e a metodologia desenvolvida neste trabalho abrem caminho para futuras pesquisas e aplicações de farmacovigilância com base em mídias sociais no Brasil.

Dissertação

Defesa de dissertação (19/12/2024): Roberto da Silva Gervasio Pontes

Discente: Roberto da Silva Gervasio Pontes

Título: Otimização Multiobjetivo para Problemas de Planejamento de Rotação de Culturas Agrícolas

Orientadores: Laura Assis (orientadora) e Diego Brandão (co-orientador)

Banca: Laura Assis (Cefet/RJ), Diego Brandão (Cefet/RJ), Felipe Henriques (Cefet/RJ), Fábio Usberti (UNICAMP)

Dia/hora: 19 de dezembro de 2024, às 9:30h.

Local: https://teams.microsoft.com/l/meetup-join/19%3aWfXqePNzHUyNHsKx_j1mGEKCA8uCBTA5fBbU9lGpm781%40thread.tacv2/1733775489034?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2291e505cb-28d8-40f6-a547-adfd127dabca%22%7d

Resumo: A agricultura é considerada um pilar essencial da economia mundial e está no centro da sociedade contemporânea.  Nas últimas décadas, para enfrentar a crise de abastecimento de alimentos e garantir a segurança alimentar, o setor se consolidou e mudou radicalmente a relação homem-ambiente. No entanto, ainda existe uma grande preocupação com a segurança alimentar, dado o crescimento populacional esperado em mais de 9,5 bilhões para 2050. Neste contexto, a introdução da informatização nas cadeias de suprimento agroalimentar tem sido cada vez mais significativa. A agricultura moderna torna-se cada vez mais interdisciplinar buscando um potencial aumento da produtividade deste setor e a promoção de práticas mais sustentáveis. A agricultura de precisão é uma destas práticas que tem como uma das suas ferramentas o Planejamento de Culturas e o Planejamento de Rotação de Culturas que têm grande impacto no meio ambiente e na produtividade. A otimização destes problemas pode permitir ao setor responder às mudanças climáticas, oferecer alimentos saudáveis e seguros e produzir alimentos eficientes em termos de custo. Nesta esteira o presente trabalho apresenta modelos utilizando PL para o PPCM e PPRCM com objetivos de maximizar a renda líquida, maximizar a diversidade de culturas, e maximizar a área utilizada. Os alcançados foram comparados aos modelos com o mesmo conjunto de dados presentes da literatura cujo único objetivo era maximizar a renda líquida. Verificou-se que os modelos propostos apresentam aumento de, em média, 60% na diversidade de culturas plantadas com perdas de retorno líquido inferiores a 5%. A avaliação dos cenários utilizando as metodologias de Soma Ponderada e ε-restrito foi eficaz na exploração da fronteira de soluções ótimas. Embora o Método do ε-restrito apresente maior custo computacional, ele se destaca por sua maior capacidade de discriminar os trade-offs entre os objetivos.

Dissertação

Defesa de dissertação (19/12/2024): Tarsila Gomes Bello Tavares

Discente: Tarsila Gomes Bello Tavares

Título: Imputação em cascata no contexto de Inteligência Artificial Centrada em Dados (DCAI).

Orientador: Jorge de Abreu Soares

Banca: Jorge de Abreu Soares (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ), Carlos Eduardo Ribeiro de Mello (Unirio)

Dia/hora: 19 de dezembro de 2024, às 14h.

Local: Bloco E, 5º andar, sala E-518

Resumo: À medida que o volume global de dados aumenta, é comum encontrar bases de dados com valores ausentes, o que requer a aplicação de técnicas de imputação. Tradicionalmente, estas técnicas abordam cenários univariados, tratando a ausência de valores em uma única coluna. Este estudo propõe uma abordagem de imputação em cascata, que é capaz de tratar valores ausentes em múltiplas colunas, reintegrando valores imputados na base de dados antes da imputação do atributo subsequente, permitindo sua reutilização. Adicionalmente, investigou-se a eventual melhoria da eficiência da imputação pela binarização dos dados, segundo padrões de similaridade de ausência antes da imputação, e quais algoritmos de agrupamento apresentam resultados mais interessantes para diferentes características de bases de dados. Portanto, almeja-se avaliar e comparar o desempenho de uma imputação multivariada que utiliza a abordagem em cascata com uma pré-fase de agrupamento, aplicando diferentes classes de algoritmos dessa natureza, tais como K-modes, Agglomerative Clustering, DBSCAN e a rede neural SOM.

Dissertação

Defesa de dissertação (11/12/2024): Fabio da Silva Gregório

Discente: Fabio da Silva Gregório

Título: LexRank guiado para recuperação avançada em análise jurídica

Orientador: Eduardo Bezerra da Silva

Banca: Eduardo Bezerra da Silva (Cefet/RJ – PPCIC), Altigran Soares da Silva (IComp / UFAM), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Gustavo Paiva Guedes e Silva (PPCIC / CEFET-RJ).

Data: 11 de dezembro de 2024, às 16h

Link da sala do MS Teams: https://teams.microsoft.com/v2/?meetingjoin=true#/l/meetup-join/19:OnS4EZKGpsKeGa50vaGxvZZ604acCFsazTfC-LTdwYE1@thread.tacv2/1730395539949?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d&anon=true&deeplinkId=830cfb45-96fe-4604-9c5d-13b1ffa801ee

Resumo: A Constituição Brasileira prevê mecanismos para que cidadãos peticionem ao Judiciário, incluindo o chamado recurso especial. Esse tipo específico de recurso visa uniformizar a interpretação jurídica da legislação brasileira. O tratamento de recursos especiais é uma das tarefas diárias no Judiciário, regularmente apresentando demandas significativas em seus tribunais. Propomos um método, baseado em aprendizado de máquina não supervisionado, para auxiliar o analista jurídico a classificar um recurso especial em um tema de uma lista disponibilizada pelo Superior Tribunal de Justiça (STJ). Como parte desse método, propomos uma modificação do algoritmo LexRank baseado em grafos, que chamamos de Guided LexRank. Esse algoritmo gera o resumo de um recurso especial. O grau de similaridade entre o resumo gerado e diferentes temas é avaliado usando o algoritmo BM25. Como resultado, o método apresenta um ranking de temas mais adequados ao recurso especial analisado. O método proposto não requer rotulagem prévia do texto a ser avaliado e elimina a necessidade de grandes volumes de dados para treinar um modelo, como normalmente ocorre em modelos supervisionados. Avaliamos a eficácia do método aplicando-o a um corpus de recurso especial previamente classificado por especialistas humanos.

Dissertação

Defesa de dissertação (10/12/2024): Jéssica Barbosa de Souza Costa

Discente: Jéssica Barbosa de Souza Costa

Título: Um Novo Método Híbrido de Detecção de Anomalias Baseado em EMD e ARIMA

Orientadores: Eduardo Ogasawara (Orientador) e Ronaldo Alves (Co-orientador)

Banca: Eduardo Ogasawara (Cefet-RJ / PPCIC), Ronaldo Alves (Fiocruz), Kele Belloze (Cefet-RJ / PPCIC), Fabio Porto (LNCC), Cristiano Boccolini (Fiocruz)

Data: 10 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3apSO9WbZ1YPXvTg8M8nxnUCqUHTtoL1r-dXbVdbYffHo1%40thread.tacv2/1729787552506?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%220534c83a-4cef-4129-9f9f-e8b8c3d50019%22%7d

Resumo: Anomalias são definidas como desvios comportamentais em relação a padrões esperados e identificá-las é um desafio importante. A detecção de anomalias é uma atividade fundamental na análise de séries temporais. Ela permite a tomada de decisões baseada em dados em muitas atividades de controle e monitoramento, como cuidados de saúde, qualidade da água, análise de reflexão sísmica e exploração de petróleo. Existem muitos métodos de detecção de anomalias, mas escolher os métodos apropriados é complexo devido à natureza intrínseca das séries temporais. Há uma demanda por métodos de detecção de anomalias que sejam robustos, minimizem falsos positivos e adaptáveis a cenários não estacionários. Este trabalho introduz a Decomposição de Modo Empírico Refinada (REMD, do inglês Refined Empirical Mode Decomposition) como uma abordagem híbrida para atender a essa necessidade, integrando os modelos de Decomposição de Modo Empírico (EMD, do inglês Empirical Mode Decomposition) e Autoregressão Integrada de Médias Móveis (ARIMA, do inglês Autoregressive Integrated Moving Average). A concepção do REMD visa otimizar os pontos fortes de ambos os métodos e superar suas limitações. Ele é avaliado em comparação com métodos de ponta em diversos conjuntos de dados. O REMD demonstra desempenho superior, com pontuação até três vezes melhor no F1.

Dissertação

Defesa de dissertação (09/12/2024): Mateus do Amor Devino Pereira

Discente: Mateus do Amor Devino Pereira

Título: Uma Comparação de Workflows para Análise de dados de scRNA-seq para Identificação de Genes Diferencialmente Expressos em Câncer de Mama

Orientadores: Eduardo Bezerra da Silva (orientador) e Kele Teixeira Belloze (co-orientadora)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Pedro Henrique González Silva (PPCIC / UFRJ), Fabrício Alves Barbosa da Silva (FIOCRUZ)

Data: 09 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aCa_etTt2B_WMpjpSaAVT301MmiLnMg4N81AYVe__dMA1%40thread.tacv2/1731407636571?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Nos últimos anos, pesquisas com dados multiômicos desempenhou um papel importante no entendimento da biologia celular. Em particular, a análise de dados de sequenciamento de RNA de células únicas contribuiu para a descoberta de medicamentos e na identificação de biomarcadores de doenças complexas, como o câncer. No entanto, quando se trata de analisar dados de scRNA-seq, várias etapas do processamento podem ser feitas de maneiras diferentes. Este estudo fornece uma comparação de diferentes combinações de técnicas em um workflow de scRNA-seq, evidenciando como cada uma dessas etapas impacta os resultados. Realizamos experimentos em três conjuntos de dados transcriptômicos de diferentes magnitudes de número de amostras. Nossos experimentos consistem em aplicar um conjunto de técnicas de pré-processamento e agrupamento a dados de scRNA-seq de câncer de mama. Também realizamos um estudo de ablação para entender como cada técnica influenciou os resultados do experimento.

Dissertação

Defesa de dissertação (02/12/2024): Leandro de Mattos Bento Soares

Discente: Leandro de Mattos Bento Soares

Título: Detecção de quedas de soldados combatentes por meio de redes neurais artificiais

Orientadores: Eduardo Bezerra da Silva (orientador) e Diego Nunes Brandão (co-orientador)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Diego Nunes Brandão (PPCIC / CEFET-RJ), Pedro Henrique González (PPCIC / CEFET-RJ), Pablo Rangel (IPqM), Cláudio Miceli de Farias (PESC / UFRJ)

Data: 02 de dezembro de 2024, às 9h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aerNEcB95_5BX8BvwWi0MfdotZi1WhNCtKjL_mHyNdHg1%40thread.tacv2/1730395201113?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Durante operações militares envolvendo soldados combatentes, estes enfrentam uma série de desafios físicos devido à natureza das atividades, incluindo lesões que podem resultar em choque hemorrágico hipovolêmico e, em casos extremos, levar ao óbito. Assim, é fundamental que os centros de controle dessas operações sejam rapidamente informados sobre a condição dos combatentes, permitindo a agilização do resgate e a preservação de suas vidas. Nesse contexto, a Marinha do Brasil desenvolveu o projeto “Combatente do Futuro”, que tem como objetivo criar modelos capazes de detectar situações que demandem socorro imediato ao combatente, bem como outras ocorrências relevantes, como conflitos ou situações de risco, que possam ser identificadas automaticamente a partir das variações inerciais dos combatentes. Para a coleta dessas variáveis inerciais, foram escolhidos dispositivos específicos: um modelo de smartwatch, posicionado nos pulsos direito e esquerdo, e um modelo de smartphone, posicionado no peito do soldado. Dentro desse projeto, destaca-se a investigação de métodos para detecção de quedas de soldados, dividida em duas etapas principais. A primeira etapa consiste na implementação de um modelo de rede neural para detectar padrões de queda, enquadrando o problema como uma tarefa de classificação. Já a segunda etapa busca propor um classificador binário, com o objetivo de diferenciar quedas operacionais de quedas causadas por ferimentos. Esta dissertação concentra-se na detecção de quedas, pertencente à primeira etapa. Para a realização desta pesquisa, foram coletados dados de atividades de vida diária, atividades de quedas e atividades militares com porte e sem porte de arma de 15 militares da Marinha do Brasil, simulando as entradas para o modelo de rede neural a ser implementado e testado em situações de campo. A partir desse conjunto de dados, foram estabelecidos 12 cenários experimentais para cada posição dos sensores, explorados nos domínios do tempo e da frequência, com o objetivo de identificar o conjunto de variáveis inerciais, a posição dos sensores e o domínio que apresentassem o melhor desempenho na classificação de eventos de queda. O conjunto de configurações escolhido foi implementado na arquitetura de rede neural CNN1D, cujos hiperparâmetros foram ajustados por meio de otimização bayesiana.

Dissertação

Defesa de dissertação (14/11/2024): Augusto José Moreira da Fonseca

Discente: Augusto José Moreira da Fonseca

Título: Interpolação de Precipitação por Redes Neurais Convolucionais para Grafos

Orientadores: Eduardo Bezerra da Silva (orientador) e Fabio Andre Machado Porto (coorientador)

Banca: Eduardo Bezerra da Silva (Cefet/RJ – PPCIC), Fabio Andre Machado Porto (LNCC), Eduardo Soares Ogasawara (Cefet/RJ – PPCIC), Mariza Ferro (UFF), Leonardo Silva de Lima (UFPR)

Data: 14 de novembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3ArAguK974ED0IdDp27h1nAIKVWH01aj88d1JUGZ5NLhc1%40thread.tacv2/1723817716556?context=%7B%22Tid%22%3A%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2C%22Oid%22%3A%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7D

Resumo: O monitoramento e a previsão das condições climáticas atmosféricas têm implicações significativas em diversos campos, como agricultura, transporte e segurança pública. Previsões eficazes das condições climáticas podem ajudar a mitigar e prevenir os impactos adversos de eventos climáticos severos, incluindo a perda de vidas humanas. Com os avanços tecnológicos, existem vários instrumentos disponíveis para observação atmosférica, como satélites, radares e estações de superfície. Esses instrumentos fornecem observações em tempo real e, em alguns casos com alta resolução espacial e temporal, tornado-se insumo ideal para o treinamento de modelos de previsão do tempo baseados em Aprendizado de Máquina (AM). Por outro lado, um desafio acerca dos dados meteorológicos é a disponibilidade e distribuição espacial das estações de superfície. Por conta de sua distribuição desigual, certas áreas acabam com monitoramento insuficiente. Métodos de interpolação são comumente usados para inferir valores de precipitação para áreas não cobertas. No entanto, esses métodos frequentemente negligenciam o contexto e a física da atmosfera, resultando em discrepâncias entre os dados interpolados e os observados. Além disso, esses métodos não levam em consideração o espaço e o tempo simultaneamente. Este estudo tem como objetivo implementar uma Rede Convolucional Espaço-Temporal de Grafos (STGCN, na sigla em inglês) para interpolar dados de precipitação, que é uma variável significativamente desbalanceada. A STGCN é adaptada para realizar a interpolação da precipitação, aprendendo os padrões e a física da atmosfera em séries temporais multivariadas de múltiplos instrumentos meteorológicos. O objetivo é melhorar a precisão da interpolação, especialmente em áreas com cobertura limitada de estações de superfície. Comparamos os resultados alcançados pela STGCN com os de um método tradicional de interpolação, o Inverse Distance Weighting (IDW). Os resultados alcançados apontam que, comparado ao IDW, a STGCN é capaz de obter melhor acurácia em eventos mais extremos de precipitação e alcançam resultados promissores em eventos de menor magnitude. Em alguns casos, nosso modelo chegou a alcançar uma acurácia para eventos mais extremos entre 40% e 80% maior que o método IDW. No entanto, identificamos que o desbalanceamento dos dados de precipitação e a relativa baixa quantidade de exemplos de eventos extremos podem prejudicar a acurácia da STGCN em alguns cenários. Nosso método se mostra promissor e abre caminho para futuras pesquisas.

Dissertação 

Defesa de dissertação (23/10/2024): Lucas Ferreira Pinheiro

Discente: Lucas Ferreira Pinheiro

Título: Programação Linear Inteira Aplicada a Otimização Multiobjetivo da Topologia de Redes de Sensores Sem Fio Heterogêneas

Orientadores: Felipe da Rocha Henriques (Orientador) e Laura Silva de Assis (Co-orientadora)

Banca: Felipe da Rocha Henriques (PPCIC), Laura SIlva de Assis (PPCIC), Pedro Henrique González Silva (Cefet/RJ, UFRJ), Fábio Luiz Usberti (Unicamp)

Data: 23 de outubro de 2024, às 8h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aNtfud0ospBiDiIADR3hlcoSvSU9aQhJvx0nyYOrTQ3w1%40thread.tacv2/1728505028194?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22fae0cef4-35a7-472b-a664-720c350c49cc%22%7d

Resumo: Redes de Sensores Sem Fio (RSSF) possuem grande potencial para aplicações nas mais diversas áreas, tais como indústria, segurança, saúde pública e agricultura. Em geral, o desempenho ótimo de uma RSSF depende do dimensionamento correto de parâmetros fundamentais, tais como área de cobertura, conectividade e consumo de energia. Neste trabalho, é proposto um modelo de Programação Linear Inteira (PLI) multiobjetivo para resolver o Problema de Alocação de Sensores (PAS), considerando uma RSSF heterogênea com posições candidatas à alocação de nós sensores predefinidas em uma região de interesse. O objetivo do modelo proposto é minimizar o consumo energético, ao passo que busca-se maximizar a cobertura da rede na região de monitoramento. A validação do modelo foi realizada através de 225 experimentos computacionais com instâncias de pequena e média escala, utilizando linguagem Python e o solver Gurobi. Apesar da alta complexidade combinatória inerente ao PAS, o modelo proposto apresenta resultados factíveis e se mostra útil para auxiliar projetos de aplicações reais de RSSF. Os resultados obtidos servem como referência e podem ser utilizados para fins comparativos em desdobramentos deste estudo.

Dissertação 

Defesa de dissertação (19/09/2024): Danielle Rodrigues Pinna

Discente: Danielle Rodrigues Pinna

Título: Identificação de Falhas em Turbinas Eólicas: Uma Abordagem de Aprendizado de Máquina Centrada em Dados

Orientadores: Diego Nunes Brandão e Rodrigo Franco Toso

Banca: Diego Nunes Brandão (PPCIC),  Rodrigo Franco Toso (Microsoft), Rafaelli de Carvalho Coutinho (CEFET/RJ), Gustavo Silva Semaan (UFF), Ângela Ferreira (IPB/Portugal)

Dia/hora: 19 de setembro de 2024, às 11h.

Local: https://www.google.com/url?q=https%3A%2F%2Fteams.microsoft.com%2Fl%2Fmeetup-join%2F19%253a-qUeEmHzEwuC1rP6u6u-jU8-7KbVGBqlNGxLrMSku4Q1%2540thread.tacv2%2F1724725037596%3Fcontext%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%2522b1b7c333-2713-4523-9eae-7d94d8adcbe5%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw3gZemiUGozr78s2dtlO9V0

Resumo: Os últimos anos têm sido marcados pela transição da matriz energética mundial, predominantemente com as fontes eólica e solar, que são consideradas energias limpas. As turbinas eólicas, responsáveis pelo processo de conversão energética, se constituem por equipamentos complexos e de alto custo, suscetíveis a diversas falhas devido a múltiplos fatores operacionais e ambientais. O monitoramento contínuo dos componentes das turbinas é essencial para a detecção precoce de falhas, o que pode reduzir significativamente os custos de manutenção e aumentar a eficiência operacional. Este trabalho foca na aplicação e comparação de técnicas de aprendizado de máquina para a detecção de falhas em turbinas eólicas, utilizando uma abordagem centrada em dados. A pesquisa enfatiza a importância do pré-processamento dos dados, destacando técnicas de balanceamento de classes, particionamento de dados e seleção de atributos. Além disso, são comparados diferentes algoritmos de aprendizado de máquina, com foco na otimização de hiperparâmetros. Os resultados demonstram que um pré-processamento adequado dos dados é crucial para o desempenho dos modelos de aprendizado de máquina. Também é evidenciada a importância do tempo computacional na otimização dos hiperparâmetros e na seleção do algoritmo mais apropriado para o contexto específico do problema.

 

Dissertação 

Professores e alunos do PPCIC participam do CSBC

O artigo “Representatividade feminina na Olimpíada Brasileira de Informática: uma década de análise da modalidade Programação Nível 2”, de Anna Paula Silva, Maria Laura Soares, Larissa Ramos e do professor Gustavo Guedes do Programa de Pós-graduação em Ciência da Computação (PPCIC) do Cefet/RJ, foi premiado como o melhor trabalho na categoria Artigo Curto no 44º Congresso da Sociedade Brasileira de Computação (CSBC 2024). As alunas Anna Paula Silva e Maria Laura Soares são ex-alunas do curso técnico em Informática do Cefet/RJ, enquanto Larissa Ramos é estudante de graduação em Ciência da Computação na instituição.

A apresentação ocorreu no 18º Workshop Women in Information Technology (WIT) e 14º Fórum Meninas Digitais (FMD), realizado de 23 a 25 de julho em Brasília. O trabalho premiado fez uma análise comparativa e quantitativa da participação feminina na modalidade Programação Nível 2 da Olimpíada Brasileira de Informática (OBI), visando entender a representatividade das mulheres em um contexto de sub-representação e desigualdade de gênero na área de Tecnologia. A premiação destaca a importância do tema e a seletividade do evento, que aceitou apenas 63% dos trabalhos submetidos.

Durante o evento, a aluna Jullie Belmonte do PPCIC também apresentou o trabalho “Promoção de espaços voltados ao incentivo e formação de meninas e mulheres na área tecnológica: Um relato de experiência das alunas atuantes” em coautoria com os professores do PPCIC, Diego Brandão e Rafaelli Coutinho.

Os professores Diego Brandão e Gustavo Guedes, da Escola de Informática e Computação (EIC) do Cefet/RJ, também apresentaram artigos no CSBC 2024, abordando temas de impacto social, como a representatividade de gênero na computação e o monitoramento automatizado da umidade do solo.

Defesa de dissertação (21/08/2024): Luis Carlos Ramos Alvarenga

Discente: Luis Carlos Ramos Alvarenga

Título: Dimensionamento de recursos para execução de workflows científicos em ambientes de computação de alto desempenho

Orientadores: Rafaelli de Carvalho Coutinho e Daniel Cardoso de Moraes de Oliveira

Banca: Rafaelli de Carvalho Coutinho (PPCIC), Daniel Cardoso de Moraes de Oliveira (UFF), Marta Lima de Queirós Mattoso (UFRJ), Pedro Henrique González Silva (PPCIC), Yuri Abitbol de Menezes Frota (UFF)

Dia/hora: 21 de agosto de 2024, às 9h.

Local: https://teams.microsoft.com/l/meetup-join/19%253aafLsm4pQ8LA4BQvp0ARudoFA5U9d26I1HIyxCW0qO5w1%2540thread.tacv2/1721171058293?context%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%252254af42a0-5f30-4905-ac8d-10b96c6db26b%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw0kLstrc7AyYeq7jI–b_7E

Sala alternativa: https://meet.google.com/czq-gxkv-jdd?authuser=0

Resumo: Cientistas cada vez mais necessitam executar experimentos altamente exigentes em termos computacionais. Estes experimentos são frequentemente modelados como workflows científicos e são executados em ambientes de computação de alto desempenho (HPC). Tipicamente estes ambien tes fornecem uma grande variedade de recursos aos usuários. O dimensionamento adequado dos recursos para a execução de workflows científicos nestes ambientes é uma tarefa crucial. Um ambiente sub ou superdimensionado pode afetar diretamente o desempenho do experimento, gerando impactos negativos relacionados ao tempo e ao custo financeiro da execução. Com isso, pesquisas envolvendo estimação de recursos para execução de experimentos em ambientes de HPC vem sendo realizadas, como a heurística GraspCC, que usa o procedimento de busca adaptativa randomizada gulosa (GRASP). O objetivo deste trabalho é investigar a execução de workflows científicos em ambientes de alto desempenho, tais como clusters e nuvens de computadores, com o intuito de estimar eficientemente os recursos necessários considerando o tempo e os custos financeiros associados. O problema foi definido a partir da proposta de estruturação do workflow em estágios ou níveis paralelos de tarefas semelhantes entre si e que operam de maneira independente, chamada Layered-Bucket (LB). Para resolver o problema, foram propostas uma formulação de programação matemática inteira e uma adaptação da heurística GraspCC para considerar a abordagem LB, chamada GraspCC-LB. A abordagem proposta foi avaliada utilizando traces reais de workflows das áreas de bioinformática e astronomia. As estimativas de recursos produzidas pela GraspCC-LB foram comparadas com o uso real de recursos em um ambiente HPC do mundo real para avaliar sua eficácia. Os resultados mostram a eficácia do GraspCC-LB como uma abordagem robusta para otimização de recursos no contexto de workflows científicos de grande escala que requerem capacidades HPC, apresentando-se como uma importante ferramenta de apoio à tomada de decisões.

 

Dissertação 

Defesa de dissertação (27/06/2024): Érica Carneiro Queiroz da Silva

Discente: Érica Carneiro Queiroz da Silva

Título: Abordagens Baseadas em Ontologias para Análise de Sentimentos em Português do Brasil

Orientadores: Kele Teixeira Belloze (orientadora) e Gustavo Paiva Guedes e Silva (co-orientador)

Banca:  Kele Teixeira Belloze (Cefet/RJ), Gustavo Paiva Guedes e Silva (Cefet/RJ), Eduardo Bezerra da Silva (Cefet/RJ) e Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora: 27 de junho de 2024, às 13h

Local: https://teams.microsoft.com/l/meetup-join/19%3aa81e7d39098f4209a8d14dcaebac0e60%40thread.tacv2/1717788256837?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Com os avanços do Aprendizado de Máquina (AM), muitas soluções estatísticas foram desenvolvidas para resolver problemas de Análise de Sentimentos (AS) e Processamento de Linguagem Natural (PLN). No entanto, até o momento, nenhum processo de classificação estatística seria capaz de resolver relações semânticas e linguísticas da mesma forma que o cérebro humano. De acordo com a literatura, somente ferramentas extremamente robustas seriam capazes de gerar correlações entre os sentidos das palavras, trazendo o real significado simbólico aos textos. Ontologias são capazes de representar estruturas semânticas de modo a correlacionar conceitos em um domínio específico, assim como seres humanos associam palavras e recebem mensagens de acordo com sua realidade cultural, histórica e social. Apesar de recorrentes na área de Ciência da Computação, ontologias são raramente aplicadas à AS, com exceção de alguns exemplos na língua inglesa, cujos estudos apresentaram resultados promissores ao classificar sentimentos. O Brasil, atualmente não possui nenhum framework robusto que execute tarefas de AS com aspectos de abordagem ontológica ou base de conhecimento e poucas são as pesquisas utilizando a metodologia na língua portuguesa. Este trabalho apresenta uma comparação de métodos entre abordagens léxicas e bases de conhecimento com aspectos ontológicos, além de um novo corpus paralelo em português – inglês. Para tanto, efetuou-se, inicialmente, uma revisão de métodos com abordagens ontológicas aplicadas à AS com o objetivo primário de levantar discussões sobre possíveis estratégias de expansão para o campo de AS no Brasil. Espera-se, assim, despertar novas reflexões e um olhar mais profundo sobre humanidades digitais e suas abordagens híbridas, incluindo ontologias, no cenário luso-brasileiro.

Dissertação 

Defesa de dissertação (23/05/2024): Jorge Eugenio Medeiros Anselmo

Discente: Jorge Eugenio Medeiros Anselmo

Título: Plataforma para Mapeamento de Áreas de Risco para Veículos Automotores baseada e Aprendizado de Máquina associada a Geolocalização

Orientador: João Quadros

Dia: 23 de maio de 2024

Resumo: Diante do ambiente de incertezas financeiras e redução nas oportunidades de trabalho, agravados ainda mais pela pandemia de covid 19, ocorrem, como uma das consequências o aumento no índice de criminalidades, em especial, roubos e furto de veículos. Dentro desse contexto, podem aparecer questões, tais como: Quais os modos para prevenir ou ajudar a recuperarem veículos furtados, ou roubados? Este estudo visa apresentar embasamento teórico e prático para uma proposta de uma solução IOT , que possibilitará aos usuários bloquearem seus veículos, sinalizando um roubo/ furto, de modo que esses dados coletados sejam utilizados para um mapeamento, através de uma solução baseada em aprendizado de máquina, apresentando quais lugares são mais propensos a essas ocorrências de furtos ou roubos, permitindo criar alertas aos demais motoristas , podendo ainda, essa plataforma, ter sua base obtida compartilhada com demais setores da sociedade, como polícia, seguradoras entre outros.

Dissertação 

Defesa de dissertação (30/04/2024): Thiago Barral Fernandes Reis

Discente: Thiago Barral Fernandes Reis

Título: Detecção de Distúrbios do Sono em Dados de Polissonografia Através de Aprendizado de Máquina

Orientadores: Felipe da Rocha Henriques (orientador) e Michel Pompeu Tcheou (co-orientador)

Banca: Felipe da Rocha Henriques (Presidente), Michel Pompeu Tcheou (UERJ), Laura Silva de Assis (Cefet/RJ) e Tadeu Nagashima Ferreira (UFF)

Dia/hora: 30 de abril de 2024, às 15h

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3acM8gB1egyod9il6Gi3k6jMW0Kvs94-hEjUtZ_HeuOPU1%40thread.tacv2/1713785050693?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22fae0cef4-35a7-472b-a664-720c350c49cc%22%7d

Resumo: Um sono de boa qualidade, ou seja, sem interrupções e com períodos de tempo adequados para cada etapa, é imprescindível para a restauração apropriada das funções biológicas, neurológicas e psicológicas. Um indivíduo que se encontra em privação do sono pode apresentar comprometimento à saúde. A doença mais recorrente relacionada ao distúrbio do sono é a apneia do sono, a qual afeta a qualidade do sono, acordando o paciente do sono mais profundo e restaurador. Até hoje, o principal exame para diagnóstico de distúrbios do sono é conhecido como polissonografia, que é tradicionalmente realizado ao se passar uma noite de sono sob monitoramento em uma clínica especializada, e sua realização é muito complexa. Entretanto, a evolução da área de Internet das Coisas possibilitou a captação, através de dispositivos vestíveis, de vários dados que também são monitorados no exame tradicional de polissonografia. Desta forma, de uma maneira geral, este trabalho investiga a interseção entre a Ciência da Computação e a área da saúde. Mais especificamente, pretende-se avaliar a aplicação de algoritmos de aprendizado de máquina para a detecção de distúrbios do sono, de sorte a possibilitar um diagnóstico mais rápido do paciente. Como procedimento metodológico, quatro algoritmos de aprendizado de máquina foram avaliados em dados provenientes de uma base de dados reais de polissonografia (advindos de treze sinais). Além disso, também investigou-se o impacto da redução do número de sinais no desempenho dos algoritmos, cujo objetivo é facilitar a criação de um teste inicial (com menos sinais, por exemplo, utilizando-se dispositivos vestíveis) para complementar o exame de polissonografia. Os resultados indicaram que o algoritmo Random Forest foi o mais promissor, com desempenho satisfatório inclusive quando um menor número de sinais é considerado.

 

Dissertação 

Aula inaugural 2024 do Programa de Pós-graduação em Ciência da Computação

O Programa de Pós-graduação em Ciência da Computação (PPCIC) do Cefet/RJ realizará a aula inaugural para os discentes, cujo título é “Research in 7 paradoxes”, no dia 28 de março de 2024, às 16h.

A aula acontecerá no Auditório V, Bloco E – 5º andar,  campus Maracanã e será ministrada pelo pesquisador e professor convidado George Ghinea da Brunel University.

Na aula inaugural o Prof. Ghinea irá refletir sobre a sua carreira como pesquisador, sobre as oportunidades que a pesquisa oferece, bem como sobre as conclusões por vezes paradoxais mas maravilhosas a que conduz.

Para mais informações sobre a aula e como se inscrever, acesse: https://eic-seminarios.com/seic/research-in-7-paradoxes

Sobre a palestrante

Dr. Gheorghita (George) Ghinea is a Professor in Mulsemedia Computing in the Department of Computer Science, at Brunel University. Dr. Ghinea’s research activities lie at the confluence of Computer Science, Media and Psychology. In particular, his work focuses on the area of perceptual multimedia quality and how one builds end-to-end communication systems incorporating user perceptual requirements. To this end, recognising the infotainment duality of multimedia, Dr. Ghinea proposed the Quality of Perception metric as a more complete characterisation of the human side of the multimedia perceptual experience. Dr. Ghinea has applied his expertise in areas such as eye-tracking, telemedicine, multi-modal interaction, and ubiquitous and mobile computing, leading a team of 8 researchers in these areas. He has over 350 publications in his research field and was the lead Brunel investigator of a H2020 project NEWTON (http://www.newtonproject.eu/) applying mulsemedia to STEM learning across Europe.

Defesa de dissertação (07/03/2024): Andre Carlos Teixeira Vasconcellos

Discente: Andre Carlos Teixeira Vasconcellos

Título: Dispositivo IoT para atuar contra o desperdício de alimentos

Orientador: João Quadros

Dia: 07 de março de 2024

Resumo: Um terço dos alimentos produzidos anualmente para o consumo humano são perdidos ou desperdiçados globalmente. Os alimentos são em grande parte desperdiçados na fase de consumo, sendo que eles possuem a carga nutricional intacta, mas são de aparência desagradável e, por isso, são descartados. Isso acontece ainda no processo de respiração do alimento, o que significa que ocorre o descarte quando ainda são adequados para consumo humano. Os alimentos na fase de senescência iniciam o processo de decomposição da matéria orgânica por ação de organismos heterótrofos como bactérias e fungos. Como resultado desse processo, ocorre a liberação de água, amônia, gás carbônico e metano para o meio ambiente. Como os gases liberados estão associados à fase de maturação do alimento, existe a ideia de identificar os aclives e declives dos gases emitidos, durante sua decomposição, justamente para que se possa avaliar se o alimento ainda está disponível para consumo, ou precisa ser descartado de todo. Esta pesquisa consiste no desenvolvimento de uma plataforma (de hardware e software), composta de uma caixa com dispositivo IoT, e sensores, além de um software com algoritmo de Machine Learning, denominado de C0NT3NT3, que vem a ser um container inteligente com um aplicativo para dispositivo móvel, para indicar a um usuário comum, uma cozinheira caseira por exemplo, se o alimento na fase de senescência é próprio ou impróprio para o consumo.

 

Dissertação