Autor: Rafaelli Coutinho

Defesa de Proposta de Dissertação (23/12/2025): Gustavo Melo

Discente: Gustavo Melo

Título: Reconhecimento de Entidades Nomeadas em Relatos Criminais Informais com Apoio de Metadados Estruturados

Orientadores: Eduardo Bezerra da Silva (Cefet/RJ) e Karla Figueiredo (UERJ)

Banca: Eduardo Bezerra da Silva (Cefet/RJ), Karla Figueiredo (UERJ), Gustavo Paiva Guedes (Cefet/RJ) e Kele Teixeira Belloze (Cefet/RJ)

Dia/Hora: 23/12/2025 às 08:30h

Sala: https://teams.microsoft.com/l/meetup-join/19%3a4b1b17679a2b42b592d731495e4f82d6%40thread.tacv2/1764246601186?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: O presente trabalho investiga o problema do reconhecimento de entidades nomeadas em relatos criminais informais registrados no serviço Disque Denúncia. Esses relatos, frequentemente marcados por linguagem coloquial, erros ortográficos e estrutura textual livre, impõem desafios significativos ao uso de modelos tradicionais de Processamento de Linguagem Natural. Além do texto livre, os relatos são acompanhados de metadados estruturados, como tipo de ocorrência, localização e data que podem fornecer contexto adicional relevante para a tarefa. Neste estudo, propõe-se uma abordagem baseada em fine-tuning de modelos de linguagem de grande porte, utilizando um corpus manualmente anotado com entidades do tipo Pessoa, Local e Organização. Para contornar a escassez de dados rotulados, a metodologia inclui a aplicação de pseudo-rotulagem em um segundo corpus, significativamente maior, expandindo assim a base de treinamento de forma semissupervisionada. Adicionalmente, os metadados dos relatos são incorporados como fonte de contexto tanto no pré-processamento quanto no processo de avaliação e refinamento dos modelos. Os experimentos foram conduzidos com o modelo GliNER e avalia que a utilização de metadados e pseudo-rotulação pode contribuir para melhorar a performance dos modelos em corpora informais, com impactos positivos para a extração automatizada de informações em contextos de segurança pública. Os resultados reforçam o potencial de abordagens híbridas e sensíveis ao domínio para aplicações reais de Processamento de Linguagem Natural em ambientes com escassez de rótulos anotados.

Defesa de Proposta de Dissertação (17/12/2025): Ana Gabriela Viana de Araújo

Discente: Ana Gabriela Viana de Araújo

Título: Aplicação de Métodos Baseados em Concept Drift para a Previsão de Gols no Futebol Profissional

Orientador: Jorge de Abreu Soares (Cefet/RJ)

Banca: Jorge de Abreu Soares (Cefet/RJ), Glauco Fiorott Amorim (Cefet/RJ) e Carlos Eduardo Ribeiro de Mello (Unirio)

Dia/Hora: 17/12 às 10h

Sala: Defesa de exame de qualificação – Ana Gabriela Viana | Ingresso na Reunião | Microsoft Teams

Resumo: Este estudo apresenta uma análise preliminar sobre a aplicação de técnicas de concept drift na previsão de gols em partidas de futebol, a partir de dados ofensivos intra-partida. O objetivo é investigar se mudanças de conceito ao longo do jogo podem indicar variações no comportamento ofensivo que antecedem a ocorrência de gols. Foram utilizados dados da temporada 2015/2016 da La Liga, agregados em intervalos de um minuto, com a detecção de drift realizada por meio do algoritmo Page-Hinkley. Os experimentos consideraram diferentes combinações de variáveis e parâmetros, avaliadas por métricas de precision, recall e F1-score. Embora os resultados ainda sejam modestos, o estudo demonstra a viabilidade da abordagem e abre caminho para novas investigações que explorem conjuntos de variáveis multivariadas, técnicas alternativas de detecção de drift e análises longitudinais entre temporadas. Conclui-se que, apesar de preliminar, a proposta apresenta potencial para contribuir com avanços na compreensão da dinâmica ofensiva no futebol, oferecendo subsídios aplicáveis à análise de desempenho, às apostas esportivas e ao apoio à decisão técnica.

Defesa de Proposta de Dissertação (10/12/2025): Felipe de Ávila Tavares

Discente: Felipe de Ávila Tavares

Título: Avaliação Comparativa de Métodos de Imputação em Variáveis Categóricas

Orientador: Jorge de Abreu Soares

Banca: Jorge de Abreu Soares (Cefet/RJ), Eduardo Soares Ogasawara (Cefet/RJ) e Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora: 10/12/2025 às 10h

Sala: Defesa de exame de qualificação – Felipe Tavares | Ingresso na Reunião | Microsoft Teams

Resumo: Este trabalho investiga o desempenho de diferentes métodos de imputação aplicados a variáveis categóricas, considerando cenários com distintas estruturas de dados. O estudo contempla três classes de conjuntos: bases contendo apenas uma variável categórica, bases mistas com variáveis numéricas e categóricas e bases totalmente categóricas. A metodologia proposta envolve a geração artificial de valores ausentes segundo o mecanismo Missing Completely at Random (MCAR), em diferentes taxas (10%, 20% e 30%) e com múltiplas sementes aleatórias, de modo a avaliar a estabilidade e a sensibilidade dos métodos. Três abordagens de imputação são analisadas: KNN (incluindo variações com normalização, ponderação por Eta² e distância de Gower), Random Forest e XGBoost, aplicados em regime supervisionado. Os resultados preliminares, obtidos com a taxa de 20% de ausência na base Glass Identification, indicam diferenças marcantes entre as famílias de métodos, evidenciando que modelos baseados em árvores apresentam desempenho superior e maior estabilidade em relação às variantes do KNN. A continuidade da pesquisa incluirá a aplicação do protocolo completo às demais categorias de bases e às demais taxas de ausência, permitindo uma análise abrangente dos efeitos estruturais dos dados no desempenho das técnicas de imputação.

Defesa de dissertação (15/12/2025): Vanessa Santos Soares

Discente: Vanessa Santos Soares

Título: Avaliação de modelos de aprendizado de máquina para a correção automática de redações segundo as competências do ENEM

Orientadores: Eduardo Bezerra da Silva (orientador) e Gustavo Paiva Guedes e Silva (coorientador)

Banca: Eduardo Bezerra da Silva (Cefet/RJ), Gustavo Paiva Guedes e Silva (Cefet/RJ), Diego Moreira de Araújo Carvalho (Cefet/RJ) e Geraldo Bonorino Xexéo (UFRJ).

Dia/Hora: 15/12/2025 às 10h

Sala: Auditório V

Resumo: Com o crescimento do ensino remoto e a aplicação de exames de larga escala como o ENEM, a automatização da correção de textos discursivos tornou-se uma necessidade crescente. Este trabalho investiga diferentes estratégias de aprendizado de máquina para avaliação automática de redações em língua portuguesa, tomando como referência as cinco competências avaliativas do ENEM. Para isso, foram analisadas 9.599 redações coletadas do portal Vestibular Brasil Escola, abrangendo 102 temas publicados entre 2009 e 2024. São comparadas duas linhas de abordagem: (i) métodos tradicionais baseados em TF-IDF e features linguísticas extraídas dos textos, e (ii) modelos de linguagem pré-treinados com fine-tuning (XLM-RoBERTa com LoRA). O desempenho dos modelos é avaliado por meio da métrica Quadratic Weighted Kappa (QWK), que mede a concordância com corretores humanos. Espera-se demonstrar que modelos pré-treinados oferecem ganhos expressivos em robustez e confiabilidade, superando abordagens baseadas em engenharia de atributos. O estudo contribui para o avanço da área de Automatic Essay Scoring (AES) em português, oferecendo um benchmark e análise comparativa que podem apoiar futuras pesquisas e aplicações educacionais.

Defesa de Dissertação (10/12/2025): André Luiz Coutinho Merlo

Discente: André Luiz Coutinho Merlo

Título: Tecnologia e Sustentabilidade no Campo: Sistema de Recomendação para Pequenos Produtores Rurais

Orientador: Diego Nunes Brandão

Banca: Diego Nunes Brandão (PPCIC-Cefet/RJ), Kele Belloze (PPCIC-Cefet/RJ), Marcos Bacis Ceddia (UFRRJ) e Douglas Cardoso (Universidade de Coimbra)

Dia/Hora: 10/12/2025 às 10h

Sala: https://l1nk.dev/5tvol

Resumo: A agricultura digital tem se consolidado como um dos pilares da transformação tecnológica no campo, ao integrar sensores, algoritmos, dados meteorológicos e técnicas de inteligência artificial para tornar a produção agrícola mais eficiente, sustentável e inteligente. Nesse contexto, a agricultura familiar, responsável por grande parte da produção de alimentos no Brasil, desempenha um papel estratégico não apenas na segurança alimentar, mas também na conservação ambiental e no desenvolvimento regional. No entanto, muitos pequenos produtores ainda enfrentam desafios relacionados ao acesso a tecnologias avançadas e à tomada de decisões baseadas em dados. Diante desse cenário, este trabalho propõe o desenvolvimento de um sistema inteligente de recomendação agrícola, voltado a apoiar agricultores familiares na escolha de culturas e no manejo eficiente do solo. A solução adota uma abordagem híbrida, combinando um motor de inferência baseado em regras com técnicas de ciência de dados aplicadas à agricultura digital. O sistema utiliza dados regionais de produtividade, condições climáticas e análises detalhadas do solo para gerar recomendações personalizadas sobre o cultivo mais adequado, bem como orientações técnicas sobre adubação e calagem (aplicação de corretivos de acidez). Ao considerar variáveis como o tipo e a composição do solo, o histórico produtivo e o clima local, o sistema busca contribuir para o aumento da produtividade, a redução de impactos ambientais e a promoção da sustentabilidade econômica de pequenos produtores rurais. Experimentos, acompanhados de análise estatística das saídas, demonstram a viabilidade da solução proposta, com recomendações alinhadas às práticas agrícolas locais e às condições edafoclimáticas (integração solo–clima aplicada às recomendações agronômicas) das regiões avaliadas. A concordância entre o sistema e as referências técnicas foi quantificada por meio de medidas como a acurácia e o coeficiente Kappa de Cohen, com respectivos intervalos de confiança, além de testes de hipótese para avaliar a significância dos resultados. Esses achados indicam que o sistema pode se tornar uma ferramenta acessível e escalável, capaz de democratizar o acesso à agricultura digital e de fortalecer a sustentabilidade da agricultura familiar, contribuindo para reduzir as assimetrias tecnológicas no campo.

Defesa de dissertação (08/12/2025): Fernando Henrique de Jesus Fraga da Silva

Discente: Fernando Henrique de Jesus Fraga da Silva

Título: Aprendizado por Reforço Profundo Aplicado à Negociação Intradiária de Múltiplas Ações

Orientadores: Eduardo Bezerra da Silva (orientador) e Pedro Henrique González Silva (coorientador)

Banca: Eduardo Bezerra da Silva (Cefet/RJ), Pedro Henrique González Silva (UFRJ), Aline Marins Paes Carvalho (UFF) e Glauco Fiorott Amorim (Cefet/RJ)

Dia/Hora: 08/12/2025 às 15h

Sala: https://teams.microsoft.com/v2/?meetingjoin=true#/l/meetup-join/19:PKOJTuK7mfHSDE6QkCWQCYp71f0xOMNoRgSUj4wjMKc1@thread.tacv2/1763760050816?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d&anon=true&deeplinkId=91733be2-9804-4f09-ac6a-f1a362e67de8

Resumo: O mercado de ações é um ambiente dinâmico e volátil, no qual empresas de capital aberto negociam frações de seu valor, sujeitas a variações contínuas de preço influenciadas por fatores econômicos, políticos e sociais. Antecipar essas variações é uma tarefa complexa, especialmente no contexto da negociação intradiária, em que as decisões de compra e venda precisam ser tomadas em intervalos de tempo muito curtos, com base em dados que mudam rapidamente. Nesse cenário, o Aprendizado por Reforço (AR) surge como um paradigma promissor, capaz de desenvolver estratégias adaptativas por meio da interação contínua entre agente e ambiente. Esta dissertação investiga o uso de técnicas de Aprendizado por Reforço Profundo (ARP) na negociação financeira, com foco em cenários de negociação intradiária envolvendo múltiplas ações. É proposta uma abordagem baseada em ARP para estimar ações de compra e venda simultaneamente em diversos ativos, utilizando dados de mercado de alta granularidade, de modo a aproximar-se das condições reais de negociação. As análises experimentais foram conduzidas com o algoritmo Proximal Policy Optimization (PPO). Os resultados obtidos indicam que o agente proposto apresentou desempenho superior em relação a estratégias tradicionais de referência, alcançando ganhos superiores a 10 pontos percentuais em determinados casos.

Censo da Pós-Graduação stricto sensu 2025

 

A Diretoria de Pesquisa e Pós-Graduação do Cefet/RJ (DIPPG) informa que a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) realizará o Censo da Pós-Graduação Stricto Sensu, disponível a partir de 03 de dezembro de 2025 na Plataforma Sucupira, por meio de um formulário eletrônico a ser preenchido até o dia 26 de fevereiro de 2026.

Para tanto, deve ser feita a atualização obrigatória dos dados cadastrais na Plataforma Sucupira até o dia 27 de novembro de 2025.

O passo a passo para acesso à Plataforma pode ser consultado na página da DIPPG: https://dippg.cefet-rj.br/index.php/pt/alunos/57-estrutura/2214-censo-capes

Devem participar do Censo mestrandos e doutorandos regularmente matriculados, docentes (permanentes e colaboradores), pesquisadores em estágio pós-doutoral e coordenadores de programas de pós-graduação com vínculo vigente no sistema.

Outras informações podem ser consultadas em: https://www.gov.br/capes/pt-br/assuntos/noticias/capes-abrira-o-censo-da-pos-graduacao-em-novembro

Defesa de dissertação (16/10/2025): Gabriel Portugal Guadelupe dos Santos

Discente: Gabriel Portugal Guadelupe dos Santos

Título: COSMOS: Conjunto de Subsistemas de Monitoramento da Saúde

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ) e Alessandro Copetti (UFF)

Dia/Hora: 16 de outubro de 2025 (quinta-feira), às 14h

Sala: https://teams.microsoft.com/meet/221702080420?p=qjNSZ2ir0Dq3hkxSH7

Resumo: O estudo propõe o desenvolvimento do COSMOS, um conjunto integrado de sistemas que inclui uma Interface Gráfica, Servidor e um Dispositivo de Monitoramento de Sinais Fisiológicos (DMSF) dinâmico e acessível, visando aprimorar o monitoramento domiciliar de pacientes. Ao integrar a Internet das Coisas Médicas (IoMT), o COSMOS permite o monitoramento remoto de sinais fisiológicos, promovendo cuidados personalizados e prevenção de complicações. Os experimentos foram realizados e indicaram que o COSMOS é eficaz na aferição de sinais fisiológicos, proporcionando dados confiáveis. Importante destacar que o projeto foi aprovado pelo comitê de ética sob o CAAE: 65831022.6.0000.5289. Além disso, o sistema recebeu avaliações positivas dos usuários, que destacaram sua eficácia e facilidade de uso em suas rotinas diárias. Esses resultados sugerem que o COSMOS tem potencial para contribuir significativamente para a melhoria da qualidade de vida e do cuidado médico domiciliar personalizado. A capacidade de monitoramento remoto oferecida pelo COSMOS pode facilitar a detecção precoce de alterações no estado de saúde dos pacientes, permitindo intervenções médicas oportunas e adequadas, em consonância com os ODS 3, 9 e 11.

Defesa de dissertação (15/09/2025): Arthur Silveira de Siqueira Cavalcanti

Discente: Arthur Silveira de Siqueira Cavalcanti

Título: Avaliação de Técnicas de Balanceamento de Dados na Detecção de Fraude em Transações Online de Cartão de Crédito

Orientadores: Rafaelli de Carvalho Coutinho (orientadora) e Eduardo Bezerra da Silva (co-orientador)

Banca: Rafaelli de Carvalho Coutinho (PPCIC – Cefet/RJ), Eduardo Bezerra da Silva (PPCIC – Cefet/RJ), Eduardo Ogasawara (PPCIC – Cefet/RJ), Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora: 15/09/25, às 09h

Sala: https://teams.microsoft.com/l/meetup-join/19%3abf7330f2c27648b7ba998e79d8db5021%40thread.tacv2/1755212796749?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2254af42a0-5f30-4905-ac8d-10b96c6db26b%22%7d

Resumo: Devido ao aumento do comércio eletrônico e do uso de cartões de crédito, as fraudes com cartões de crédito tornaram-se um grande desafio para as entidades envolvidas. Apesar dos prejuízos, essas fraudes ainda representam uma pequena parte das transações, caracterizando um problema de desbalanceamento de dados nas áreas de detecção de fraudes do sistema financeiro. Este trabalho avalia várias combinações de técnicas de seleção de atributos, balanceamento de classes e algoritmos de classificação. Para balancear as classes, foram usadas técnicas de subamostragem, superamostragem e ajustes de limiares nos classificadores. O objetivo é criar um pipeline que permita a reprodutibilidade e ampliação das avaliações dessas técnicas. As combinações foram testadas em dois conjuntos de dados desbalanceados, avaliados pela métrica escore F1. Os resultados mostram um ganho de desempenho quando são implementadas técnicas de balanceamento de dados e otimização de limiares de classificação.

Defesa de dissertação (04/06/2025): Vinicius dos Santos Vancellote Almeida

Discente: Vinicius dos Santos Vancellote Almeida

Título: Construindo uma base de dados para estudos de mobilidade urbana da Cidade do Rio de Janeiro

Orientadores: Rafaelli Coutinho (orientadora) e Diego Moreira de Araujo Carvalho (coorientador)

Banca: Rafaelli Coutinho (PPCIC – Cefet/RJ), Diego Moreira de Araujo Carvalho (PPCIC – Cefet/RJ),  Eduardo Soares Ogasawara (PPCIC – Cefet/RJ), Rafael Garcia Barbastefano (PPPRO – Cefet/RJ),  Fabio Andre Machado Porto (LNCC)

Dia/Hora: 04 de junho de 2025, às 10h

Local: https://teams.microsoft.com/l/meetup-join/19%3ameeting_OGVmOTYwNjMtM2JjYi00N2YxLWE5NTMtY2E5MWI3NjM5MDQ0%40thread.v2/0?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%225089e95b-11e4-4bb0-a4b3-f4eea2039146%22%7d

Resumo: A mobilidade urbana está diretamente relacionada à qualidade de vida nas cidades, especialmente diante do crescimento populacional e dos desafios ambientais. O transporte público desempenha um papel fundamental nesse contexto, mas é frequentemente impactado por eventos climáticos adversos, como chuvas intensas, que podem comprometer sua eficiência. Este trabalho apresenta a construção de uma base de dados integrada e enriquecida para estudos de mobilidade urbana na cidade do Rio de Janeiro. A metodologia desenvolvida realiza o tratamento e enriquecimento dos dados de GPS da frota de ônibus da cidade, integrando informações posicionais, pluviométricas, administrativas e de emissões de gases, a partir de um pipeline automatizado. O resultado do processamento é uma base de dados estruturada em cinco tabelas-resumo (DSTs), cada uma voltada para uma dimensão específica da análise urbana. Como exemplo de usabilidade, foi proposta uma metodologia para identificação de pontos de alagamento durante eventos de chuva, utilizando a técnica de clusterização DBSCAN aplicada sobre observações de ônibus parados em regiões com precipitação moderada a forte. A metodologia apresentada como exemplo foi validada por meio da comparação com registros jornalísticos e mostrou resulta dos promissores para auxiliar o poder público na identificação de gargalos de mobilidade. Todos os dados e scripts foram disponibilizados abertamente, promovendo a ciência aberta e o reuso da informação.

Defesa de dissertação (19/02/2025): Arthur Ronald Ferreira Diogenes Garcia

Discente: Arthur Ronald Ferreira Diogenes Garcia

Título: Modelo Autorregressivo Média-Móvel baseado em Janelas deslizantes

Orientadores: Eduardo Soares Ogasawara e Dayse Haime Pastore

Banca: Eduardo Soares Ogasawara (CEFET/RJ), Dayse Haime Pastore (CEFET/RJ), Jorge de Abreu Soares (CEFET/RJ), Fábio André Machado Porto (LNCC)

Dia/hora: 19 de fevereiro de 2025, às 9h.

Local: https://teams.microsoft.com/l/meetup-join/19%3aKcszJdyzz4_vwVbrPDe0h62eXY262TcHQZS6U1eaeio1%40thread.tacv2/1738630105311?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%220534c83a-4cef-4129-9f9f-e8b8c3d50019%22%7d

Resumo: Modelos de séries temporais vêm sendo propostos há décadas, sendo que a maioria desses modelos requer como pré-requisito a condição estacionária, i.e., que a série possua média, variância e covariância constantes. Diante disso, é necessário pré-processá-las a fim de obter uma série estacionária. Não obstante, é desejável para fins de análise que o modelo bem como as propriedades estatísticas da série possam ser interpretáveis, a fim de auxiliar na  análise do usuário, facilitando sua aplicação. Esta dissertação propõe um modelo que combina uma fase de pré-processamento, visando obter a estacionariedade preservando as propriedades estatísticas da série original, e uma fase de modelagem por meio do Autorregressivo Média Móvel.

Processo Seletivo 2025.2

Estão abertas, do dia 01 de fevereiro de 2025 a 16 de março de 2025, as inscrições para o processo seletivo para ingresso no segundo trimestre de 2025 no curso de mestrado em Ciência da Computação.

O curso será oferecido no campus do Maracanã. Nesta chamada são ofertadas 20 vagas.

 

Documentos e Informações Importantes

 

Inscrição

 

Primeira Etapa

 

Segunda Etapa

As entrevistas serão realizadas de forma on-line utilizando a plataforma MS Teams. O link da entrevista será enviado para o e-mail fornecido no momento da inscrição.

 

Resultado Final


Vídeos dos docentes do Programa

A seguir são apresentados os vídeos de docentes do Programa com os seus principais temas de pesquisa.

 

Diego Brandão

Diogo Mendonça

Eduardo Bezerra

Eduardo Ogasawara

Felipe Henriques

Gustavo Guedes

João Quadros

Joel Santos

Jorge Soares

Kele Belloze

Laura Assis

Rafaelli Coutinho

 

Defesa de dissertação (30/12/2024): Lucas Daflon Scoralick

Discente: Lucas Daflon Scoralick

Título: Aprimoramento da Detecção de Conluios com Aprendizado de Máquina: Explicabilidade e Análise dos Resultados

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Flavia Cristina Bernardini (UFF)

Dia/hora: 30 de dezembro de 2024, às 10h.

Local: https://teams.microsoft.com/l/meetup-join/19%3afeb680f8d4e047d69e7cdb88a09be338%40thread.tacv2/1734221163372?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Conluios são acordos ou combinações secretas entre duas ou mais partes, geralmente para ganhar vantagem em algo ou prejudicar terceiros. A prática de conluios em licitações públicas perturba o equilíbrio de preços do mercado, impactando negativamente tanto os custos quanto a qualidade dos serviços públicos. Neste estudo, propõe-se uma metodologia para aprimorar os modelos de classificação de conluio, utilizando variáveis estatísticas combinadas com a análise de modelos explicáveis para explicação dos resultados. Os resultados mostraram uma melhora no desempenho de 0,04 à 0,25, utilizando a estratégia de balanceamento Smote, método de validação holdout 80% e 20% (treinamento e teste) e MCC como métrica de desempenho. A utilização dos modelos explicáveis SHAP, importância de atributos e LIME foram úteis para confirmar a contribuição das variáveis estatísticas para os modelos de aprendizagem de máquina. Além disso, a explicação de amostras com LIME demonstra potencial para explicação dos limites de decisão de classificação para atributos numéricos.

Dissertação

Defesa de dissertação (27/12/2024): Luiz Augusto de Souza Perciliano

Discente: Luiz Augusto de Souza Perciliano

Título: Detecção de Eventos Adversos em Mídia Social: uma revisão de literatura e experimentos utilizando o MetaMap para o Português do Brasil

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ), Jairo Francisco de Souza (UFJF)

Dia/hora: 27 de dezembro de 2024, às 10h.

Local: https://teams.microsoft.com/l/meetup-join/19%3a524f2c9ca84d45e79a0cab9dd1e61674%40thread.tacv2/1734221450946?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d0ca0ae9-1955-4759-a7ad-0b2fa49dbe55%22%7d

Resumo: Nos últimos anos, a área da saúde tem experimentado transformações tecnológicas substanciais, refletidas na expansão de bases de dados biomédicas em virtude de fatores como o aumento populacional, o surgimento de novas doenças, medicamentos e terapias. Além disso, a adesão de países a organizações biomédicas internacionais tem favorecido a implementação de protocolos mais rigorosos e eficientes. No entanto, no contexto da farmacovigilância, ainda há desafios significativos, como a complexidade e a limitação de acesso às bases de dados oficiais mantidas pela Organização Mundial da Saúde (OMS), que recebem contribuições de mais de 140 países. Com o aumento da circulação global de pessoas e a crescente demanda por medicamentos e vacinas, também cresce o número de Reações Adversas a Medicamentos (RAM). Apesar dos avanços, as autoridades responsáveis pela segurança dos medicamentos enfrentam dificuldades para registrar todos os Eventos Adversos (EA) e Reações Adversas a Medicamentos (RAM) reportados, bem como para realizar buscas ativas que reduzam riscos para a população. A dificuldade em acessar e processar essas informações, somada à subnotificação de (EA)s e RAM, impulsiona a busca por novas fontes de dados. Devido às barreiras no acesso às bases de dados oficiais, as mídias sociais têm se mostrado uma alternativa relevante para pesquisas em saúde. Essas plataformas oferecem informações valiosas para auxiliar na tomada de decisões, que podem incluir notificações a fabricantes para ajustar bulas, recolhimento de lotes ou até mesmo suspensão de medicamentos. Diante deste cenário, este trabalho tem como objetivos: i) apresentar uma revisão bibliográfica sobre o tema; ii) explorar o uso de mídias sociais, especificamente o Twitter (atual X), para a detecção de eventos adversos no contexto brasileiro; e iii) executar um experimento utilizando a ferramenta biomédica Metamap, em conjunto com a base de dados Unified Medical Language System (UMLS) adaptada para o português do Brasil. A pesquisa visa mapear termos e conceitos médicos presentes em tuítes, buscando identificar Sinais de Farmacovigilância (SF) e contribuir para a área de segurança de medicamentos no país. O trabalho obteve sucesso na criação de um modelo (UMLS) em português do Brasil, um passo fundamental para a análise de dados em português na área de saúde. Foram coletados e analisados milhares de tuítes sobre medicamentos para enxaqueca e sintomas de dengue. Por meio da ferramenta Metamap, foi possível mapear os termos médicos presentes nos tuítes para conceitos da (UMLS), evidenciado a viabilidade do uso da ferramenta para a detecção de sinais de farmacovigilância em português. Os resultados obtidos fornecem insights sobre o uso de medicamentos e a percepção da população sobre eles. O modelo (UMLS) em português e a metodologia desenvolvida neste trabalho abrem caminho para futuras pesquisas e aplicações de farmacovigilância com base em mídias sociais no Brasil.

Dissertação

Defesa de dissertação (19/12/2024): Roberto da Silva Gervasio Pontes

Discente: Roberto da Silva Gervasio Pontes

Título: Otimização Multiobjetivo para Problemas de Planejamento de Rotação de Culturas Agrícolas

Orientadores: Laura Assis (orientadora) e Diego Brandão (co-orientador)

Banca: Laura Assis (Cefet/RJ), Diego Brandão (Cefet/RJ), Felipe Henriques (Cefet/RJ), Fábio Usberti (UNICAMP)

Dia/hora: 19 de dezembro de 2024, às 9:30h.

Local: https://teams.microsoft.com/l/meetup-join/19%3aWfXqePNzHUyNHsKx_j1mGEKCA8uCBTA5fBbU9lGpm781%40thread.tacv2/1733775489034?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2291e505cb-28d8-40f6-a547-adfd127dabca%22%7d

Resumo: A agricultura é considerada um pilar essencial da economia mundial e está no centro da sociedade contemporânea.  Nas últimas décadas, para enfrentar a crise de abastecimento de alimentos e garantir a segurança alimentar, o setor se consolidou e mudou radicalmente a relação homem-ambiente. No entanto, ainda existe uma grande preocupação com a segurança alimentar, dado o crescimento populacional esperado em mais de 9,5 bilhões para 2050. Neste contexto, a introdução da informatização nas cadeias de suprimento agroalimentar tem sido cada vez mais significativa. A agricultura moderna torna-se cada vez mais interdisciplinar buscando um potencial aumento da produtividade deste setor e a promoção de práticas mais sustentáveis. A agricultura de precisão é uma destas práticas que tem como uma das suas ferramentas o Planejamento de Culturas e o Planejamento de Rotação de Culturas que têm grande impacto no meio ambiente e na produtividade. A otimização destes problemas pode permitir ao setor responder às mudanças climáticas, oferecer alimentos saudáveis e seguros e produzir alimentos eficientes em termos de custo. Nesta esteira o presente trabalho apresenta modelos utilizando PL para o PPCM e PPRCM com objetivos de maximizar a renda líquida, maximizar a diversidade de culturas, e maximizar a área utilizada. Os alcançados foram comparados aos modelos com o mesmo conjunto de dados presentes da literatura cujo único objetivo era maximizar a renda líquida. Verificou-se que os modelos propostos apresentam aumento de, em média, 60% na diversidade de culturas plantadas com perdas de retorno líquido inferiores a 5%. A avaliação dos cenários utilizando as metodologias de Soma Ponderada e ε-restrito foi eficaz na exploração da fronteira de soluções ótimas. Embora o Método do ε-restrito apresente maior custo computacional, ele se destaca por sua maior capacidade de discriminar os trade-offs entre os objetivos.

Dissertação

Defesa de dissertação (19/12/2024): Tarsila Gomes Bello Tavares

Discente: Tarsila Gomes Bello Tavares

Título: Imputação em cascata no contexto de Inteligência Artificial Centrada em Dados (DCAI).

Orientador: Jorge de Abreu Soares

Banca: Jorge de Abreu Soares (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ), Carlos Eduardo Ribeiro de Mello (Unirio)

Dia/hora: 19 de dezembro de 2024, às 14h.

Local: Bloco E, 5º andar, sala E-518

Resumo: À medida que o volume global de dados aumenta, é comum encontrar bases de dados com valores ausentes, o que requer a aplicação de técnicas de imputação. Tradicionalmente, estas técnicas abordam cenários univariados, tratando a ausência de valores em uma única coluna. Este estudo propõe uma abordagem de imputação em cascata, que é capaz de tratar valores ausentes em múltiplas colunas, reintegrando valores imputados na base de dados antes da imputação do atributo subsequente, permitindo sua reutilização. Adicionalmente, investigou-se a eventual melhoria da eficiência da imputação pela binarização dos dados, segundo padrões de similaridade de ausência antes da imputação, e quais algoritmos de agrupamento apresentam resultados mais interessantes para diferentes características de bases de dados. Portanto, almeja-se avaliar e comparar o desempenho de uma imputação multivariada que utiliza a abordagem em cascata com uma pré-fase de agrupamento, aplicando diferentes classes de algoritmos dessa natureza, tais como K-modes, Agglomerative Clustering, DBSCAN e a rede neural SOM.

Dissertação

Defesa de dissertação (11/12/2024): Fabio da Silva Gregório

Discente: Fabio da Silva Gregório

Título: LexRank guiado para recuperação avançada em análise jurídica

Orientador: Eduardo Bezerra da Silva

Banca: Eduardo Bezerra da Silva (Cefet/RJ – PPCIC), Altigran Soares da Silva (IComp / UFAM), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Gustavo Paiva Guedes e Silva (PPCIC / CEFET-RJ).

Data: 11 de dezembro de 2024, às 16h

Link da sala do MS Teams: https://teams.microsoft.com/v2/?meetingjoin=true#/l/meetup-join/19:OnS4EZKGpsKeGa50vaGxvZZ604acCFsazTfC-LTdwYE1@thread.tacv2/1730395539949?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d&anon=true&deeplinkId=830cfb45-96fe-4604-9c5d-13b1ffa801ee

Resumo: A Constituição Brasileira prevê mecanismos para que cidadãos peticionem ao Judiciário, incluindo o chamado recurso especial. Esse tipo específico de recurso visa uniformizar a interpretação jurídica da legislação brasileira. O tratamento de recursos especiais é uma das tarefas diárias no Judiciário, regularmente apresentando demandas significativas em seus tribunais. Propomos um método, baseado em aprendizado de máquina não supervisionado, para auxiliar o analista jurídico a classificar um recurso especial em um tema de uma lista disponibilizada pelo Superior Tribunal de Justiça (STJ). Como parte desse método, propomos uma modificação do algoritmo LexRank baseado em grafos, que chamamos de Guided LexRank. Esse algoritmo gera o resumo de um recurso especial. O grau de similaridade entre o resumo gerado e diferentes temas é avaliado usando o algoritmo BM25. Como resultado, o método apresenta um ranking de temas mais adequados ao recurso especial analisado. O método proposto não requer rotulagem prévia do texto a ser avaliado e elimina a necessidade de grandes volumes de dados para treinar um modelo, como normalmente ocorre em modelos supervisionados. Avaliamos a eficácia do método aplicando-o a um corpus de recurso especial previamente classificado por especialistas humanos.

Dissertação

Defesa de dissertação (10/12/2024): Jéssica Barbosa de Souza Costa

Discente: Jéssica Barbosa de Souza Costa

Título: Um Novo Método Híbrido de Detecção de Anomalias Baseado em EMD e ARIMA

Orientadores: Eduardo Ogasawara (Orientador) e Ronaldo Alves (Co-orientador)

Banca: Eduardo Ogasawara (Cefet-RJ / PPCIC), Ronaldo Alves (Fiocruz), Kele Belloze (Cefet-RJ / PPCIC), Fabio Porto (LNCC), Cristiano Boccolini (Fiocruz)

Data: 10 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3apSO9WbZ1YPXvTg8M8nxnUCqUHTtoL1r-dXbVdbYffHo1%40thread.tacv2/1729787552506?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%220534c83a-4cef-4129-9f9f-e8b8c3d50019%22%7d

Resumo: Anomalias são definidas como desvios comportamentais em relação a padrões esperados e identificá-las é um desafio importante. A detecção de anomalias é uma atividade fundamental na análise de séries temporais. Ela permite a tomada de decisões baseada em dados em muitas atividades de controle e monitoramento, como cuidados de saúde, qualidade da água, análise de reflexão sísmica e exploração de petróleo. Existem muitos métodos de detecção de anomalias, mas escolher os métodos apropriados é complexo devido à natureza intrínseca das séries temporais. Há uma demanda por métodos de detecção de anomalias que sejam robustos, minimizem falsos positivos e adaptáveis a cenários não estacionários. Este trabalho introduz a Decomposição de Modo Empírico Refinada (REMD, do inglês Refined Empirical Mode Decomposition) como uma abordagem híbrida para atender a essa necessidade, integrando os modelos de Decomposição de Modo Empírico (EMD, do inglês Empirical Mode Decomposition) e Autoregressão Integrada de Médias Móveis (ARIMA, do inglês Autoregressive Integrated Moving Average). A concepção do REMD visa otimizar os pontos fortes de ambos os métodos e superar suas limitações. Ele é avaliado em comparação com métodos de ponta em diversos conjuntos de dados. O REMD demonstra desempenho superior, com pontuação até três vezes melhor no F1.

Dissertação

Defesa de dissertação (09/12/2024): Mateus do Amor Devino Pereira

Discente: Mateus do Amor Devino Pereira

Título: Uma Comparação de Workflows para Análise de dados de scRNA-seq para Identificação de Genes Diferencialmente Expressos em Câncer de Mama

Orientadores: Eduardo Bezerra da Silva (orientador) e Kele Teixeira Belloze (co-orientadora)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Kele Teixeira Belloze (PPCIC / CEFET-RJ), Pedro Henrique González Silva (PPCIC / UFRJ), Fabrício Alves Barbosa da Silva (FIOCRUZ)

Data: 09 de dezembro de 2024, às 10h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aCa_etTt2B_WMpjpSaAVT301MmiLnMg4N81AYVe__dMA1%40thread.tacv2/1731407636571?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Nos últimos anos, pesquisas com dados multiômicos desempenhou um papel importante no entendimento da biologia celular. Em particular, a análise de dados de sequenciamento de RNA de células únicas contribuiu para a descoberta de medicamentos e na identificação de biomarcadores de doenças complexas, como o câncer. No entanto, quando se trata de analisar dados de scRNA-seq, várias etapas do processamento podem ser feitas de maneiras diferentes. Este estudo fornece uma comparação de diferentes combinações de técnicas em um workflow de scRNA-seq, evidenciando como cada uma dessas etapas impacta os resultados. Realizamos experimentos em três conjuntos de dados transcriptômicos de diferentes magnitudes de número de amostras. Nossos experimentos consistem em aplicar um conjunto de técnicas de pré-processamento e agrupamento a dados de scRNA-seq de câncer de mama. Também realizamos um estudo de ablação para entender como cada técnica influenciou os resultados do experimento.

Dissertação

Defesa de dissertação (02/12/2024): Leandro de Mattos Bento Soares

Discente: Leandro de Mattos Bento Soares

Título: Detecção de quedas de soldados combatentes por meio de redes neurais artificiais

Orientadores: Eduardo Bezerra da Silva (orientador) e Diego Nunes Brandão (co-orientador)

Banca: Eduardo Bezerra da Silva (PPCIC / CEFET-RJ), Diego Nunes Brandão (PPCIC / CEFET-RJ), Pedro Henrique González (PPCIC / CEFET-RJ), Pablo Rangel (IPqM), Cláudio Miceli de Farias (PESC / UFRJ)

Data: 02 de dezembro de 2024, às 9h

Link da sala do MS Teams: https://teams.microsoft.com/l/meetup-join/19%3aerNEcB95_5BX8BvwWi0MfdotZi1WhNCtKjL_mHyNdHg1%40thread.tacv2/1730395201113?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22c03d6068-4733-48a6-bbb4-aa78f351d9cf%22%7d

Resumo: Durante operações militares envolvendo soldados combatentes, estes enfrentam uma série de desafios físicos devido à natureza das atividades, incluindo lesões que podem resultar em choque hemorrágico hipovolêmico e, em casos extremos, levar ao óbito. Assim, é fundamental que os centros de controle dessas operações sejam rapidamente informados sobre a condição dos combatentes, permitindo a agilização do resgate e a preservação de suas vidas. Nesse contexto, a Marinha do Brasil desenvolveu o projeto “Combatente do Futuro”, que tem como objetivo criar modelos capazes de detectar situações que demandem socorro imediato ao combatente, bem como outras ocorrências relevantes, como conflitos ou situações de risco, que possam ser identificadas automaticamente a partir das variações inerciais dos combatentes. Para a coleta dessas variáveis inerciais, foram escolhidos dispositivos específicos: um modelo de smartwatch, posicionado nos pulsos direito e esquerdo, e um modelo de smartphone, posicionado no peito do soldado. Dentro desse projeto, destaca-se a investigação de métodos para detecção de quedas de soldados, dividida em duas etapas principais. A primeira etapa consiste na implementação de um modelo de rede neural para detectar padrões de queda, enquadrando o problema como uma tarefa de classificação. Já a segunda etapa busca propor um classificador binário, com o objetivo de diferenciar quedas operacionais de quedas causadas por ferimentos. Esta dissertação concentra-se na detecção de quedas, pertencente à primeira etapa. Para a realização desta pesquisa, foram coletados dados de atividades de vida diária, atividades de quedas e atividades militares com porte e sem porte de arma de 15 militares da Marinha do Brasil, simulando as entradas para o modelo de rede neural a ser implementado e testado em situações de campo. A partir desse conjunto de dados, foram estabelecidos 12 cenários experimentais para cada posição dos sensores, explorados nos domínios do tempo e da frequência, com o objetivo de identificar o conjunto de variáveis inerciais, a posição dos sensores e o domínio que apresentassem o melhor desempenho na classificação de eventos de queda. O conjunto de configurações escolhido foi implementado na arquitetura de rede neural CNN1D, cujos hiperparâmetros foram ajustados por meio de otimização bayesiana.

Dissertação