Categoria:Defesas

Defesa de dissertação (24/08/2023): Flávio Pinheiro Marques

Discente: Flávio Pinheiro Marques

Título: ProBee: Um Processo Baseado em Proveniência para Rastreio do Comportamento de Alunos em Jogos Educacionais

Orientadores: Joel dos Santos (Orientador) e Eduardo Ogasawara (Coorientador)

Banca: Joel dos Santos (Orientador), Eduardo Ogasawara (Coorientador), João Quadros (PPCIC), Windson Viana (UFC)

Dia/hora: 24 de agosto de 2023, às 10h.

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3a970eb60c71844a97b7dd968239560665%40thread.tacv2/1690995726170?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2264f8dc5c-d07e-4edc-acf2-16d1e4d1205d%22%7d

Resumo: Em diversas áreas do conhecimento, o uso de atividades práticas é importante para fixação do conhecimento visto em aula por alunos. O uso de jogos digitais têm sido propostos como ferramentas educacionais. No entanto, surge o desafio de encontrar um equilíbrio entre a jogabilidade/entretenimento e a efetiva mobilização dos conceitos teóricos. Estudos recentes na área de análise de aprendizagem oferecem metodologias e abordagens para a análise de jogos educacionais, porém análises mais aprofundadas e abrangentes ainda são escassas, especialmente em jogos com ampla variedade de decisões e jogabilidade. A utilização da proveniência de dados em jogos, embora pouco explorada, surge como uma promissora abordagem. Este trabalho apresenta o ProBee, um modelo baseado em proveniência desenvolvido para análise de jogos educacionais. O ProBee utiliza uma abordagem que coleta e analisa dados de proveniência, registrando todas as ações realizadas pelo jogador, incluindo informações temporais. Essa metodologia permite rastrear as séries temporais do jogo, revelando o comportamento do jogador e a estratégia adotada durante a sessão de jogo. Para avaliar a eficácia do ProBee, realizamos um estudo de caso com o jogo educativo Control Harvest, que auxilia os professores na apresentação do tema Controle Biológico. Para esta avaliação foram realizados duas avaliações experimentais, contando com três análises distintas: (i) avaliação do desempenho em relação com o entendimento, (ii) avaliação do desempenho em relação a atratividade e (iii) avaliação do engajamento das metas de jogo. Os resultados encontrados em ambas avaliações experimentais demonstram que o processo proposto oferece uma vantagem significativa, especialmente em jogos com várias opções e jogabilidade. Através da aplicação do ProBee foi possível identificar e avaliar o desempenho dos alunos ao utilizar o jogo Control Harvest levando em consideração os objetivos de ensino.

 

Dissertação 

Defesa de dissertação (30/06/2023): Claudio Andre da Silva Alves

Discente: Claudio Andre da Silva Alves

Título: An Adaptive Hybrid Genetic Algorithm for Hyperparameter Optimization

Orientador: Pedro Henrique González Silva

Dia: 30 de junho de 2023

Resumo: O recente aumento na popularidade das aplicações de aprendizado de máquina (AM) levou a um aumento na demanda por modelos de AM eficientes. Uma das principais etapas na construção de tais modelos é selecionar um conjunto adequado de hiperparâmetros. No entanto, com o aumento da complexidade dos modelos e técnicas de treinamento, definir manualmente esses parâmetros tornaram-se uma tarefa trabalhosa, exigindo uma quantidade significativa de tempo e conhecimento específico sobre o modelo que está sendo ajustado. Para enfrentar esse desafio, a comunidade do Automatic Machine Learning (AutoML) está se concentrando em criar maneiras de encontrar automaticamente o melhor conjunto de hiperparâmetros para algoritmos de AM por meio de sua área de pesquisa chamada de Otimização de Hiperparâmetros (HPO). Recentemente, o Hybrid Biased Random Key Algoritmo Genético (HBRKGA), um algoritmo genético que usa funções de otimização substitutas na etapa de exploração, foi usado para encontrar hiperparâmetros automaticamente de forma eficiente para diferentes conjuntos de dados. No entanto, o seu potencial não foi totalmente explorado, pois o HBRKGA usa apenas uma função substituta fixa na etapa de exploração. Esta pesquisa apresenta uma nova abordagem para HPO de modelos de AM baseados no HBRKGA. Um método chamado Adaptive HBRKGA (A-HBRKGA) é desenvolvido para melhorar a probabilidade de encontrar a melhor solução. Este método é baseado no princípio de diferentes passos evolutivos requerem diferentes funções de otimização, o que permite à HBRKGA ter várias funções substitutas que são escolhidos com base em avaliações anteriores. A abordagem foi testada em vários conjuntos de dados disponíveis publicamente e apresentam os melhores resultados quando comparados a outros métodos da literatura.

 

Dissertação 

Defesa de dissertação (30/06/2023): Almir Antonio Monteiro Junior

Discente: Almir Antonio Monteiro Junior

Título: Localização de Postos de Testagem durante Surto de Doença Infecciosa: Uma Abordagem via Programação Inteira

Orientador: Pedro Henrique González Silva

Dia: 30 de junho de 2023

Resumo: Em situações de grandes surtos de doenças contagiosas, como a pandemia causada pelo Novo Coronavírus (COVID-19), uma rápida e eficiente resposta dos sistemas de saúde é primordial para que se minimize os impactos na vida da população. Um dos pontos a ser considerado é a rápida identificação de novos casos, visando diminuir a propagação, por se tratar de doença infectocontagiosa. Para tanto, faz-se necessária a utilização de algum modo de teste, a fim de verificar se o paciente está infectado ou não. Essa verificação deve ser feita da forma mais ágil e segura possível, para que menos pessoas tenham contato com este paciente, em caso de resposta positiva. Para isso, além de se determinar onde instalar postos de testagem, deve-se dimensionar corretamente o atendimento que será realizado, para que longas filas não se formem, aumentando os riscos de contágio. Este trabalho propõe a utilização de Programação Linear Inteira em conjunto com a Teoria das Filas para a determinação de localizações para a instalação de postos de testagem, apoiada por dados geográficos. Estes postos devem cobrir toda a demanda de um local, como uma cidade ou região, minimizando os custos de implantação e a distância percorrida por um paciente para ser testado. Além disso, eles devem sempre levar em conta as restrições de tempo de espera em fila, dada a importância de cada um destes pontos para a resolução satisfatória do problema. Diferentes cenários foram avaliados, e os resultados apontaram ser benéfica a utilização de atendimentos regionalizados, além do uso da rede de saúde já existente na cidade.

 

Dissertação 

Defesa de dissertação (23/05/2023): Diego Rodrigues Moreira Totte

Discente: Diego Rodrigues Moreira Totte

Título: Comparação entre Métodos Exato e Heurístico para o Problema de Alocação de Sensores em Redes de Sensores Sem Fio

Orientadores: Laura Assis e Felipe Henriques

Banca: Laura Assis (CEFET/RJ), Felipe Henriques (CEFET/RJ), Pedro González (CEFET/RJ), Michel Tcheou (UERJ)

Dia/hora: 23 de maio de 2023, às 13:30h.

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3aK2WMNGD-mFaOYvJMOv0bX5UmEyCRfVvPLA5QBoVBUSc1%40thread.tacv2/1683670285619?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2291e505cb-28d8-40f6-a547-adfd127dabca%22%7d

Resumo: Redes de Sensores Sem Fio (RSSFs) estao cada vez mais presentes na sociedade, sejam em casas, carros, fabricas ou em apoio a resgates e preservação ambiental. Varios métodos de otimização ao propostos na literatura a fim de alocar os nós sensores de forma a melhorar o desempenho da rede, considerando um ou mais objetivos. Contudo, grande parte dos estudos neste tema sao realizados com métodos heuríısticos, os quais nao possuem garantia de otimalidade, fato previsto dado que abordagens exatas, devido à complexidade envolvida na garantia da solução ótima, geralmente não resolvem instância de grande porte. Nesta pesquisa, sao propostas duas abordagens de solução para o Problema de Alocação de Sensores (PAS) com objetivo de minimizar o custo energético geral da rede: a primeira e um método exato usando Programação Linear Inteira Mista (PLIM), e a segunda um metodo heurístico baseado nos conceitos de Algoritmos Geneticos (AGs). Os resultados obtidos mostraram que a abordagem exata alcançou resultados ótimos para o PAS considerando instancias de pequeno, médio e grande portes. Por sua vez, o AG gerou resultados sub-otimos para quase o dobro de instâncias que a abordagem exata, no mesmo período de tempo. Foram utilizadas instancias de formatos regulares, semirregular e irregulares.

 

Dissertação 

Defesa de dissertação (19/01/2023): Andrea Carla Vargas Rodrigues

Discente: Andrea Carla Vargas Rodrigues

Título: Desenvolvimento de um Ambiente Sensorial-Lúdico para Deficientes Visuais baseado na Arquitetura de Microcontroladores AVR

Orientador: João Quadros

Dia/hora: 19 de janeiro de 2023

Resumo: Devido às barreiras limitantes impostas pela falta de visão total ou parcial de certas pessoas, a arte de desenhar fica bastante restrita, quando não impossível. Faz-se necessário o desenvolvimento de recursos e ambientes que venham facilitar pessoas, com estes problemas relativos à visão, possam expandir suas percepções e atuarem de forma direta na arte de desenhar. Com este foco, este trabalho investe no desenvolvimento do recurso “ArtInDV”, que tem como proposta oferecer aos deficientes visuais um recurso lúdico de auxílio à atividade de desenhar. Utilizando uma abordagem lúdica e sensorial, o recurso desenvolvido vai interagir em conjunto com os usuários, de modo a que estes, fazendo uso de suas outras percepções, possam trabalhar em desenhos artísticos ou comuns com mais facilidade. O recurso desenvolvido nessa pesquisa visa cumprir um papel social e inclusivo para as pessoas com alguma deficiência visual, sendo possível sua utilização em instituições de ensino que possuam estudantes com alguma deficiência visual. O dispositivo vai utilizar a interface Arduino, baseada em microcontroladores AVR, acoplada ao software Processing, para vocalização de cores dos materiais de desenho disponibilizados na experiência. O plano de testes aplicado vai trabalhar junto às pessoas com deficiência visual, de modo que se observe os pontos fortes e os pontos fracos do recurso, visando futuros aprimoramentos.

Dissertação 

Defesa de dissertação (16/12/2022): Luis Barbosa de Assis Jr.

Discente: Luis Barbosa de Assis Jr.

Título: Um Sistema para Detecção de Vazamento de Água em Residências baseado em Internet das Coisas

Orientadores: Diego Brandão e Helga Balbi

Banca: Diego Brandão (CEFET/RJ), Helga Balbi (CEFET/RJ), Felipe Henriques (CEFET/RJ), André Chaves (IME/IPB), Ary de Oliveira (UFT)

Dia/hora: 16 de dezembro de 2022, às 10am.

Link da sala:https://teams.microsoft.com/l/meetup-join/19%3ameeting_Y2U5ZmY5NDUtOTg3OS00NDNhLWIxMWEtNTgwNTY2NjY5YzE2%40thread.v2/0?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22b1b7c333-2713-4523-9eae-7d94d8adcbe5%22%7d

Resumo: O uso racional da água é essencial para o desenvolvimento e crescimento econômico de uma sociedade. Dados da Organização das Nações Unidas (ONU) indicam que até 2050 ocorrerá uma maior escassez de água devido ao aumento da sua procura em países emergentes, principalmente com o aumento populacional destes locais (ONU, 2018). Um consumo consciente por parte da sociedade pode amenizar tal efeito com a preservação das reservas naturais e aumento da segurança hídrica. Esta premissa serve de motivação para o desenvolvimento deste trabalho, que propõe a criação de um sistema computacional de baixo custo que detecte vazamentos de água em residências utilizando conceitos de Internet of Things (IoT). Tal sistema abrange a captação de dados por meio de sensoriamento, transmissão, processamento e, por fim, uma interface com o usuário. Foi explorada uma arquitetura de processamento híbrida em borda e névoa, assim como as técnicas de detecção de vazamento existentes na literatura Consume Non Zero e Minimun Night Flow. Além disso são apresentadas contribuições tanto na detecção de vazamento quanto na análise de consumo usando dados estatísticos brasileiros. Também foram estudados o impacto do consumo e vazamento na pressão interna da residência, além da aplicação de algoritmo de aprendizado de máquina para prever o consumo futuro.

Dissertação 

Defesa de dissertação (15/12/2022): Iran de Alvarenga Cidade

Discente: Iran de Alvarenga Cidade

Título: Um Sistema de Baixo Custo para Sondagem Ambiental e Verificação de Qualidade do Ar

Orientadores: Diego Brandão e João Quadros

Banca: Diego Brandão (CEFET/RJ), João Quadros (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ), Jader Lugon Jr. (IFF)

Dia/hora: 15 de dezembro de 2022, às 10am.

Link da salahttps://teams.microsoft.com/l/meetup-join/19%3ameeting_MDY1MTY3OGQtYWYxMy00MDE5LWFmMWQtYzNmNDkyMWFhYTI0%40thread.v2/0?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22b1b7c333-2713-4523-9eae-7d94d8adcbe5%22%7d

Resumo: Os avanços tecnológicos dos últimos anos vêm permitindo que diferentes áreas da ciência sejam beneficiadas e até revolucionadas, alguns exemplos podem ser vistos na utilização de técnicas de inteligência artificial em diagnósticos de doenças, na identificação de criminosos por imagem etc. A área ambiental também tem sido beneficiada com tais avanços, o uso de algoritmos de IA para o sensoriamento remoto e o de sensores para a determinação de poluição são só alguns dos exemplos. Neste contexto, este trabalho apresenta um sistema de monitoramento ambiental de baixo custo que visa fornecer uma leitura rápida de elementos que poluem o ar e que podem comprometer a saúde humana. O sistema desenvolvido consiste no monitoramento de poluentes do ar por meio de sensores interligados a uma interface eletrônica embarcada em um Veículo Autônomo Não-Tripulado (VANT). Os dados capturados são analisados por meio de um algoritmo baseado em lógica fuzzy que permite definir os índices de qualidade do ar, de acordo com órgãos regulamentadores. Experimentos foram conduzidos em uma área industrial da cidade do Rio de Janeiro e os resultados demonstram a viabilidade da proposta.

Dissertação 

Defesa de dissertação (22/12/2022): Diego Silva de Salles

Discente: Diego Silva de Salles

Título: Detecção e análise multi-scale de eventos originados por fatores externos de incerteza em séries financeiras

Orientador: Eduardo Ogasawara e Eduardo Bezerra

Banca: Eduardo Ogasawara (orientador), Eduardo Bezerra (coorientador), Rafaelli Coutinho (Cefet/RJ), Carlos Eduardo Mello (UNIRIO)

Dia/hora: 22 de dezembro de 2022, às 9h

Link da sala: https://teams.microsoft.com/l/meetup-join/19%253a6b4d86673b03400dbed2bbdcc2ba1cf2%2540thread.tacv2/1669906038665?context%3D%257b%2522Tid%2522%253a%25228eeca404-a47d-4555-a2d4-0f3619041c9c%2522%252c%2522Oid%2522%253a%25220534c83a-4cef-4129-9f9f-e8b8c3d50019%2522%257d&sa=D&source=calendar&usd=2&usg=AOvVaw1skBg3ShVw8Znv60hu-gXu

Resumo: Existem diferentes fatores externos relatados na mídia que podem impactar uma série temporal financeira. Tais fatores, como transições de governo, crises econômicas ou escândalos de corrupção, podem estar relacionados a eventos que aumentam a incerteza na série temporal. Em particular, esses fatores externos podem aumentar o risco percebido em uma série temporal financeira por meio de eventos como anomalias ou pontos de mudança. Um estudo baseado nas diferentes características que compõem um evento pode determinar previsões, além de ajudar a minimizar o risco em investimentos. A influência desses fatores pode ter diferentes ciclos de flutuação, afetando uma série temporal ao longo de meses ou anos. Portanto, descobrir esses eventos na série temporal financeira e uma tarefa desafiadora. Essa dissertação apresenta o Multi-Scale Event Detect (MSED), uma técnica para detecção de eventos em séries temporais não estacionárias e não lineares. Somado a isso, este trabalho faz um estudo associativo dos eventos encontrados pelos métodos de detecção nos componentes de Intrinsic Mode Function (IMF) com as marcações de eventos externos obtidos através da Economic Policy Uncertainty (EPU). O objetivo é identificar que tipo de evento é refletido por um determinado fator de incerteza externo em uma série financeira, utilizando essa abordagem é possível determinar a natureza mais predominante dos eventos com base nas variações de incerteza apresentadas na série de EPU. Essas informações permitem especificar um conjunto de séries temporais onde a influência da incerteza gera eventos aceitáveis para um determinado perfil de investimento. Assim, mitigando o risco a que se pretende estar exposto.

Dissertação 

Defesa de dissertação (13/12/2022): Helder Yukio Okuno

Discente: Helder Yukio Okuno

Título: AUDIOLIVROS MULTISSENSORIAIS: MODELO, DESENVOLVIMENTO E IMPLEMENTAÇÃO DE UMA NOVA EXPERIÊNCIA DE LEITURA PARA USUÁRIOS COM DEFICIÊNCIA VISUAL

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (CEFET/RJ), Glauco Amorim (CEFET/RJ), Maria da Graça Pimentel (USP)

Dia/hora: 13 de dezembro de 2022, às 8:30 a.m.

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3a634b54653bfc4d72ba57f98fef1cc378%40thread.tacv2/1669722628810?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d455e339-d958-4321-a959-bda8d1ea2337%22%7d

Resumo: O desenvolvimento de soluções de tecnologias assistivas para indivíduos com deficiência visual é essencial, em especial no campo da educação, pois proporciona a integração na sociedade, autonomia, inclusão social e digital. Diversas funcionalidades neste campo foram desenvolvidas, como os leitores de tela (e.g., TalkBack do Android e VoiceOver do iPhone), permitindo aos indivíduos com deficiência visual maior autonomia, como a troca de mensagens instantâneas e a audição de histórias narradas, como os audiolivros. Em 2011, a Organização Mundial da Saúde destacou no Relatório Mundial sobre Deficiência a importância de soluções de tecnologias assistivas como os audiolivros. Inspirado nesse relatório, o presente trabalho propõe o aprimoramento da leitura dos audiolivros tradicionais aplicando os conceitos de Multimídia Multissensorial, dado que pesquisas nessa área indicam que efeitos multissensoriais (e.g., vento, aroma) têm viabilizado uma maior imersão do usuário, processo que também é conhecido como Qualidade de Experiência (QoE). Aprimorar a QoE dos indivíduos com deficiência visual permite aumentar a percepção da história narrada, a compreensão e a imersão no imaginário. Nesse cenário, este trabalho apresenta o modelo denominado audiolivros multissensoriais, propõe o desenvolvimento da versão 3.0 do aplicativo intitulado MulseBook Audio e apresenta os resultados de experimentos com voluntários com deficiência visual. Os experimentos foram realizados para validar o modelo, além de avaliar a usabilidade do novo aplicativo e a QoE desses usuários ao utilizarem os audiolivros multissensoriais. Ao total, onze voluntários participaram do experimento que consistiu na leitura de um audiolivro multissensorial e, em seguida, foram convidados a responder o questionário de Avaliação da QoE, baseado no EGameFlow, e o questionário padronizado System Usability Scale (SUS), a fim de avaliar a usabilidade do MulseBook Audio 3.0 e o quanto os efeitos multissensoriais influenciam na experiência da leitura. Os resultados alcançaram o escore médio 4,6 de 5 pontos da QoE e a pontuação de 96,6 de 100 na usabilidade. Vale ressaltar que esse estudo foi aprovado no Comitê de Ética em Pesquisa sob os protocolos 53886421.0.0000.5626 e 46544321.5.0000.5289.

 

Dissertação 

Defesa de dissertação (25/11/2022): Luciana Varjolo

Discente: Luciana Varjolo

Título: MERES: Uma Metodologia para o Reconhecimento de Palavras com Estímulos Sonoros e Escritos

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (CEFET/RJ), Juliana Novo (Universidade do Minho), Glauco Amorim (CEFET/RJ), Maurício Cagy (Coppe/UFRJ)

Dia/hora: 25/11/2022, às 10 horas

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3aac0b85449c1d4bbab85dff61c61ee765%40thread.tacv2/1668000281274?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d455e339-d958-4321-a959-bda8d1ea2337%22%7d

Resumo: A leitura de textos é uma atividade extremamente importante para o desenvolvimento de um indivíduo em diversas áreas da sociedade. No que tange à educação, as funções cognitivas relacionadas à leitura proporcionam a absorção do conteúdo apresentado, o que contribui significativamente para um bom aprendizado. O processamento de palavras é uma dessas funções cognitivas que permeia o reconhecimento de palavras, parte fundamental para a compreensão de texto. Se por um lado, décadas de pesquisa científicas sobre a leitura levaram a sofisticados modelos de processamento de palavras, o avanço nas tecnologias propiciou o desenvolvimento de plataformas interativas e sensoriais de leitura. Os livros multissensoriais são capazes de associar imagens, sons e até cheiros para contar uma história. Experimentos iniciais realizados com um livro multissensorial apontam para uma facilitação na absorção do conteúdo lido com o uso dos recursos multissensoriais, como o efeito sonoro. No entanto, um efeito sonoro aplicado de forma inadequada pode causar uma distorção da compreensão do texto no momento da leitura. Os efeitos sonoros também são pouco encontrados em estudos sobre normalização de sons e processamento de palavras. Nesse sentido, este trabalho propõe uma metodologia para o reconhecimento de palavras com estímulos sonoros e escritos. Essa metodologia abrange tanto a normalização de sons, por meio do procedimento de Cloze, quanto a influência de estímulos sonoros no reconhecimento de palavras escritas, por meio do paradigma de Priming Cross-modal. Desse modo, esta pesquisa busca gerar resultados que possam contribuir para os modelos de processamento de palavras escritas com estímulos sonoros. Também busca colaborar com a seleção dos efeitos sonoros na elaboração de um livro multissensorial. Esta pesquisa foi aprovada pelo Comitê de Ética em Pesquisa sob o protocolo 56105922.0.0000.5249.

Dissertação 

Defesa de dissertação (22/11/2022): Felipe Oliveira Feder

Discente: Felipe Oliveira Feder

Título: Estudo comparativo entre abordagens de representação textual e algoritmos de classificação

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (CEFET/RJ), Eduardo Bezerra (CEFET/RJ), Geraldo Xexéo (Coppe/UFRJ)

Dia/hora: 22/11/2022  às 9 horas.

Link da sala: https://teams.microsoft.com/l/meetup-join/19%3af69a8d54c8be438ea6c2b412c3abf30c%40thread.tacv2/1667924812259?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%22d455e339-d958-4321-a959-bda8d1ea2337%22%7d

Resumo: Estamos vivendo uma revolução tecnológica sem precedentes nos últimos anos. A forma como nós nos relacionamos tem sido – e continuará sendo – impactada de diferentes maneiras. Acompanhando as evoluções em hardware e das tecnologias que nos possibilitam produzir e armazenar dados em volumes impensáveis, são observadas, também, evoluções algorítmicas e metodológicas que nos permitem avançar em busca de um mundo inteiramente novo, mesmo lidando com velhas questões tipicamente humanas. A fronteira do entendimento homem-máquina tem sido empurrada adiante constantemente. O processamento de linguagem natural é a ponte que liga a fala humana a possibilidades, antes inimagináveis, de uma máquina interpretá-la e processá-la devidamente. Os meios de representação textual vêm evoluindo consistentemente nas últimas décadas. O Bag-of-Words (BOW), atrelado ao uso de representações numéricas para palavras, vem sendo utilizado com sucesso na representação textual. No entanto, superando as deficiências do BOW, observamos o surgimento de representações numéricas complexas, geradas por redes neurais profundas, que são capazes de conservar as relações semânticas e sintáticas entre as palavras; os Word Embeddings (WE). A fronteira foi empurrada à frente; novas evoluções, novas aplicações, novos usos. O uso de Modelos de Linguagem Neural (MLN), com os WE, atingiu o estado da arte em diferentes tarefas no processamento de texto. Essa pesquisa compara esses dois métodos de representação de palavras, BOW e WE, e seus usos numa tarefa de classificação binária de polaridade. Foram montados dois grupos de classificadores e foram utilizados quatro conjuntos de dados. O primeiro grupo, formado por modelos n-gram, aqui chamados de Modelos de Aprendizagem de Máquina Tradicionais (MAMT), lidou com representações textuais que se serviram do BOW com TF-IDF e do BOW com LSA. O segundo grupo, formado por MLNs, que são modelos provenientes de redes neurais profundas que lidam com tarefas relacionadas ao processamento de texto, usou os WE e os WE Contextuais para representar os textos que seriam processados. Nos experimentos realizados foi observada a superioridade dos modelos de classificação semântica de texto diante dos modelos n-gram. Apesar disso, a escolha sobre qual técnica de representação textual (BOW ou WE) e tipo de modelo de linguagem usar (n-gram ou MLN) depende do contexto, já que os modelos n-gram, mesmo quando comparados as abordagens mais recentes, apresentam desempenho preditivo satisfatório e podem ser úteis em muitos contextos de uso.

Dissertação 

Defesa de dissertação (23/08/2022): Thiago Soares de Paula

Discente: Thiago Soares de Paula

Título: Classificação de Notícias de Fraude e Corrupção em Português para Instauração de Processo Investigativo

Orientador: Gustavo Paiva Guedes e Silva

Data: 23 de agosto de 2022

Resumo: Os escândalos de fraude são fenômenos que podem gerar impactos imensuráveis nas esferas econômicas e reputacionais. Quando uma fraude é descoberta, os fatos normalmente vão a público por meio dos veículos de mídia, o que gera uma repercussão negativa muito grande. As empresas preocupadas com suas imagens têm investido cada vez mais esforços para minimizar ou atenuar os efeitos da fraude. Uma das tarefas que visa mitigar os efeitos da fraude é o monitoramento de mídias sobre fraude e corrupção. Essa tarefa é fundamental para a avaliação e o monitoramento dos riscos do negócio no mundo corporativo, pois a todo momento surgem fatos que podem trazer prejuízos à empresa e suas contrapartes. Uma vez veiculados escândalos de fraude em sites de notícias, os impactos podem gerar consequências negativas `as imagens das empresas. Portanto, essas informações precisam ser coletadas e analisadas e, se necessário, encaminhadas para processo investigativo. No entanto, o grande volume de notícias publicadas por dia inviabiliza uma avaliação manual diária. Este trabalho apresenta uma abordagem que visa automatizar esse processo, o que inclui coletar notícias da web por meio de web crawlers dos principais veículos de mídias do Brasil, construir um corpus anotado em português sobre fraude e corrupção e criar um modelo de aprendizado de máquina cuja função é classificar notícias em relevantes ou não para abertura de investigação.

 

Defesa de dissertação (17/05/2022): Danielle Fontes de Albuquerque

Discente: Danielle Fontes de Albuquerque

Título: Seleção de atributos na Base do CENSO do Ensino Superior Brasileiro para Análise da Evasão

Orientador(es): Rafaelli Coutinho (orientadora) e Diego Brandão (CEFET/RJ) (coorientador)

Banca: Rafaelli Coutinho (presidente),  Diego Brandão (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ), Alessandro Vivas Andrade (UFVJM), Cristiano Maciel (UFMT)

Dia/Hora: 17/05/2022 às 14:30

Sala remota: https://us06web.zoom.us/j/83229649478?pwd=cm90SXRXM1pDN2duWFlLdXlnRjBkUT09 

Resumo: Cada vez mais o setor da educação tem utilizado de seus extensos repositórios de dados para auxiliar na tomada de decisão dentro das Instituções de Ensino Superior (IES). Um dos principais problemas enfrentados por essas instituições é a evasão. Ela consiste em um fenômeno preocupante pois gera prejuízos sociais e econômicos tanto para o estudante quanto para a sociedade. Uma maneira de reduzir os impactos da evasão consiste em identificar quais são as possíveis causas do problema por meio das bases de dados disponíveis nas IES, podendo ser utilizado para isso técnicas da área de Mineração de Dados Educacionais (MDE). A MDE é uma área interdisciplinar que usa técnicas computacionais e estatísticas para compreender o cenário educacional a partir das bases de dados das instituições de ensino. Dentro desta área, a Seleção de Atributos (SA) é um conjunto de técnicas capaz de identificar quais são os atributos mais relevantes em uma base de dados extensa e simplificá-la de forma que seja possível expressar a informação com um volume menor de dados. Com isso, é possível realizar análises de bases de dados menores e mais limpas, o que facilita o entendimento do problema e melhora o desempenho computacional tanto em relação ao tempo de processamento quanto à qualidade do modelo gerado. Ademais, identificar os fatores mais importantes é uma forma de compreender quais são as possíveis causas e consequências do problema. Esse trabalho realiza uma análise comparativa das técnicas de SA em dados educacionais do Censo de Ensino Superior (CES), fornecido pelo governo brasileiro, que reúne informações sobre todos os estudantes de ensino superior do país. O objetivo é identificar quais são as principais fatores envolvidos na evasão no ensino superior e encontrar combinações de técnicas de SA e classificadores que potencializem a qualidade da classificação. Uma nova abordagem para SA também foi proposta com Algoritmo Genético (AG) para permitir maior flexibilidade e especificidade no cenário educacional, chamada FlexAG. Os resultados mostram que os atributos ano de ingresso, atividade extracurricular e financiamento estudantil são os mais importantes para o cenário geral da base do CES. Além disso, as técnicas de SA se mostraram capazes de melhorar as medidas de desempenho de classificação, a redução na quantidade de atributos e o tempo de classificação.

Dissertação 

Defesa de dissertação (26/01/2022): Igor da Silva Morais

Discente: Igor da Silva Morais

Título: Hybrid Approaches to the Two-Stage Facility Location Problem

Orientador(es): Pedro Henrique González Silva (orientador) e Eduardo Bezerra da Silva (CEFET/RJ) (coorientador)

Banca: Pedro Henrique González Silva (presidente),  Eduardo Bezerra da Silva (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Vanessa de Almeida Guimarães (CEFET/RJ), Glaydston Mattos Ribeiro (COPPE/UFRJ)

Dia/Hora: 26/01/2022 às 08:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3a9fe266b1abfc45d0a40451cdf514381c%40thread.tacv2/1642426974546?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2245114d98-ef79-4a71-8ee9-16ae0daf7646%22%7d

Resumo: Na classe de problemas de cadeia de sumprimento, O problema de localização de facilidades em Dois Niveis(PFLC2n) consiste em encontrar localizações ótimas para instalação de fabricas e depositos que atendam a demanda dos clientes. O objetivo do problema é minimizar os custos operacionais de abertura e fluxo, obedecendo as restrições de produção, armazenamento e demanda de clientes . Esse problema pode ser visto como aplicação do contexto de cidades inteligentes, pois cobre os três pilares: governança, energia e transporte. Para resolver o probema duas hibridizações são propostas uma do Clustering Search(CS) com Adaptive Large Neighborhood Search(ALNS) e Local Branching. E com o intuito de comparar e mostrar robustez dos componentes outra hibridização é apresentada usando Biased Random-Key Genetica Algorithm (BRKGA). Para comparação instâncias da literatura foram utilizadas. Os resultados mostram que para o PFLC2n supera o estado da arte atual para 44 de 50 instâncias e a estabilidade é mostrada por meio de uma analise estatística que testa a significancia em comparação aos outros métodos.

Dissertação 

Defesa de dissertação (27/12/2021): Thiago Rangel Pesset Gonzaga

Discente: Thiago Rangel Pesset Gonzaga

Título: MODELAGEM ESTOCÁSTICA DO APRENDIZADO ONLINE DE UMA ESTRUTURA LINEAR ADAPTATIVA IMPLEMENTADA EM BLOCOS

Orientador(es): Diego Barreto Haddad (orientador) e Felipe da Rocha Henriques (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Felipe da Rocha Henriques (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Tadeu Nagashima Ferreira (UFF).

Dia/Hora: 27/12/2021 às 14:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3AAWU0sWZQqcAbmYFqYLCqv91CSvd0jaTXILPSCFcQ9hc1%40thread.tacv2/1639414430868?context=%7B%22Tid%22%3A%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2C%22Oid%22%3A%2202b6b3d1-811f-4650-909a-d2a79310ba31%22%2C%22MessageId%22%3A%221639414430868%22%7D

Resumo: 

Os algoritmos de filtragem adaptativa constituem uma família de técnicas com ampla aplicação em problemas de grande relevância, tais como equalização de canais, cancelamento de eco acústico, cancelamento de ruído, identificação de sistemas e séries temporais. Este trabalho propõe um modelo estocástico capaz de prever as características de aprendizado dos algoritmos LMS e NLMS implementados em blocos. A análise é simplificada por um modelo que divorcia a distribuição radial dos vetores de entrada da distribuição angular, a qual é discretizada. A despeito desta simplificação, o modelo utilizado de sinal de entrada é coerente com a matriz de autocorrelação original dos dados de entrada. A partir desta análise foi possível modelar o comportamento de divergência dos algoritmos estudados,  relacionar o MSE em excesso a quantidade de blocos utilizados e de forma proporcional ao tamanho do filtro. As predições teóricas serão comparadas com curvas de desempenho oriundas de simulação, de modo a aferir a acurácia das estimativas resultantes.

Dissertação 

Defesa de dissertação (15/12/2021): Davi Bortolotti Batista

Discente: Davi Bortolotti Batista

Título: Segmentação Semântica para Interpretação Automática de Estruturas Geológicas Lineares

Orientador(es): Diego Barreto Haddad (orientador) e Gabriel Matos Araujo (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Gabriel Matos Araujo (CEFET/RJ), Douglas de Oliveira Cardoso (CEFET-RJ), Kenji Nose Filho (UFABC), Milena Faria Pinto (CEFET-RJ) e GIlson Antonio Giraldi (LNCC).

Dia/Hora: 15/12/2021 às 14:00

Sala remota: Link do Teams

Resumo:

    A interpretação automática de estruturas geológicas pode agilizar a etapa de trabalho de campo necessária na geotecnia, engenharia civil e na exploração de recursos naturais como petróleo, água e minério, provendo aos geocientistas um maior volume de informações advindas de afloramentos rochosos. Parâmetros geológicos enriquecem e melhoram a capacidade preditiva dos modelos geológicos numéricos e estatísticos. As fraturas geológicas são de grande interesse pois indicam regimes de tensões pretéritos e atualmente ocorrentes na litosfera terrestre, além de serem canais preferenciais de fluidos economicamente importantes.

     Este trabalho propõe uma nova metodologia combinando aprendizado profundo, segmentação semântica e algoritmos clássicos de visão computacional para interpretação de estruturas geológicas lineares de imagens de UAVs (Unmanned Aerial Vehicles).  mostram métricas de Interseção sobre União (IoU) de até 74% para os resultados do modelo treinado antes do pós-processamento, e até 78% depois. A segmentação predita foi usada como máscara para binarização e detecção de linhas para extrair fraturas com precisão. A comparação de direções de strike oriundas da interpretação geológica e oriundas das estruturas extraídas automaticamente exibiu tendências e comportamentos muito similares. Os resultados foram comparados com outras técnicas historicamente usadas na área de geoprocessamento e com anotações manualmente executadas pelos geocientistas, demonstrando precisão maior e visíveis vantagens.

Dissertação 

Defesa de dissertação (26/08/2021): Lucas Giusti Tavares

Discente: Lucas Giusti Tavares

Título: Analyzing Flight Delay Prediction Under Concept Drift

Orientadores: Jorge de Abreu Soares (orientador) e Eduardo Soares Ogasawara (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ) e Antônio Tadeu Azevedo Gomes (LNCC).

Dia/hora: 26 de agosto de 2021, às 13h30.

Sala remota: https://meet.google.com/zow-fgxq-fte

Resumo: Delay is one of the most critical indicators for flight transportation systems. Flight delays impose a challenge that impacts any flight transportation system. In this context, the prediction of delayed flights may be an essential tool for effectively addressing this problem. This dissertation investigates the prediction performance of different drift handling strategies in aviation under different scales. It considers two different scales: system-based (SB) and airport-based (AB). In (SB), all airports in the flight system are considered together. Conversely, in AB, each airport is studied separately. Specifically, this work proposed and answered two research questions: (i) How do drift handling strategies influence the prediction performance of delays?; and (ii) Do different scales change the results of drift handling strategies? It was observed that drift handling strategies are relevant. Their impact varies according to the scales used. The experimental evaluation was done using a dataset that integrates weather and flight data from the Brazilian system. Moreover, the passive and active strategies revealed better recall scores. For f1 scores, the strategies had similar results, with the passive strategy showing slightly better results. It may be related to the high prevalence of drifts. In this case, strategies that always retrain machine learning models offer better results than those that train only once. However, extensive testing is recommended. Nonetheless, choosing machine learning models may have a higher impact on f1 than drift handling strategies.

Dissertação

Defesa de dissertação (28/04/2021): Leonardo Ferreira dos Santos

Discente: Leonardo Ferreira dos Santos

Título: Identificação automática de atividade predatória sexual em conversas virtuais no Brasil

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Eduardo Soares Ogasawara (CEFET/RJ), Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora:  28 de abril de 2021, às 14h.

Sala remota: http://meet.google.com/vtf-bmvn-frp

Resumo:  O uso da internet por crianças e adolescentes possibilita o acesso a um conjunto de oportunidades para o seu autodesenvolvimento. O acesso à informação, material educacional, entretenimento e socialização são algumas das oportunidades que podem ser usufruídas. O uso de redes sociais é um dos principais canais para socialização na internet. Por meio da criação de um perfil público no momento de ingresso à rede social, crianças e adolescentes podem criar conexões com outros perfis e estabelecer comunicação por meio de conversas virtuais. Predadores sexuais, por sua vez, fazem uso de redes sociais com o propósito de ludibriar essas crianças e adolescentes, estabelecendo uma relação enganosa para posterior execução de diversas atividades criminosas, como a obtenção de conteúdo pornográfico, a extorsão e a prática do abuso sexual. Nesse cenário, diversos estudos vêm se concentrando na identificação de predadores sexuais na internet. Embora seja um domínio de pesquisa amplamente explorado, não foram encontrados trabalhos que considerem o estudo de conversas virtuais realizadas na língua portuguesa do Brasil. Diante do problema exposto, a presente pesquisa tem como o principal objetivo propor um método que apresente resultados significativos para a identificação de atividade predatória em conversas textuais realizadas na internet. Para atingir esse objetivo, foi considerado como base de estudos um conjunto de 82 conversas predatórias anonimizadas e oriundas de provas criminais presentes em processos judiciais. Após a análise das conversas predatórias, um total de dezenove características textuais e comportamentais foram identificadas e consideradas para a criação de um método para detecção de atividade predatória em conversas textuais denominado MDAP. Para a validação do método, foi criado um conjunto de dados com características similares as da competição PAN-2012, utilizando como base as 82 conversas predatórias. Os resultados obtidos, quando comparados aos métodos candidatos ao estado da arte para o domínio da pesquisa, comprovam a eficiência do método MDAP para a identificação de atividade predatória em conversas textuais, se apresentando como uma alternativa para promoção de um ambiente virtual mais seguro para crianças e adolescentes.

Dissertação

Defesa de dissertação (28/04/2021): Rodolpho da Silva Nascimento

Discente: Rodolpho da Silva Nascimento

Título: Uma Análise Comparativa Entre Léxicos Afetivos em Português

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (presidente), Kele Teixeira Belloze (CEFET/RJ), Raimundo Santos Moura (UFPI)

Dia/Hora:  28 de abril de 2021, às 10h.

Sala remota: http://meet.google.com/iir-fyjz-sum

Resumo:  A Computação Afetiva é uma área de pesquisa que estuda o uso de técnicas que objetivam habilitar um computador, tornando-o capaz de reconhecer emoções por meio da análise e interpretação de dados. Dentro dessa área destaca-se a Análise de Sentimentos (AS), que corresponde a um campo de pesquisa que emprega ferramentas automáticas capazes de extrair informações subjetivas em textos, como opiniões e sentimentos. Existem trabalhos em AS que utilizam Léxicos Afetivos (LA) atuando como apoio aos algoritmos de aprendizagem de máquina, ou como componente principal. Um LA é uma coleção de palavras que capturam o conhecimento que falantes e ouvintes têm sobre expressões lexicais básicas, formando um conjunto de palavras pertencentes ao contexto dos sentimentos humanos. Todavia, poucos trabalhos abordam a utilização de LA na língua portuguesa. Esta pesquisa tem como objetivo realizar uma investigação dos LA disponíveis em português e avaliar suas contribuições em AS. Nesta vertente, pretende-se fornecer recursos para que trabalhos futuros sejam capazes de elaborar novos LA em português ou aprimorar os já existentes. Também pretende-se com esta pesquisa, ser um referencial para melhor escolha de LA em português, auxiliando trabalhos relacionados e contribuindo para melhores resultados em tarefas de AS em português.

Dissertação

Defesa de dissertação (05/03/2021): Antonio Jose de Castro Filho

Discente: Antonio Jose de Castro Filho

Título: Mineração de Sequências Restritas no Espaço e no Tempo

Orientadores: Rafaelli Coutinho (orientador) e Eduardo Ogasawara (coorientador)

Banca: Rafaelli Coutinho (presidente), Eduardo Ogasawara (CEFET/RJ), Jorge Soares (CEFET/RJ), Esther Pacitti (INRIA)

Dia/Hora: 05 de março de 2021, às 10h.

Sala remota: meet.google.com/eck-qenz-vap

Resumo: Os padrões espaço-temporais trazem conhecimento sobre o tempo e a posição onde eles estão presentes. Encontrá-los é uma tarefa importante para diferentes domínios. No entanto, nem todos os padrões são frequentes por todo um conjunto de dados, eles podem ocorrer restritos no espaço e no tempo. A mineração desses padrões tem como objetivo descobrir a faixa de tempo e o conjunto de posições espaciais em que as sequências de eventos são frequentes. Este trabalho propõe o algoritmo Generalized Spatial-Time Sequence Miner (G-STSM) como uma solução para a descoberta de sequências frequentes que são restritas no espaço e no tempo, trazendo a formalização do problema, definições, provas e algoritmos. Até onde se sabe, após busca na literatura relacionada, o G-STSM é a primeira abordagem capaz de encontrar tais sequências trabalhando com uma dimensão de tempo e três dimensões de espaço. O G-STSM foi comparado com uma abordagem intuitiva que busca sequências de eventos frequentes com suporte muito baixo e agrupa suas ocorrências para encontrar padrões restritos no espaço e no tempo usando algoritmos conhecidos. Foi escolhido um conjunto de dados sísmicos espaço-temporal do mundo real para comparar ambas as abordagens usando métricas de classificação e registro de uso de recursos. Como resultado, o G-STSM apresentou melhor desempenho computacional com qualidade semelhante mostrando-se uma ferramenta de mineração de dados eficiente para encontrar sequências restritas no espaço e no tempo.

Dissertação