Archive | Defesas de orientandos RSS for this section

Defesa de dissertação (19/12/2024): Tarsila Gomes Bello Tavares

Título: 
Imputação em cascata no contexto de Inteligência Artificial Centrada em Dados (DCAI).
Orientador: 
Jorge de Abreu Soares
Banca:
Jorge de Abreu Soares (Cefet/RJ), Diego Nunes Brandão (Cefet/RJ), Carlos Eduardo Ribeiro de Mello (Unirio)
Dia/hora:
19 de dezembro de 2024, às 14h.
Local:  
Bloco E, 5o andar, sala E-518
Resumo: 
À medida que o volume global de dados aumenta, é comum encontrar bases de dados com valores ausentes, o que requer a aplicação de técnicas de imputação. Tradicionalmente, estas técnicas abordam cenários univariados, tratando a ausência de valores em uma única coluna. Este estudo propõe uma abordagem de imputação em cascata, que é capaz de tratar valores ausentes em múltiplas colunas, reintegrando valores imputados na base de dados antes da imputação do atributo subsequente, permitindo sua reutilização. Adicionalmente, investigou-se a eventual melhoria da eficiência da imputação pela binarização dos dados, segundo padrões de similaridade de ausência antes da imputação, e quais algoritmos de agrupamento apresentam resultados mais interessantes para diferentes características de bases de dados. Portanto, almeja-se avaliar e comparar o desempenho de uma imputação multivariada que utiliza a abordagem em cascata com uma pré-fase de agrupamento, aplicando diferentes classes de algoritmos dessa natureza, tais como K-modes, Agglomerative Clustering, DBSCAN e a rede neural SOM.
Abstract: 
As the global volume of data increases, it is common to encounter datasets with missing values, demanding the application of imputation techniques. Traditionally, these methods address univariate scenarios, dealing with the absence of values in a single column. This study proposes a cascade imputation approach, capable of handling missing values across multiple columns, reintegrating imputed values into the database before imputing the subsequent attribute, allowing for their reuse. Additionally, the study investigated the potential improvement in imputation efficiency by binarizing data according to patterns of similarity in absence before imputation and identifying which clustering algorithms yield the most interesting results for different dataset characteristics. Therefore, the aim is to evaluate and compare the performance of multivariate imputation using the cascade approach with a pre-clustering phase, applying various classes of algorithms, such as K-modes, Agglomerative Clustering, DBSCAN, and the SOM neural network.

Defesa de dissertação (15/09/2023): Renata Fonseca da Silva

Título: O uso de Jogos Educacionais e Sistemas Tutores Inteligentes como ferramentas no combate às Fake News: Uma Revisão Sistemática de Literatura

Orientadores: Jorge de Abreu Soares e Ronaldo Ribeiro Goldschmidt

Banca: Jorge de Abreu Soares (Cefet/RJ), Ronaldo Ribeiro Goldschmidt (IME), Joel André Fereira dos Santos (Cefet/RJ), Paulo Marcio Souza Freire (IME)

Dia/hora: 15 de setembro de 2023, às 9h.

Local:  Cefet/RJ – Unidade Maracanã, Bloco E, sala E-520

Resumo: As Fake News cresceram em volume e compartilhamento, de forma absurda nos últimos tempos. Este fato, deu-se pela evolução das mídias sociais e o acesso a internet. Todavia, o número de Fake News compartilhadas na internet sem uma análise crítica das informações, tem ocorrido sem precedentes. Ressalta-se que práticas de Alfabetização Midiática e Informacional, vêm senmdo adotadas no combate às Fake News. Nesse contexto, os Jogos Educacionais e Sistemas Tutores Inteligentes, têm obtido êxito para capacitar pessoas a reconhecerem esses tipos de notícias. O objetivo deste estudo é identificar e analisar os métodos e características descritos e implementados por projetos de Jogos Educacionais e Sistemas Tutores Inteligentes, ferramentas de Alfabetização Midiática e Informacional mais utilizadas durante o processo educativo para identificação de Fake News. Para isso, foi utilizada a metodologia de Revisão Sistemática de Literatura, onde foi possível observar, por exemplo, que cerca de 94\% das ferramentas desenvolvidas correspondiam a Jogos Educacionais e, apenas três estavam disponibilizadas em língua portuguesa. Concluiu-se também que, houve um decréscimo no número de estudos publicados que envolviam o uso dessas ferramentas no combate às Fake News.

Defesa de dissertação (14/09/2023): Uriel Merola Minagé e Silva

Título: Métodos de detecção de fake news: Comparativo entre abordagens crowd signals e métodos de comitê

Orientadores: Jorge de Abreu Soares e Ronaldo Ribeiro Goldschmidt

Banca: Jorge de Abreu Soares (Cefet/RJ), Ronaldo Ribeiro Goldschmidt (IME), Eduardo Bezerra da Silva (Cefet/RJ), Paulo Marcio Souza Freire (IME)

Dia/hora: 14 de setembro de 2023, às 10h30.

Local:  Cefet/RJ – Unidade Maracanã, Bloco E, sala E-520

Resumo: O aumento significativo da disseminação de Fake News, deve-se à facilidade de criação e consumo de informações nas redes sociais. Várias abordagens baseadas em aprendizado de máquina (AM) foram propostas para detectar e combater esse tipo de informação maliciosa. Entre as principais abordagens para detectar fake news existe uma baseada em Hybrid Crowd Signals (HCS). Para identificar informações falsas, esta abordagem combina sinais (i.e opiniões sobre se a informação é falsa ou não) coletados tanto dos usuários de redes sociais quanto de classificadores de AM. Embora promissora, até onde pudemos observar, a HCS emprega um método ingênuo (Naive Bayes) para combinar os sinais e inferir quais notícias são falsas. Assim, o presente trabalho levanta a hipótese de que métodos ensemble aplicados para combinar as opiniões fornecidas pelos classificadores de AM usados na HCS e as opiniões implícitas dos usuários fornecidas nas redes sociais, podem resultar em modelos de classificação com melhor desempenho. Os experimentos conduzidos neste trabalho fornecem indícios da validade da hipótese levantada.

Defesa de exame de qualificação (12/09/2022): Uriel Merola Minagé e Silva

Discente: Uriel Merola Minagé e Silva

Título: Métodos de detecção de fake news: Comparativo entre abordagens crowd signals e métodos de comitê.

Orientadores:  Jorge de Abreu Soares (orientador) e Ronaldo Ribeiro Goldschmidt (IME) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Ronaldo Ribeiro Goldschmidt (IME), Eduardo Bezerra da Silva (CEFET/RJ).

Dia/hora: 12 de setembro de 2022, às 10h.

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3ade224d8a5b16403caafc5717b81c6698%40thread.tacv2/1660587330416?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%225109019a-ba61-49cb-8b5c-0831e81fb79d%22%7d

Resumo:

Com o desenvolvimento de tecnologias móveis e conectividade crescente, as informações são compartilhadas de forma extremamente rápida em diversos meios de divulgação. Um deles são as redes sociais, que, além do grande poder de compartilhamento, possuem ferramentas de criação de conteúdo de diferentes formatos, criando um ambiente extremamente favorável para disseminação de notícias falsas conhecidas como Fake News. Este trabalho propõe a elaboração de um método de detecção de fake news baseado em comitê de classificadores, utilizando os métodos: bagging, boosting e stacked generalization, almejando a obtenção de desempenho equiparável ou superior aos métodos de classificação que utilizam crowd signals explícitos e implícitos para detecção de fake news.

Defesa de exame de qualificação (20/09/2022): Renata Fonseca da Silva

Discente: Renata Fonseca da Silva

Título: Tutoria Inteligente em JED para a Capacitação Discente na Identificação de Fake News

Orientadores:  Jorge de Abreu Soares (orientador) e Ronaldo Ribeiro Goldschmidt (IME) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Ronaldo Ribeiro Goldschmidt (IME), Joel André Ferreira dos Santos (CEFET/RJ).

Dia/hora: 20 de setembro de 2022, às 11h.

Sala remota: https://teams.microsoft.com/l/message/19:efda9fbbd5ec42a3afa29c3cef32629b@thread.tacv2/1659984448007?tenantId=8eeca404-a47d-4555-a2d4-0f3619041c9c&groupId=824346f1-c04b-4a35-a4a3-950cbb06d839&parentMessageId=1659984448007&teamName=PPCIC%20-%20Defesas&channelName=Qualifica%C3%A7%C3%A3o%2022.09.20%20-%20Renata%20Fonseca&createdTime=1659984448007

Resumo:

Diariamente, um grande volume de informações é compartilhado, em todo o mundo, sem quaisquer cuidados em relação a veracidade de seu conteúdo. O presente trabalho visa corroborar para melhoria da capacitação discente na identificação de Fake News. Para tanto foi realizado uma busca sistemática acerca dos trabalhos que utilizam Jogos Educacionais Digitais, criados para auxiliar no combate as Fake News, e com base nas lacunas encontradas, sugere a criação de um Sistema Tutor Inteligente, que empreende uma análise semântica da notícia, considerando os sentimentos e a classe gramatical presentes nesta, a fim de fornecer feedbacks, em associação ao Jogo da Trilha, capazes de mitigar os efeitos causados pela disseminação das Fake News.

Defesa de dissertação (26/08/2021): Lucas Giusti Tavares

Discente: Lucas Giusti Tavares

Título: Analyzing Flight Delay Prediction Under Concept Drift

Orientadores:  Jorge de Abreu Soares (orientador) e Eduardo Soares Ogasawara (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ) e Antônio Tadeu Azevedo Gomes (LNCC)

Dia/hora: 26 de agosto de 2021, às 13h30.

Sala remota: https://meet.google.com/zow-fgxq-fte

Resumo (Abstract):

Delay is one of the most critical indicators for flight transportation systems. Flight delays impose a challenge that impacts any flight transportation system. In this context, the prediction of delayed flights may be an essential tool for effectively addressing this problem. This dissertation investigates the prediction performance of different drift handling strategies in aviation under different scales. It considers two different scales: \textit{system-based} (SB) and \textit{airport-based} (AB). In (SB), all airports in the flight system are considered together.
Conversely, in AB, each airport is studied separately. Specifically, this work proposed and answered two research questions: (i) How do drift handling strategies influence the prediction performance of delays?; and (ii) Do different scales change the results of drift handling strategies? It was observed that drift handling strategies are relevant. Their impact varies according to the scales used. The experimental evaluation was done using a dataset that integrates weather and flight data from the Brazilian system.
Moreover, the passive and active strategies revealed better recall scores. For f1 scores, the strategies had similar results, with the passive strategy showing slightly better results. It may be related to the high prevalence of drifts. In this case, strategies that always retrain machine learning models offer better results than those that train only once. However, extensive testing is recommended. Nonetheless, choosing machine learning models may have a higher impact on f1 than drift handling strategies.

Defesa de dissertação (29/01/2021): Leandro Maia Gonçalves

Defesa de dissertação (29/01/2021): Leandro Maia Gonçalves

Discente: Leandro Maia Gonçalves

Título: Imputação Hot-Deck: uma revisão sistemática da literatura

Orientador:  Jorge de Abreu Soares

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ) e José Maria da Silva Monteiro Filho (UFC)

Dia/hora: 29 de janeiro de 2021, às 10h.

Sala remota: https://meet.google.com/mkz-opya-skv

Defesa de exame de qualificação (20/08/2020): Lucas Giusti Tavares

Discente: Lucas Giusti Tavares

Título: Flight Delay Prediction with Concept Drift: A Study of the Brazilian Flight Systems

Orientadores:  Jorge de Abreu Soares (orientador) e Eduardo Soares Ogasawara (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ) e Antônio Tadeu Azevedo Gomes (LNCC)

Dia/hora: 20 de agosto de 2020, às 10h.

Sala remota: meet.google.com/jbq-cdip-syi

Resumo:

Flight delays impose challenges that impacts any flight transportation system. The prediction of flight delays may be an important tool for handling effectively with this problem. However, the behavior of flight delay system varies through time. This phenomenon is known as concept drift. The objective of this paper is to perform an analysis of concept drift in flight delay prediction of the Brazilian flight system. We evaluated it in the Brazilian flight system under different scales and time intervals. Many different drift handling techniques and classifiers models were studied. It was possible to observe that variance method may show less sensitivity to drifts. Moreover, the passive method showed slightly better results then active drift-dealing methods.

 

Defesa de dissertação (14/08/2020): Thiago da Silva Pereira

Defesa de dissertação (14/08/2020): Thiago da Silva Pereira

Discente: Thiago da Silva Pereira

Título: Imputação de dados hot-deck: uma comparação entre comitês de regressão (Hot-Deck Data Imputation: a comparison among ensemble methods)

Orientadores:  Jorge de Abreu Soares (orientador) e Eduardo Bezerra da Silva (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ) e Ronaldo Ribeiro Goldschmidt (IME)

Dia/hora: 14 de agosto de 2020, às 15h.

Sala remota: meet.google.com/mtr-vmkq-wrw

Resumo:

O problema da ausência de dados em conjuntos de dados é relevante e dentre as maneiras de se lidar com este problema, a substituição do valor ausente por outro (também chamada de imputação de dados) produz um ganho substancial no aprendizado de máquina subsequente. Diversos algoritmos de aprendizado de máquina são estudados para a imputação de dados, porém poucos estudos utilizam métodos ensemble para a geração do dado a ser imputado. Este trabalho pretende realizar uma comparação entre diversos métodos ensemble (bagging, adaboost, gradientboost e stacked generalization) para imputação de dados, executando as simulações em três conjuntos de dados diferentes (AIDS Deaths – National Health and Family Planning Commission of China, Breast Cancer e Photometric redshift estimation) com 10%, 20% e 30% de dados ausentes, combinando a execução das tarefas de agrupamento e redução de dimensionalidade com percentuais de redução de 10%, 20% e 30% antes da imputação.

Abstract:

Preprocessing data faces an important question related to deal with missing data. A possible solution to resolve this challenge is hot-deck imputation. This technique has two steps: group similar records and performs imputation. Selecting the best algorithm for imputation is a challenge. Several machine learning algorithms are studied for data imputation, however few studies compare ensemble methods for the imputation stage. This study proposes a solution based on hot-deck imputation comparing four ensemble regressors: Bagging, Adaboost, Gradientboost, and Stacked Generalization. To ascertain effectiveness, we have used three datasets, varying missing rates from 10% to 30%. Results measuring the precision of imputed data by both techniques indicate that the Gradientboost reveals better precision in reasonable processing time.