Categoria:Defesas

Defesa de dissertação (17/05/2022): Danielle Fontes de Albuquerque

Discente: Danielle Fontes de Albuquerque

Título: Seleção de atributos na Base do CENSO do Ensino Superior Brasileiro para Análise da Evasão

Orientador(es): Rafaelli Coutinho (orientadora) e Diego Brandão (CEFET/RJ) (coorientador)

Banca: Rafaelli Coutinho (presidente),  Diego Brandão (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ), Alessandro Vivas Andrade (UFVJM), Cristiano Maciel (UFMT)

Dia/Hora: 17/05/2022 às 14:30

Sala remota: https://us06web.zoom.us/j/83229649478?pwd=cm90SXRXM1pDN2duWFlLdXlnRjBkUT09 

Resumo: Cada vez mais o setor da educação tem utilizado de seus extensos repositórios de dados para auxiliar na tomada de decisão dentro das Instituções de Ensino Superior (IES). Um dos principais problemas enfrentados por essas instituições é a evasão. Ela consiste em um fenômeno preocupante pois gera prejuízos sociais e econômicos tanto para o estudante quanto para a sociedade. Uma maneira de reduzir os impactos da evasão consiste em identificar quais são as possíveis causas do problema por meio das bases de dados disponíveis nas IES, podendo ser utilizado para isso técnicas da área de Mineração de Dados Educacionais (MDE). A MDE é uma área interdisciplinar que usa técnicas computacionais e estatísticas para compreender o cenário educacional a partir das bases de dados das instituições de ensino. Dentro desta área, a Seleção de Atributos (SA) é um conjunto de técnicas capaz de identificar quais são os atributos mais relevantes em uma base de dados extensa e simplificá-la de forma que seja possível expressar a informação com um volume menor de dados. Com isso, é possível realizar análises de bases de dados menores e mais limpas, o que facilita o entendimento do problema e melhora o desempenho computacional tanto em relação ao tempo de processamento quanto à qualidade do modelo gerado. Ademais, identificar os fatores mais importantes é uma forma de compreender quais são as possíveis causas e consequências do problema. Esse trabalho realiza uma análise comparativa das técnicas de SA em dados educacionais do Censo de Ensino Superior (CES), fornecido pelo governo brasileiro, que reúne informações sobre todos os estudantes de ensino superior do país. O objetivo é identificar quais são as principais fatores envolvidos na evasão no ensino superior e encontrar combinações de técnicas de SA e classificadores que potencializem a qualidade da classificação. Uma nova abordagem para SA também foi proposta com Algoritmo Genético (AG) para permitir maior flexibilidade e especificidade no cenário educacional, chamada FlexAG. Os resultados mostram que os atributos ano de ingresso, atividade extracurricular e financiamento estudantil são os mais importantes para o cenário geral da base do CES. Além disso, as técnicas de SA se mostraram capazes de melhorar as medidas de desempenho de classificação, a redução na quantidade de atributos e o tempo de classificação.

Dissertação 

Defesa de dissertação (26/01/2022): Igor da Silva Morais

Discente: Igor da Silva Morais

Título: Hybrid Approaches to the Two-Stage Facility Location Problem

Orientador(es): Pedro Henrique González Silva (orientador) e Eduardo Bezerra da Silva (CEFET/RJ) (coorientador)

Banca: Pedro Henrique González Silva (presidente),  Eduardo Bezerra da Silva (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Vanessa de Almeida Guimarães (CEFET/RJ), Glaydston Mattos Ribeiro (COPPE/UFRJ)

Dia/Hora: 26/01/2022 às 08:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3a9fe266b1abfc45d0a40451cdf514381c%40thread.tacv2/1642426974546?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2245114d98-ef79-4a71-8ee9-16ae0daf7646%22%7d

Resumo: Na classe de problemas de cadeia de sumprimento, O problema de localização de facilidades em Dois Niveis(PFLC2n) consiste em encontrar localizações ótimas para instalação de fabricas e depositos que atendam a demanda dos clientes. O objetivo do problema é minimizar os custos operacionais de abertura e fluxo, obedecendo as restrições de produção, armazenamento e demanda de clientes . Esse problema pode ser visto como aplicação do contexto de cidades inteligentes, pois cobre os três pilares: governança, energia e transporte. Para resolver o probema duas hibridizações são propostas uma do Clustering Search(CS) com Adaptive Large Neighborhood Search(ALNS) e Local Branching. E com o intuito de comparar e mostrar robustez dos componentes outra hibridização é apresentada usando Biased Random-Key Genetica Algorithm (BRKGA). Para comparação instâncias da literatura foram utilizadas. Os resultados mostram que para o PFLC2n supera o estado da arte atual para 44 de 50 instâncias e a estabilidade é mostrada por meio de uma analise estatística que testa a significancia em comparação aos outros métodos.

Dissertação 

Defesa de dissertação (27/12/2021): Thiago Rangel Pesset Gonzaga

Discente: Thiago Rangel Pesset Gonzaga

Título: MODELAGEM ESTOCÁSTICA DO APRENDIZADO ONLINE DE UMA ESTRUTURA LINEAR ADAPTATIVA IMPLEMENTADA EM BLOCOS

Orientador(es): Diego Barreto Haddad (orientador) e Felipe da Rocha Henriques (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Felipe da Rocha Henriques (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Tadeu Nagashima Ferreira (UFF).

Dia/Hora: 27/12/2021 às 14:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3AAWU0sWZQqcAbmYFqYLCqv91CSvd0jaTXILPSCFcQ9hc1%40thread.tacv2/1639414430868?context=%7B%22Tid%22%3A%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2C%22Oid%22%3A%2202b6b3d1-811f-4650-909a-d2a79310ba31%22%2C%22MessageId%22%3A%221639414430868%22%7D

Resumo: 

Os algoritmos de filtragem adaptativa constituem uma família de técnicas com ampla aplicação em problemas de grande relevância, tais como equalização de canais, cancelamento de eco acústico, cancelamento de ruído, identificação de sistemas e séries temporais. Este trabalho propõe um modelo estocástico capaz de prever as características de aprendizado dos algoritmos LMS e NLMS implementados em blocos. A análise é simplificada por um modelo que divorcia a distribuição radial dos vetores de entrada da distribuição angular, a qual é discretizada. A despeito desta simplificação, o modelo utilizado de sinal de entrada é coerente com a matriz de autocorrelação original dos dados de entrada. A partir desta análise foi possível modelar o comportamento de divergência dos algoritmos estudados,  relacionar o MSE em excesso a quantidade de blocos utilizados e de forma proporcional ao tamanho do filtro. As predições teóricas serão comparadas com curvas de desempenho oriundas de simulação, de modo a aferir a acurácia das estimativas resultantes.

Dissertação 

Defesa de dissertação (15/12/2021): Davi Bortolotti Batista

Discente: Davi Bortolotti Batista

Título: Segmentação Semântica para Interpretação Automática de Estruturas Geológicas Lineares

Orientador(es): Diego Barreto Haddad (orientador) e Gabriel Matos Araujo (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Gabriel Matos Araujo (CEFET/RJ), Douglas de Oliveira Cardoso (CEFET-RJ), Kenji Nose Filho (UFABC), Milena Faria Pinto (CEFET-RJ) e GIlson Antonio Giraldi (LNCC).

Dia/Hora: 15/12/2021 às 14:00

Sala remota: Link do Teams

Resumo:

    A interpretação automática de estruturas geológicas pode agilizar a etapa de trabalho de campo necessária na geotecnia, engenharia civil e na exploração de recursos naturais como petróleo, água e minério, provendo aos geocientistas um maior volume de informações advindas de afloramentos rochosos. Parâmetros geológicos enriquecem e melhoram a capacidade preditiva dos modelos geológicos numéricos e estatísticos. As fraturas geológicas são de grande interesse pois indicam regimes de tensões pretéritos e atualmente ocorrentes na litosfera terrestre, além de serem canais preferenciais de fluidos economicamente importantes.

     Este trabalho propõe uma nova metodologia combinando aprendizado profundo, segmentação semântica e algoritmos clássicos de visão computacional para interpretação de estruturas geológicas lineares de imagens de UAVs (Unmanned Aerial Vehicles).  mostram métricas de Interseção sobre União (IoU) de até 74% para os resultados do modelo treinado antes do pós-processamento, e até 78% depois. A segmentação predita foi usada como máscara para binarização e detecção de linhas para extrair fraturas com precisão. A comparação de direções de strike oriundas da interpretação geológica e oriundas das estruturas extraídas automaticamente exibiu tendências e comportamentos muito similares. Os resultados foram comparados com outras técnicas historicamente usadas na área de geoprocessamento e com anotações manualmente executadas pelos geocientistas, demonstrando precisão maior e visíveis vantagens.

Dissertação 

Defesa de dissertação (26/08/2021): Lucas Giusti Tavares

Discente: Lucas Giusti Tavares

Título: Analyzing Flight Delay Prediction Under Concept Drift

Orientadores: Jorge de Abreu Soares (orientador) e Eduardo Soares Ogasawara (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ) e Antônio Tadeu Azevedo Gomes (LNCC).

Dia/hora: 26 de agosto de 2021, às 13h30.

Sala remota: https://meet.google.com/zow-fgxq-fte

Resumo: Delay is one of the most critical indicators for flight transportation systems. Flight delays impose a challenge that impacts any flight transportation system. In this context, the prediction of delayed flights may be an essential tool for effectively addressing this problem. This dissertation investigates the prediction performance of different drift handling strategies in aviation under different scales. It considers two different scales: system-based (SB) and airport-based (AB). In (SB), all airports in the flight system are considered together. Conversely, in AB, each airport is studied separately. Specifically, this work proposed and answered two research questions: (i) How do drift handling strategies influence the prediction performance of delays?; and (ii) Do different scales change the results of drift handling strategies? It was observed that drift handling strategies are relevant. Their impact varies according to the scales used. The experimental evaluation was done using a dataset that integrates weather and flight data from the Brazilian system. Moreover, the passive and active strategies revealed better recall scores. For f1 scores, the strategies had similar results, with the passive strategy showing slightly better results. It may be related to the high prevalence of drifts. In this case, strategies that always retrain machine learning models offer better results than those that train only once. However, extensive testing is recommended. Nonetheless, choosing machine learning models may have a higher impact on f1 than drift handling strategies.

Dissertação

Defesa de dissertação (28/04/2021): Leonardo Ferreira dos Santos

Discente: Leonardo Ferreira dos Santos

Título: Identificação automática de atividade predatória sexual em conversas virtuais no Brasil

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Eduardo Soares Ogasawara (CEFET/RJ), Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora:  28 de abril de 2021, às 14h.

Sala remota: http://meet.google.com/vtf-bmvn-frp

Resumo:  O uso da internet por crianças e adolescentes possibilita o acesso a um conjunto de oportunidades para o seu autodesenvolvimento. O acesso à informação, material educacional, entretenimento e socialização são algumas das oportunidades que podem ser usufruídas. O uso de redes sociais é um dos principais canais para socialização na internet. Por meio da criação de um perfil público no momento de ingresso à rede social, crianças e adolescentes podem criar conexões com outros perfis e estabelecer comunicação por meio de conversas virtuais. Predadores sexuais, por sua vez, fazem uso de redes sociais com o propósito de ludibriar essas crianças e adolescentes, estabelecendo uma relação enganosa para posterior execução de diversas atividades criminosas, como a obtenção de conteúdo pornográfico, a extorsão e a prática do abuso sexual. Nesse cenário, diversos estudos vêm se concentrando na identificação de predadores sexuais na internet. Embora seja um domínio de pesquisa amplamente explorado, não foram encontrados trabalhos que considerem o estudo de conversas virtuais realizadas na língua portuguesa do Brasil. Diante do problema exposto, a presente pesquisa tem como o principal objetivo propor um método que apresente resultados significativos para a identificação de atividade predatória em conversas textuais realizadas na internet. Para atingir esse objetivo, foi considerado como base de estudos um conjunto de 82 conversas predatórias anonimizadas e oriundas de provas criminais presentes em processos judiciais. Após a análise das conversas predatórias, um total de dezenove características textuais e comportamentais foram identificadas e consideradas para a criação de um método para detecção de atividade predatória em conversas textuais denominado MDAP. Para a validação do método, foi criado um conjunto de dados com características similares as da competição PAN-2012, utilizando como base as 82 conversas predatórias. Os resultados obtidos, quando comparados aos métodos candidatos ao estado da arte para o domínio da pesquisa, comprovam a eficiência do método MDAP para a identificação de atividade predatória em conversas textuais, se apresentando como uma alternativa para promoção de um ambiente virtual mais seguro para crianças e adolescentes.

Dissertação

Defesa de dissertação (28/04/2021): Rodolpho da Silva Nascimento

Discente: Rodolpho da Silva Nascimento

Título: Uma Análise Comparativa Entre Léxicos Afetivos em Português

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (presidente), Kele Teixeira Belloze (CEFET/RJ), Raimundo Santos Moura (UFPI)

Dia/Hora:  28 de abril de 2021, às 10h.

Sala remota: http://meet.google.com/iir-fyjz-sum

Resumo:  A Computação Afetiva é uma área de pesquisa que estuda o uso de técnicas que objetivam habilitar um computador, tornando-o capaz de reconhecer emoções por meio da análise e interpretação de dados. Dentro dessa área destaca-se a Análise de Sentimentos (AS), que corresponde a um campo de pesquisa que emprega ferramentas automáticas capazes de extrair informações subjetivas em textos, como opiniões e sentimentos. Existem trabalhos em AS que utilizam Léxicos Afetivos (LA) atuando como apoio aos algoritmos de aprendizagem de máquina, ou como componente principal. Um LA é uma coleção de palavras que capturam o conhecimento que falantes e ouvintes têm sobre expressões lexicais básicas, formando um conjunto de palavras pertencentes ao contexto dos sentimentos humanos. Todavia, poucos trabalhos abordam a utilização de LA na língua portuguesa. Esta pesquisa tem como objetivo realizar uma investigação dos LA disponíveis em português e avaliar suas contribuições em AS. Nesta vertente, pretende-se fornecer recursos para que trabalhos futuros sejam capazes de elaborar novos LA em português ou aprimorar os já existentes. Também pretende-se com esta pesquisa, ser um referencial para melhor escolha de LA em português, auxiliando trabalhos relacionados e contribuindo para melhores resultados em tarefas de AS em português.

Dissertação

Defesa de dissertação (05/03/2021): Antonio Jose de Castro Filho

Discente: Antonio Jose de Castro Filho

Título: Mineração de Sequências Restritas no Espaço e no Tempo

Orientadores: Rafaelli Coutinho (orientador) e Eduardo Ogasawara (coorientador)

Banca: Rafaelli Coutinho (presidente), Eduardo Ogasawara (CEFET/RJ), Jorge Soares (CEFET/RJ), Esther Pacitti (INRIA)

Dia/Hora: 05 de março de 2021, às 10h.

Sala remota: meet.google.com/eck-qenz-vap

Resumo: Os padrões espaço-temporais trazem conhecimento sobre o tempo e a posição onde eles estão presentes. Encontrá-los é uma tarefa importante para diferentes domínios. No entanto, nem todos os padrões são frequentes por todo um conjunto de dados, eles podem ocorrer restritos no espaço e no tempo. A mineração desses padrões tem como objetivo descobrir a faixa de tempo e o conjunto de posições espaciais em que as sequências de eventos são frequentes. Este trabalho propõe o algoritmo Generalized Spatial-Time Sequence Miner (G-STSM) como uma solução para a descoberta de sequências frequentes que são restritas no espaço e no tempo, trazendo a formalização do problema, definições, provas e algoritmos. Até onde se sabe, após busca na literatura relacionada, o G-STSM é a primeira abordagem capaz de encontrar tais sequências trabalhando com uma dimensão de tempo e três dimensões de espaço. O G-STSM foi comparado com uma abordagem intuitiva que busca sequências de eventos frequentes com suporte muito baixo e agrupa suas ocorrências para encontrar padrões restritos no espaço e no tempo usando algoritmos conhecidos. Foi escolhido um conjunto de dados sísmicos espaço-temporal do mundo real para comparar ambas as abordagens usando métricas de classificação e registro de uso de recursos. Como resultado, o G-STSM apresentou melhor desempenho computacional com qualidade semelhante mostrando-se uma ferramenta de mineração de dados eficiente para encontrar sequências restritas no espaço e no tempo.

Dissertação

Defesa de dissertação (29/01/2021): Leandro Maia Gonçalves

Discente: Leandro Maia Gonçalves

Título: Imputação Hot-Deck: uma revisão sistemática da literatura

Orientador: Jorge de Abreu Soares

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ) e José Maria da Silva Monteiro Filho (UFC)

Dia/hora: 29 de janeiro de 2021, às 10h.

Sala remota: https://meet.google.com/mkz-opya-skv

Resumo: As organizações têm percebido que investir na transformação de dados em informação com o objetivo de auxiliar o processo de tomada de decisões pode trazer vantagens competitivas. À vista disso, no cenário atual em que os dados crescem em volume, velocidade e variedade, nota-se que tal expansão é acompanhada do aumento de dados ausentes, que podem trazer problemas de interpretação para analistas e pesquisadores. A exclusão destes casos não pode necessariamente ser considerada uma solução, independente do volume dos dados, devido aos seus riscos de geração de vieses ou tendências. Logo, a imputação de dados revela-se uma tarefa fundamental no pré-processamento de dados, capaz de melhorar a sua análise. A imputação hot-deck é uma abordagem que se destaca neste contexto devido à sua capacidade de estimar com melhor precisão e preservar as diferenças individuais entre os sujeitos no processo de imputação. Neste estudo, é apresentada uma revisão sistemática sobre técnicas de imputação hot-deck realizada na base Scopus, com o objetivo de avaliar como ocorre a evolução dos estudos sobre este tema ao longo dos anos. Este trabalho também propõe uma taxonomia que busca classificar, ordenar e estabelecer hierarquias para as técnicas de imputação. Como resultado deste trabalho, verificou-se 63% dos artigos investigados não identificaram adequadamente os mecanismos de ausência em seus experimentos, 72% dos algoritmos de agrupamento utilizados na abordagem hot-deck estão contidos na categoria Partitioning Based, sendo 75% desta representada pelos algoritmos Random hot-deck, K-Nearest-Neighbor e K-means. Com relação à reprodutibilidade dos experimentos, 30% dos artigos apresentaram pseudocódigos dos algoritmos utilizados, 42% utilizaram conjuntos de dados públicos, 45% compararam os resultados da imputação com o conjunto de dados original. Destaca-se que apenas 1% dos artigos apresentou código fonte em repositório aberto, deixando uma importante lacuna no que tange à reprodutibilidade de experimentos nesta área.

Dissertação

Defesa de dissertação (30/12/2020): Jefferson Colares de Paula

Discente: Jefferson Colares de Paula

Título: Reidentificação de pessoas em longo prazo utilizando características multimodais

Orientadores: Diego Barreto Haddad (orientador), Douglas Oliveira Cardoso (coorientador)

Banca: Diego Barreto Haddad (presidente), Douglas Oliveira Cardoso (CEFET/RJ), Fernanda Duarte Vilela Reis de Oliveira (UFRJ), Eduardo Bezerra da Silva (CEFET/RJ), Gabriel Matos Araujo (CEFET/RJ)

Dia/hora:  30 de dezembro de 2020, às 14h.

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3ameeting_NGJhNTJlZWUtNWY5OS00OWM2LWE3ZWEtNmFmNWI1MDNmZWYy%40thread.v2/0?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%229287392f-fc6f-454c-a314-46c0529f6841%22%7d

Resumo: A reidentificação de pessoas (ReID) consiste em comparar imagens contendo pessoas, obtidas por múltiplas câmeras com campos de visão não sobrepostos e inferir se as pessoas nessas imagens são as mesmas ou não. Trata-se de um problema mais complexo do que aparenta, pois as imagens comparadas costumam apresentar grandes diferenças na iluminação, no ângulo de captura, nas características óticas das lentes utilizadas, alem de oclusão parcial, auto-oclusão, planos de fundos confusos e outros complicadores. A reidentificação de pessoas em longo prazo, que é o tema desse trabalho, e caracterizada pela ocorrência de um intervalo entre as capturas das imagens. Este intervalo não tem duração específica, mas em geral costuma ser superior a um dia, no qual a pessoa observada pode ter trocado de roupas ou sofrido pequenas mudanças na aparência. As mudanças na aparência ocorridas entre as capturas de imagens representam um desafio adicional, pois as cores e texturas das roupas, que são as características mais comumente utilizadas para reidentificação, não podem ser utilizadas como elementos discriminantes. Este trabalho investiga uma solução para o problema da reidentificação de pessoas em longo prazo por meio da utilização de características da face e da forma de caminhar das pessoas como entradas para um modelo de aprendizado de máquina baseado em redes neurais. A hipótese avaliada é que a combinação destas características permitam que o modelo despreze ou minimize o efeito das trocas de roupas e ao mesmo tempo valorize as características motoras. Os resultados obtidos mostram que a combinação das características melhoram o desempenho da reidentificação em curto prazo e também podem ser utilizadas para o reconhecimento de pessoas em longo-prazo.

Dissertação

Defesa de dissertação (04/12/2020): Fernando Pereira Gonçalves de Sá

Discente: Fernando Pereira Gonçalves de Sá

Título: Detecção de Anomalias em Turbinas Eólicas utilizando Modelos baseados em Dados

Orientadores: Diego Nunes Brandão (orientador), Rodrigo Franco Toso (coorientador)

Banca: Diego Nunes Brandão (presidente), Rodrigo Franco Toso (Microsoft AI & Research), Anderson de Rezende Rocha (UNICAMP), Diego Barreto Haddad (CEFET/RJ)

Dia/hora:  04 de dezembro de 2020, às 14h.

Sala remota: https://us02web.zoom.us/j/82318000409?pwd=ajR2R0pMcytyR1VCa1BYdzVuLzFUUT09

Resumo: Nos últimos anos, a energia eólica tornou-se tendência na substituição da matriz energética baseada em recursos não-renováveis. A produção dessa energia limpa é realizada pela turbina eólica, cuja operação reúne diferentes componentes que atuam na conversão da energia cinética do vento em energia elétrica. Contudo, a turbina eólica é uma máquina complexa de custo elevado, constantemente submetida a diferentes pressões que podem lhe causar falhas em algum momento. Neste contexto, o monitoramento contínuo dos diferentes componentes de uma turbina eólica permite a aplicação de técnicas de prognóstico de falhas baseadas na detecção de anomalias no sistema. Detecção, diagnóstico e prognóstico de falhas compreendem um conjunto de técnicas que garantem a confiabilidade, a segurança e a viabilidade econômica de um sistema. A presença de anomalias é o indício de que a saúde do sistema que compõe a turbina eólica está se deteriorando em função do tempo de operação, cuja evolução pode resultar brevemente em uma falha, quando ocorre a paralisação da produção de energia elétrica e são registrados muitas vezes danos irreversíveis no sistema. Diferentes técnicas foram desenvolvidas com o propósito de identificar essas anomalias. Neste trabalho, discutimos duas abordagens com esse propósito. Abordamos a detecção, diagnóstico e prognóstico de falhas baseados na classificação semi-supervisionada em uma configuração na qual o algoritmo de otimização multiobjetivo Algoritmo Genético de Ordenação não-dominante II (NSGA II) realiza a seleção automática de características e parâmetros de processamento. Uma segunda abordagem processou a detecção e diagnósstico de falhas baseadas na classificação de componentes em processo de pré-falha realizada pelos modelos ocultos de Markov. Ambas as abordagens mostraram-se eficientes em seus objetivos, considerando o processamento de um conjunto de dados reais imperfeito e de elevada dimensionalidade, que demandou diferentes métodos de pré-processamento. O Fluxo de Trabalho 1 apresentou resultados 13% superiores em relação ao trabalho de referência. Já o Fluxo de Trabalho 2, obteve F-score de até 0,89 no processamento da classificação multiclasse.

Dissertação

Defesa de dissertação (10/12/2020): Raphael Correia de Souza Fialho

Discente: Raphael Correia de Souza Fialho

Título: Estimando Redshifts Fotométricos com Regularização Sensível aos Erros

Orientadores: Eduardo Bezerra (orientador), Ricardo Ogando (coorientador)

Banca: Eduardo Bezerra (presidente), Ricardo Ogando (ON/MCTIC), Rafaelli Coutinho (CEFET/RJ), Ribamar R. de R. dos Reis (UFRJ), Ronaldo Ribeiro Goldschmidt (IME/RJ)

Dia/hora: 10 de dezembro de 2020, às 14h

Sala remota: https://meet.google.com/pjw-ffxq-xkk

Resumo: Na Astronomia tem se tornado comum o uso de algoritmos de aprendizagem de máquina durante o processo de captura e análise de eventos astronômicos. Devido à quantidade atual de dados capturados pelos telescopios e antenas em levantamentos astronômicos, esses dados costumam ser armazenados, catalogados e transformados para análises e estudos posteriores. Um tipo particular de análise feita sobre esses dados é a deteção do redshift fotométrico, medida que está relacionada ao quão distante um objeto (galáxia ou quasar) se encontra em relação a um determinado ponto de referência. Uma característica relevante dos conjuntos de dados relativos a estudos sobre redshift fotométrico é que cada entrada apresenta não apenas as medições realizadas para um determinado objeto, mas tambem um valor de erro correspondente a cada medição. Nesta dissertação estudamos a construção de modelos de predição para redshift fotométrico por meio de algoritmos de aprendizado de máquina. Damos foco ao uso de redes neurais artificiais. Nosso objetivo é investigar de que forma esses modelos se comportam em cenários em que a informação sobre erros das medições são considerados ou ignorados durante a etapa de aprendizado. Em particular, propomos uma técnica de treinamento que almeja tirar proveito dos valores de erro. Realizamos experimentos computacionais comparativos para avaliar a efetividade da técnica proposta.
Dissertação

Defesa de dissertação (11/12/2020):  Daniel Ferreira de Oliveira

Discente: Daniel Ferreira de Oliveira

Título: Riographx: um portal científico de apoio as pesquisas em teoria espectral de grafos

Orientadores: Leonardo Silva de Lima (orientador) e Eduardo Bezerra da Silva (coorientador)

Banca: Leonardo Silva de Lima (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ), Virgínia Maria Rodrigues (UFGRS), Claudia Marcela Justel (IME)

Dia/hora: 11 de dezembro de 2020, às 16h

Sala remota: https://teams.microsoft.com/l/team/19%3a3daf2ce8441f43b29ec83255c159ef85%40thread.tacv2/conversations?groupId=336cfc27-4004-429a-8da5-b135499e7cf9&tenantId=c37b37a3-e9e2-42f9-bc67-4b9b738e1df0

Resumo: A Teoria Espectral de Grafos (TEG) é uma parte da matemática discreta que estuda as propriedades de um grafo a partir das informações fornecidas pelos autovalores e autovetores da matriz associada a este grafo. Esta teoria vem atraindo um maior interesse de pesquisadores desde a decada de 80, em virtude da sua aplicação em diversas áreas, como na Química, na Matemática, na Engenharia e na Ciência da Computação. Com o crescimento exponencial do volume de dados a que se tem disponível atualmente, o processamento das informações em ambientes de execução de tarefas em paralelo e distribuído é crucial para uma melhor produtividade e desempenho. Com o objetivo de construir uma ferramenta WEB que dispensa o uso de recursos de processamento por parte do usuário, propomos o RioGraphX. Um portal científico desenvolvido utilizando o Apache Spark, que tem como objetivo obter todos os grafos que otimizam uma função matemática envolvendo invariantes de um grafo com possíveis restrições. Um workflow com sete etapas foi desenvolvido de modo a obter o máximo de tarefas possíveis executando no ambiente para computaçãoo paralela e distribuída do Apache Spark. Como o Spark fornece API para Scala, Java e Python, neste estudo foram desenvolvidos dois codigos-fontes: um na linguagem Java e outro em Python devido à abundância de bibliotecas de apoio. Em seguida, foram realizados dois testes: um de validação e outro de desempenho. A partir dos testes, cálculos de speedup e Eficiencia compondo um comparativo de execução de tarefas em ambiente de processamento paralelo e distribuído com ambiente monoprocessado evidenciaram a superioridade do código desenvolvido em Java e a avaliação destas métricas de desempenho demonstram a importância da alocação dinâmica de recursos do Spark levando em consideração o tamanho da base de dados. Os tempos de execução do Portal se mostraram satisfatórios tendo em vista o volume de dados processados.
Dissertação

Defesa de dissertação (17/12/2020):  Luciana Escobar Gonçalves Vignoli

Discente: Luciana Escobar Gonçalves Vignoli

Título: Análise Comparativa de Métodos para Detecção de Eventos em Séries Temporais

Orientadores: Laura silva de Assis (orientadora) e Eduardo Soares Ogasawara (co-orientador)

Banca:  Laura Silva de Assis (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ), Fábio André Machado Porto (LNCC)

Dia/hora: 17 de dezembro de 2020, às 14h

Sala remota: https://meet.google.com/vtr-zogo-cny

Resumo: Grandes volumes de dados são coletados e armazenados diariamente, necessitando de um tratamento adequado para retornar informações valiosas durante uma análise. Esses dados, quando obedecem a uma ordem cronológica de tempo, consistem em séries temporais. Detectar eventos nessas séries é uma tarefa importante em diversas áreas de conhecimento, não se restringindo apenas à Tecnologia da Informação. Eventos podem representar uma anormalidade, uma mudança de comportamento ou um padrão que se repete na série. Diversos métodos presentes na literatura buscam identificar um único tipo de evento, entretanto, uma quantidade menor aborda essa detecção de uma maneira mais generalizada. Esta dissertação propõe uma análise comparativa de diferentes métodos para detecção de eventos em séries temporais, envolvendo identificação de anomalias e pontos de mudança. Tal comparação é realizada através de métodos estatísticos baseados na média móvel, processo de decomposição e técnicas baseadas em vizinhança. Foram realizados experimentos com dados sintéticos e reais envolvendo datasets de diferentes áreas de conhecimento como monitoramento da qualidade da água, tráfego de dados do Yahoo e processos de exploração de petróleo. Os resultados obtidos foram promissores e mostraram que cada conjunto de dado tem sua particularidade, e é muito importante analisar qual método se adéqua melhor a um conjunto específico, onde uma boa escolha pode resultar em até 0,99 de precisão na detecção.
Dissertação

Defesa de dissertação (02/12/2020): Jomar Ferreira Monsores

Discente: Jomar Ferreira Monsores

Título: Ambiente Baseado em Ferramaneta Robótica para Auxílio Educacional de Aluno com Dilexia

Orientador: João Roberto de Toledo Quadros

Banca: João Roberto de Toledo Quadros (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Patrícia Grasel da Silva (IFRJ)

Dia/hora:  02 de dezembro de 2020, às 10h30min.

Sala remota: meet.google.com/qdt-pcdb-dng

Resumo: Um ambiente de robótica, voltado para o auxílio de pessoas que possuem dislexia é apresentado, tanto para o auxílio a leitura quanto na alfabetização de pessoas. A proposta do ambiente é ser inclusivo, o que faz com que ele seja utilizado também para pessoas sem dislexia. Esse ambiente é lúdico, voltado para uma visão de jogo, sem ser competitivo, mas colaborativo. Ele é composto de um robô, um tabuleiro (com símbolos) e um aplicativo, com ênfase na perspectiva de aprendizado dos usuários-alvo. A ideia desse ambiente se baseia na concepção de que, o cérebro de uma pessoa com dislexia se adapta melhor a métodos de ensinos voltados para tridimensionalidade, movimento e percepção espacial. Pretende-se que esse recurso possa ser aplicado em ambientes que não possuam estrutura didático-pedagógica completa para atuar como auxílio a pessoas portadoras de dislexia. Por ser um recurso educacional de baixo custo, seu uso se adequará a ambientes com recursos
financeiros limitados, como, por exemplo, escolas públicas ou escolas com muitos estudantes em zona de carência. A efetividade desse recurso na alfabetização e auxílio de leitura de estudantes com dislexia, pode ser vista na aplicação dos testes, nos quais esse ambiente foi utilizado como recurso educacional inclusivo, atuando na alfabetização ou ajuda a leitura tanto de pessoas com, quanto sem dislexia.

Dissertação

Defesa de dissertação (25/11/2020): Augusto Magalhães Pinto de Mendonça

Discente: Augusto Magalhães Pinto de Mendonça

Título: Distritamento Aplicado ao Problema de Faturamento em Redes de Serviço

Orientadores: Laura Silva de Assis (orientadora), Luis Domingues Tomé Jardim Tarrataca (co-orientador)

Banca: Laura Silva de Assis (presidente), Luis Domingues Tomé Jardim Tarrataca (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Fábio Luiz Usberti (IC – UNICAMP)

Data/hora: 25/11/2020, às 14h

Sala remota: meet.google.com/tnf-ustt-bdg

Resumo: Esta dissertação tem o objetivo de investigar o Problema de Distritamento Capacitado (PDC). O PDC é um problema de otimização combinatória que consiste em particionar uma determinada região, em uma quantidade de distritos predeterminados, considerando um ou mais critérios de decisão. A definição dos distritos deve respeitar suas capacidades, as quais são definidas conforme as especificidades do problema. Existem diversas aplicações para o PDC, como o distritamento político, cobertura de vendas, entrega de correspondências, coleta de lixo e serviços de emergência, dentre tantas outras. Esta pesquisa tem como foco resolver o PDC aplicado ao problema de definir lotes de trabalhos para leitores de medidores de redes de serviço tais como energia, água, gás, considerando os critérios de compacidade e homogeneidade para definição de tais territórios. Um novo método de solução baseado em Algoritmo Genético (AG) comparando duas estruturas distintas é apresentado, respeitando restrições de contiguidade, um número predefinido de distritos, dentre outras. Um método de otimização de hiperparâmetros é proposto para determinar um conjunto de valores que forneça soluções de qualidade com certa confiabilidade. Para validar a abordagem de solução proposta foram realizados experimentos computacionais utilizando instâncias de grande porte com características distintas. Os resultados alcançados mostram a eficiência da abordagem proposta para o PDC em estudo.

Dissertação

Defesa de dissertação (23/11/2020): Marcello Alberto Soares Serqueira

Discente: Marcello Alberto Soares Serqueira

Título: HBRKGA: A Population-based Hybrid Approach to Hyperparameter Optimization for Neural Networks

Orientadores: Eduardo Bezerra da Silva (orientador), Pedro Henrique González Silva (co-orientador).

Banca: Eduardo Bezerra da Silva (presidente),  Pedro Henrique González Silva (CEFET/RJ), Diego Brandão (CEFET/RJ), Igor Machado Coelho (UFF).

Dia/hora: 23 de Novembro de 2020, às 14h.

Sala remota: https://meet.google.com/xjd-mbbe-jsr

Resumo: Nos últimos anos, grandes quantidades de dados estão sendo geradas e a necessidade de recursos computacionais continua crescendo. Este cenario levou a um ressurgimento do interesse em redes neurais artificiais. Um dos principais desafios no
treinamento de modelos eficazes de redes neurais e encontrar uma boa combinação de hiperparametros a serem usados. De fato, a escolha de uma abordagem adequada para pesquisar o espaço do hiperparâmetro influencia diretamente a precisão do modelo resultante da rede neural. Abordagens comuns para busca de hiperparâmetros são a Busca em Grade, a Busca Aleatória e Busca por Otimização Bayesiana. Existem também métodos baseados em população, como a CMA-ES. Neste projeto, apresentamos o HBRKGA, uma nova abordagem baseada na população para a optimização de hiperparâmetros. O HBRKGA e uma abordagem híbrida que combina o Algoritmo Genético de Chaves Aleatórias Viciadas com uma técnica de Random-Walk para pesquisar o espaço de hiperparâmetros de forma eficiente. Foram realizados vários experimentos computacionais em oito conjuntos de dados diferentes para avaliar a eficácia da abordagem proposta. Os resultados mostraram que o HBRKGA conseguiu encontrar configurações de hiperparâmetros que superaram (em termos de qualidade preditiva) os métodos de base em seis dos oito conjuntos de dados, mostrando tambem tempo de execução razoável.

Dissertação

Defesa de dissertação (22/10/2020): Gustavo Pacheco Epifanio

Discente: Gustavo Pacheco Epifanio

Título: Problema de Alocação de Chaves em Sistemas de Distribuição de Energia Elétrica com Geração Distribuída

Orientadora: Laura Silva de Assis

Banca: Laura Silva de Assis (Presidente), Diego Barreto Haddad (CEFET/RJ), José Frederico Vizcaino González (FEG/UNESP) e Christiano Lyra Filho (FEEC/UNICAMP)

Dia/Hora: 22 de outrubro de 2020, às 14h

Sala remota: meet.google.com/bkx-zbcf-yzi

Resumo: O Problema de alocação de chaves (PAC) em redes de energia elétrica consiste em determinar de forma otimizada os melhores locais, quantidade e tipos de chaves a serem alocados em uma rede de distribuição com o objetivo de minimizar os custos, mantendo um nível estipulado de confiabilidade. A geração distribuída (GD) refere-se a existência de um gerador de eletricidade no usuário final ou próximo a ele, permitindo fazer uso de tal fonte de energia. A expectativa é que tal configuração na rede provoque uma redução de perdas na rede elétrica e também auxilie na atenuação do impacto da falha no sistema. A intenção é que a GD conduza a um impacto positivo na confiabilidade da rede, devido ao seu potencial de fornecer caminhos alternativos de fornecimento de energia, após a ocorrência de uma contingência, por meio da operação do sistema com ilhamento. Este trabalho de pesquisa tem como objetivo investigar o PAC que engloba uma série de tomadas de decisão enfrentadas pelas concessionárias de distribuição, a fim de reduzir custos operacionais e manter níveis predeterminados de confiabilidade em uma rede de distribuição com GD.  A solução se baseia em algoritmos genético e memético. Um método de otimização é proposto para escolher um conjunto adequado de valores para os hiperparâmetros. Experimentos computacionais são conduzidos para avaliar a metodologia em redes reais de grande porte. Os resultados mostram a efetividade da abordagem em solucionar o PAC e os benefícios na confiabilidade que podem ser obtidos com o uso da GD.
Dissertação

Defesa de dissertação (28/09/2020): Ellen Paixão Silva

Discente:  Ellen Paixão Silva

Título: A Influência de Mídias Multissensoriais na Aprendizagem de Crianças com Dislexia

Orientadores: Joel André Ferreira dos Santos (orientador) Silva e Glauco Amorim (coorientador)

Banca: Joel André Ferreira dos Santos (Presidente), Glauco Amorim (CEFET/RJ), Gustavo Guedes (CEFET/RJ), Renata Mousinho (UFRJ) e Maria da Graça Campos Pimentel (USP)

Dia/Hora: 28 de setembro de 2020, às 19h

Sala remota:

MS Team (https://teams.microsoft.com/l/meetup-join/19%3ameeting_NmJkN2EwMDAtNjVjZS00OThiLThlMzktODI0OGI2OTI0OWUx%40thread.v2/0?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2264f8dc5c-d07e-4edc-acf2-16d1e4d1205d%22%7d)

Resumo:

A dislexia é um transtorno específico de aprendizagem que pode afetar as habilidades de leitura e escrita prejudicando, principalmente, o processo de alfabetização. Na leitura, a sobrecarga na memória de trabalho prejudica a compreensão de textos sendo observado sintomas como erros de reconhecimento de palavras e dificuldade de decodificação de palavras. Pesquisas publicadas na literatura indicam que a formação da memória engloba diferentes sentidos humanos e que estímulos provenientes de conteúdos multimídia melhoram o desempenho de escolares com dislexia. No entanto, a maioria das aplicações multimídia estimulam apenas dois dos cinco sentidos humanos: a visão e a audição. Pesquisas recentes buscam adicionar estímulos aos demais sentidos em aplicações multimídia, na forma das chamadas aplicações mulsemídia (multimídia multissensorial). Na forma de um livro multissensorial, este trabalho propõe o uso de conteúdos multissensoriais incorporando sons, variação cores e intensidade da luz do ambiente, vento e cheiro ao conteúdo do texto. Tais conteúdos são sincronizados à leitura com o uso de um rastreador ocular.
O MBook é um aplicativo desenvolvido neste trabalho capaz de armazenar e apresentar livros multissensoriais. Ele utiliza um rastreador ocular para mapear a posição dos olhos no display que exibe o texto e assim identificar instantaneamente qual a palavra está sendo lida. Com essa
informação é possível verificar se aquela palavra ou sequência de palavras possuem conteúdos multissensoriais associados e com isso executar os conteúdos correspondentes. O MBook desacopla o conteúdo textual do livro da lógica da experiência multissensorial. Dessa forma, permite que os autores se concentrem na história e marquem os locais da história em que um conteúdo multissensorial pode ser apresentado, e os produtores de conteúdo explorem as histórias existentes para aumentar a experiência do leitor, incluindo conteúdo multimídia tradicional e efeitos sensoriais.
Neste trabalho, partimos da hipótese de que “o uso de conteúdos multissensoriais sincronizados com a leitura diminui a sobrecarga na memória de trabalho necessária para a leitura, auxiliando assim, um indivíduo com dislexia a compreender e memorizar o conteúdo que esta sendo lido”. Para avaliar essa hipótese foram realizados dois estudos: (i) uma análise comparativa entre dois estudos de caso individuais, sendo um com uma criança com dislexia e um com uma criança sem dislexia com o perfis pareados; e (ii) uma análise de um estudo de caso coletivo com cinco crianças com dislexia. Os resultados obtidos indicam um aumento da motivação intrínseca de leitura, um ganho de velocidade na leitura e um aumento da compreensão de texto quando conteúdos multissensoriais são incluídos na leitura. Os resultados também indicam que o MBook pode ser uma ferramenta terapêutica importante para o tratamento de escolares com dislexia minimizando assim os prejuízos causados por esse transtorno.

Dissertação

Defesa de dissertação (23/09/2020): Adalberto Andrade

Discente:  Adalberto Andrade

Título: Um estudo comparativo para Predição de Consumo de Fertilizantes em cenário de small data 

Orientadores: Pedro Henrique González (orientador) Silva, Eduardo Soares Ogasawara (coorientador)

Banca: Pedro Henrique González Silva (Presidente), Eduardo Soares Ogasawara (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Cristina Gomes de Souza (CEFET/RJ), Igor Machado Coelho (UFF)

Dia/Hora: 23 de setembro de 2020, às 10h

Sala remota: meet.google.com/utc-ucgk-nxu

Resumo:

Os fertilizantes têm recebido crescente atenção do agronegócio, indústria, empresários, governos e entidades de pesquisa em todo o mundo. Como insumo crítico para a cadeia produtiva de alimentos e insumos orgânicos para outros setores, é importante prever o consumo de fertilizantes, para que o aumento de sua produção possa ser feito adequadamente planejado, sem comprometer o meio ambiente. Esta previsão apoia a tomada de decisões e o planejamento, particularmente para atividades agrícolas, fortemente dependentes do uso de fertilizantes. Tendo em vista os elementos citados, esta pesquisa tem como foco comparar abordagens analíticas de dados para melhorar as previsões do consumo de fertilizantes sob diferentes horizontes de passos à frente. Para tanto, exploramos maneiras de otimizar a construção de modelo considerando diferentes abordagens (ou seja, combinações de pares entre pré-processamento de dados e métodos de aprendizado de máquina). Avaliamos essas abordagens em um conjunto reduzido de observações, correspondentes aos quatro principais fertilizantes usados nos dez principais países que os consomem. Os resultados obtidos mostraram que o uso das ferramentas analíticas propostas pode ser uma maneira promissora de
obtermos previsões para planejar demandas futuras.

Dissertação