Autor: Rafaelli Coutinho

Defesa de dissertação (17/05/2022): Danielle Fontes de Albuquerque

Discente: Danielle Fontes de Albuquerque

Título: Seleção de atributos na Base do CENSO do Ensino Superior Brasileiro para Análise da Evasão

Orientador(es): Rafaelli Coutinho (orientadora) e Diego Brandão (CEFET/RJ) (coorientador)

Banca: Rafaelli Coutinho (presidente),  Diego Brandão (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ), Alessandro Vivas Andrade (UFVJM), Cristiano Maciel (UFMT)

Dia/Hora: 17/05/2022 às 14:30

Sala remota: https://us06web.zoom.us/j/83229649478?pwd=cm90SXRXM1pDN2duWFlLdXlnRjBkUT09 

Resumo: Cada vez mais o setor da educação tem utilizado de seus extensos repositórios de dados para auxiliar na tomada de decisão dentro das Instituções de Ensino Superior (IES). Um dos principais problemas enfrentados por essas instituições é a evasão. Ela consiste em um fenômeno preocupante pois gera prejuízos sociais e econômicos tanto para o estudante quanto para a sociedade. Uma maneira de reduzir os impactos da evasão consiste em identificar quais são as possíveis causas do problema por meio das bases de dados disponíveis nas IES, podendo ser utilizado para isso técnicas da área de Mineração de Dados Educacionais (MDE). A MDE é uma área interdisciplinar que usa técnicas computacionais e estatísticas para compreender o cenário educacional a partir das bases de dados das instituições de ensino. Dentro desta área, a Seleção de Atributos (SA) é um conjunto de técnicas capaz de identificar quais são os atributos mais relevantes em uma base de dados extensa e simplificá-la de forma que seja possível expressar a informação com um volume menor de dados. Com isso, é possível realizar análises de bases de dados menores e mais limpas, o que facilita o entendimento do problema e melhora o desempenho computacional tanto em relação ao tempo de processamento quanto à qualidade do modelo gerado. Ademais, identificar os fatores mais importantes é uma forma de compreender quais são as possíveis causas e consequências do problema. Esse trabalho realiza uma análise comparativa das técnicas de SA em dados educacionais do Censo de Ensino Superior (CES), fornecido pelo governo brasileiro, que reúne informações sobre todos os estudantes de ensino superior do país. O objetivo é identificar quais são as principais fatores envolvidos na evasão no ensino superior e encontrar combinações de técnicas de SA e classificadores que potencializem a qualidade da classificação. Uma nova abordagem para SA também foi proposta com Algoritmo Genético (AG) para permitir maior flexibilidade e especificidade no cenário educacional, chamada FlexAG. Os resultados mostram que os atributos ano de ingresso, atividade extracurricular e financiamento estudantil são os mais importantes para o cenário geral da base do CES. Além disso, as técnicas de SA se mostraram capazes de melhorar as medidas de desempenho de classificação, a redução na quantidade de atributos e o tempo de classificação.

Dissertação 

Tópicos Especiais em Aplicações Computacionais (Introdução a Blockchain e aplicações descentralizadas) – 2022.3

No terceiro trimestre de 2022, a disciplina de Tópicos Especiais em Aplicações Computacionais contemplará o ensino de Blockchain e aplicações descentralizadas.

Segue a ementa completa da disciplina.

Introdução a Blockchain e aplicações descentralizadas

Conceitos de blockchain e criptomoedas; Aplicações Descentralizadas (DApps); Contratos Inteligentes (Smart Contracts); Plataformas de Blockchain. Soluções Off-chain e Layer 2.

  1. DRESHER, D. Blockchain Basics. Apress, Frankfurt, 2017.
  2. MOHANTY, Debajani. Ethereum for Architects and Developers. Apress, 2018.
  3. XU, Xiwei; WEBER, Ingo; STAPLES, Mark. Architecture for blockchain applications. Berlin, Germany:
    Springer, 2019.
  4. BAHGA, Arshdeep; MADISETTI, Vijay. Blockchain applications: a hands-on approach. Vpt, 2017.
    ANTONOPOULOS, Andreas M.; WOOD, Gavin. Mastering ethereum: building smart contracts and
    dapps. O'reilly Media, 2018.
  5. BASHIR, Imran. Mastering blockchain. Packt Publishing Ltd, 2017.
  6. MUKHOPADHYAY, Mayukh. Ethereum Smart Contract Development: Build blockchain-based
    decentralized applications using solidity. Packt Publishing Ltd, 2018.
  7. MANOJ, P. R. Ethereum Cookbook: Over 100 recipes covering Ethereum-based tokens, games,
    wallets, smart contracts, protocols, and Dapps. Packt Publishing Ltd, 2018.

Defesa de dissertação (26/01/2022): Igor da Silva Morais

Discente: Igor da Silva Morais

Título: Hybrid Approaches to the Two-Stage Facility Location Problem

Orientador(es): Pedro Henrique González Silva (orientador) e Eduardo Bezerra da Silva (CEFET/RJ) (coorientador)

Banca: Pedro Henrique González Silva (presidente),  Eduardo Bezerra da Silva (CEFET/RJ), Diego Nunes Brandão (CEFET/RJ), Vanessa de Almeida Guimarães (CEFET/RJ), Glaydston Mattos Ribeiro (COPPE/UFRJ)

Dia/Hora: 26/01/2022 às 08:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3a9fe266b1abfc45d0a40451cdf514381c%40thread.tacv2/1642426974546?context=%7b%22Tid%22%3a%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2c%22Oid%22%3a%2245114d98-ef79-4a71-8ee9-16ae0daf7646%22%7d

Resumo: Na classe de problemas de cadeia de sumprimento, O problema de localização de facilidades em Dois Niveis(PFLC2n) consiste em encontrar localizações ótimas para instalação de fabricas e depositos que atendam a demanda dos clientes. O objetivo do problema é minimizar os custos operacionais de abertura e fluxo, obedecendo as restrições de produção, armazenamento e demanda de clientes . Esse problema pode ser visto como aplicação do contexto de cidades inteligentes, pois cobre os três pilares: governança, energia e transporte. Para resolver o probema duas hibridizações são propostas uma do Clustering Search(CS) com Adaptive Large Neighborhood Search(ALNS) e Local Branching. E com o intuito de comparar e mostrar robustez dos componentes outra hibridização é apresentada usando Biased Random-Key Genetica Algorithm (BRKGA). Para comparação instâncias da literatura foram utilizadas. Os resultados mostram que para o PFLC2n supera o estado da arte atual para 44 de 50 instâncias e a estabilidade é mostrada por meio de uma analise estatística que testa a significancia em comparação aos outros métodos.

Dissertação 

Artigo em destaque na SBC OpenLib em 2021

O artigo intitulado Identification of Brazilian sexual predators in textual conversations on the internet through machine learning de autoria do professor Gustavo Guedes (PPCIC) e do egresso Leonardo Ferreira dos Santos está entre os 10 artigos publicados em periódicos da SOL que tiveram o maior número de downloads (acessos ao PDF) em 2021.

  • DOS SANTOS, L. F.; GUEDES, G. Identification of Brazilian sexual predators in textual conversations on the internet through machine learning. iSys – Brazilian Journal of Information Systems, [S. l.], v. 13, n. 4, p. 22–47, 2020. DOI: https://doi.org/10.5753/isys.2020.822.

Parabéns aos envolvidos!

Defesa de dissertação (27/12/2021): Thiago Rangel Pesset Gonzaga

Discente: Thiago Rangel Pesset Gonzaga

Título: MODELAGEM ESTOCÁSTICA DO APRENDIZADO ONLINE DE UMA ESTRUTURA LINEAR ADAPTATIVA IMPLEMENTADA EM BLOCOS

Orientador(es): Diego Barreto Haddad (orientador) e Felipe da Rocha Henriques (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Felipe da Rocha Henriques (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Tadeu Nagashima Ferreira (UFF).

Dia/Hora: 27/12/2021 às 14:00

Sala remota: https://teams.microsoft.com/l/meetup-join/19%3AAWU0sWZQqcAbmYFqYLCqv91CSvd0jaTXILPSCFcQ9hc1%40thread.tacv2/1639414430868?context=%7B%22Tid%22%3A%228eeca404-a47d-4555-a2d4-0f3619041c9c%22%2C%22Oid%22%3A%2202b6b3d1-811f-4650-909a-d2a79310ba31%22%2C%22MessageId%22%3A%221639414430868%22%7D

Resumo: 

Os algoritmos de filtragem adaptativa constituem uma família de técnicas com ampla aplicação em problemas de grande relevância, tais como equalização de canais, cancelamento de eco acústico, cancelamento de ruído, identificação de sistemas e séries temporais. Este trabalho propõe um modelo estocástico capaz de prever as características de aprendizado dos algoritmos LMS e NLMS implementados em blocos. A análise é simplificada por um modelo que divorcia a distribuição radial dos vetores de entrada da distribuição angular, a qual é discretizada. A despeito desta simplificação, o modelo utilizado de sinal de entrada é coerente com a matriz de autocorrelação original dos dados de entrada. A partir desta análise foi possível modelar o comportamento de divergência dos algoritmos estudados,  relacionar o MSE em excesso a quantidade de blocos utilizados e de forma proporcional ao tamanho do filtro. As predições teóricas serão comparadas com curvas de desempenho oriundas de simulação, de modo a aferir a acurácia das estimativas resultantes.

Dissertação 

Defesa de dissertação (15/12/2021): Davi Bortolotti Batista

Discente: Davi Bortolotti Batista

Título: Segmentação Semântica para Interpretação Automática de Estruturas Geológicas Lineares

Orientador(es): Diego Barreto Haddad (orientador) e Gabriel Matos Araujo (CEFET/RJ) (coorientador)

Banca: Diego Barreto Haddad (presidente), Gabriel Matos Araujo (CEFET/RJ), Douglas de Oliveira Cardoso (CEFET-RJ), Kenji Nose Filho (UFABC), Milena Faria Pinto (CEFET-RJ) e GIlson Antonio Giraldi (LNCC).

Dia/Hora: 15/12/2021 às 14:00

Sala remota: Link do Teams

Resumo:

    A interpretação automática de estruturas geológicas pode agilizar a etapa de trabalho de campo necessária na geotecnia, engenharia civil e na exploração de recursos naturais como petróleo, água e minério, provendo aos geocientistas um maior volume de informações advindas de afloramentos rochosos. Parâmetros geológicos enriquecem e melhoram a capacidade preditiva dos modelos geológicos numéricos e estatísticos. As fraturas geológicas são de grande interesse pois indicam regimes de tensões pretéritos e atualmente ocorrentes na litosfera terrestre, além de serem canais preferenciais de fluidos economicamente importantes.

     Este trabalho propõe uma nova metodologia combinando aprendizado profundo, segmentação semântica e algoritmos clássicos de visão computacional para interpretação de estruturas geológicas lineares de imagens de UAVs (Unmanned Aerial Vehicles).  mostram métricas de Interseção sobre União (IoU) de até 74% para os resultados do modelo treinado antes do pós-processamento, e até 78% depois. A segmentação predita foi usada como máscara para binarização e detecção de linhas para extrair fraturas com precisão. A comparação de direções de strike oriundas da interpretação geológica e oriundas das estruturas extraídas automaticamente exibiu tendências e comportamentos muito similares. Os resultados foram comparados com outras técnicas historicamente usadas na área de geoprocessamento e com anotações manualmente executadas pelos geocientistas, demonstrando precisão maior e visíveis vantagens.

Dissertação 

Palestra dos Resultados da 3ª edição do Programa de Pesquisa – Escola de Contas e Gestão do TCE-RJ

No dia 11 de novembro de 2021, das 16 às 17h, acontece mais uma edição do projeto Diálogo da Escola de Contas e Gestão do TCE-RJ com a apresentação dos resultados da 3ª edição do Programa de Pesquisa com o tema Classificação automatizada de produtos da Nota Fiscal Eletrônica de Compras Pública. A apresentação contará com a presença dos palestrantes Bruno Mattos Souza de Souza Melo (servidor do TCE-RJ e docente da ECG/TCE-RJ) e Eduardo Bezerra da Silva (docente do PPCIC), e será mediada por Alberto Tavares Neto (servidor do TCE-RJ, docente da ECG/TCE-RJ e membro da COPEP).

Resumo da palestra:

O problema de agrupamento e classificação de produtos quanto à sua natureza e similaridade, a partir das informações constantes das notas fiscais eletrônicas (NFE), é comum a todos os órgãos de controle do Brasil. Com o uso da base de dados das NFEs de produtos adquiridos pelo Estado do Rio de Janeiro, da base de dados de medicamentos autorizados pela Agência Nacional de Vigilância Sanitária e de técnicas de mineração de dados, desenvolveu-se uma metodologia para agrupar e classificar os bens e produtos farmacêuticos adquiridos por órgãos da administração pública fluminense. A contribuição imediata da metodologia desenvolvida é o aumento da capacidade analítica dos órgãos de controle de todo o Brasil na fiscalização das despesas relacionadas aos medicamentos adquiridos pela rede pública de saúde. O modelo desenvolvido teve um desempenho de 93,6% na qual o valor máximo indicaria um modelo perfeito.

Tutorial desenvolvido por discente do PPCIC é disponibilizado no repositório oficial da comunidade ArangoDB

O tutorial da solução NoSQL ArangoDB desenvolvido pelo discente Janio de Souza Lima (PPCIC) despertou interesse dos fabricantes da ferramenta. O discente foi convidado a publicar seu código (Jupyter Notebook) no repositório oficial da comunidade ArangoDB na área de tutoriais.

O código está disponível em https://github.com/arangodb/interactive_tutorials/blob/master/community_notebooks/BD_g01_ArangoDB.ipynb. Ele foi desenvolvido como parte das atividades da disciplina de Banco de Dados ministrada pelo professor Jorge Soares (PPCIC).

Janio Lima desenvolveu também conteúdos complementares em vídeo explicando o tutorial e como implementar a solução NoSQL ArangoDB através de sua API para Python. Os vídeos estão disponíveis no canal do YouTube “Python DS” do discente:

Defesa de dissertação (26/08/2021): Lucas Giusti Tavares

Discente: Lucas Giusti Tavares

Título: Analyzing Flight Delay Prediction Under Concept Drift

Orientadores: Jorge de Abreu Soares (orientador) e Eduardo Soares Ogasawara (CEFET/RJ) (coorientador).

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Rafaelli de Carvalho Coutinho (CEFET/RJ) e Antônio Tadeu Azevedo Gomes (LNCC).

Dia/hora: 26 de agosto de 2021, às 13h30.

Sala remota: https://meet.google.com/zow-fgxq-fte

Resumo: Delay is one of the most critical indicators for flight transportation systems. Flight delays impose a challenge that impacts any flight transportation system. In this context, the prediction of delayed flights may be an essential tool for effectively addressing this problem. This dissertation investigates the prediction performance of different drift handling strategies in aviation under different scales. It considers two different scales: system-based (SB) and airport-based (AB). In (SB), all airports in the flight system are considered together. Conversely, in AB, each airport is studied separately. Specifically, this work proposed and answered two research questions: (i) How do drift handling strategies influence the prediction performance of delays?; and (ii) Do different scales change the results of drift handling strategies? It was observed that drift handling strategies are relevant. Their impact varies according to the scales used. The experimental evaluation was done using a dataset that integrates weather and flight data from the Brazilian system. Moreover, the passive and active strategies revealed better recall scores. For f1 scores, the strategies had similar results, with the passive strategy showing slightly better results. It may be related to the high prevalence of drifts. In this case, strategies that always retrain machine learning models offer better results than those that train only once. However, extensive testing is recommended. Nonetheless, choosing machine learning models may have a higher impact on f1 than drift handling strategies.

Dissertação

Workshop Inteligência Artificial e Meteorologia

O Centro de Operações da Prefeitura do Rio de Janeiro (COR), em parceria com docentes do Laboratório Nacional de Computação Científica (LNCC) e do PPCIC, realizará na próxima semana o primeiro “Workshop Inteligência Artificial e Meteorologia – Caminhos para uso de IA no aprimoramento da previsão de chuvas fortes na cidade do Rio de Janeiro”.

O evento é online e aberto ao público, e será realizado nas manhãs dos dias 05 e 06 de agosto (sempre das 9h às 13h).

Para mais informações acesse: cor.rio/WorkshopIA

Desde já agradecemos a sua atenção e contamos com a sua presença!

 

 

Dissertação de Mestrado do PPCIC recebe Menção Honrosa no Prêmio Artur Ziviani de Teses e Dissertações

A dissertação de mestrado da Ellen Paixão Silva, que concluiu seu Mestrado em 2020 no PPCIC, recebeu Menção Honrosa no Prêmio Artur Ziviani de Teses e Dissertações durante o Simpósio Brasileiro de Computação Aplicada à Saúde 2021 (SBCAS 2021). O evento aconteceu entre os dias 15 e 18 de junho. A dissertação intitulada “A Influência de Mídias Multissensoriais na Aprendizagem de Crianças com Dislexia“, foi orientada pelos docentes Joel dos Santos e Glauco Amorim do PPCIC.

Sobre o Prêmio Artur Ziviani de Teses e Dissertações: O Concurso de Teses e Dissertações do Simpósio Brasileiro de Computação Aplicada à Saúde (CTD-SBCAS) mudou o nome da edição de 2021 para Prêmio Artur Ziviani de Teses e Dissertações, em homenagem ao grande pesquisador e fundador do SBCAS “Artur Ziviani” que foi vítima da COVID-19.

Projetos contemplados no edital Jovem Cientista do Nosso Estado da FAPERJ

Os professores Diego Barreto Haddad e Eduardo Soares Ogasawara tiveram seus projetos de pesquisa selecionados no programa Jovem Cientista do Nosso Estado (JCNE) – 2020, da FAPERJ, conforme resultado divulgado no último dia 13 no site da Fundação.

Os títulos dos projetos contemplados são:

  • “Otimização em Visão Computacional e Processamento de Sinais” – professor Diego Barreto Haddad
  • “Detecção de Eventos, Descoberta de Padrões e Predição em Séries Temporais” – professor Eduardo Soares Ogasawara

A notícia também foi publicada na página do CEFET/RJ.

Discente do PPCIC recebe menção honrosa por dissertação inédita no Brasil

O discente Leonardo Ferreira dos Santos (PPCIC) defendeu, no último dia 28 de abril, sua dissertação com um trabalho inédito no Brasil intitulado “Identificação automática de atividade predatória sexual em conversas virtuais no Brasil”, orientado pelo Prof. Gustavo Paiva Guedes e Silva (PPCIC). O trabalho recebeu menção honrosa do programa pela sua qualidade e pela contribuição que terá para a sociedade.

A notícia completa está disponível no site do CEFET/RJ: http://www.cefet-rj.br/index.php/component/content/article?id=5892

Confira o resumo do trabalho aqui.

Defesa de dissertação (28/04/2021): Leonardo Ferreira dos Santos

Discente: Leonardo Ferreira dos Santos

Título: Identificação automática de atividade predatória sexual em conversas virtuais no Brasil

Orientador: Gustavo Paiva Guedes e Silva

Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Eduardo Soares Ogasawara (CEFET/RJ), Ronaldo Ribeiro Goldschmidt (IME)

Dia/Hora:  28 de abril de 2021, às 14h.

Sala remota: http://meet.google.com/vtf-bmvn-frp

Resumo:  O uso da internet por crianças e adolescentes possibilita o acesso a um conjunto de oportunidades para o seu autodesenvolvimento. O acesso à informação, material educacional, entretenimento e socialização são algumas das oportunidades que podem ser usufruídas. O uso de redes sociais é um dos principais canais para socialização na internet. Por meio da criação de um perfil público no momento de ingresso à rede social, crianças e adolescentes podem criar conexões com outros perfis e estabelecer comunicação por meio de conversas virtuais. Predadores sexuais, por sua vez, fazem uso de redes sociais com o propósito de ludibriar essas crianças e adolescentes, estabelecendo uma relação enganosa para posterior execução de diversas atividades criminosas, como a obtenção de conteúdo pornográfico, a extorsão e a prática do abuso sexual. Nesse cenário, diversos estudos vêm se concentrando na identificação de predadores sexuais na internet. Embora seja um domínio de pesquisa amplamente explorado, não foram encontrados trabalhos que considerem o estudo de conversas virtuais realizadas na língua portuguesa do Brasil. Diante do problema exposto, a presente pesquisa tem como o principal objetivo propor um método que apresente resultados significativos para a identificação de atividade predatória em conversas textuais realizadas na internet. Para atingir esse objetivo, foi considerado como base de estudos um conjunto de 82 conversas predatórias anonimizadas e oriundas de provas criminais presentes em processos judiciais. Após a análise das conversas predatórias, um total de dezenove características textuais e comportamentais foram identificadas e consideradas para a criação de um método para detecção de atividade predatória em conversas textuais denominado MDAP. Para a validação do método, foi criado um conjunto de dados com características similares as da competição PAN-2012, utilizando como base as 82 conversas predatórias. Os resultados obtidos, quando comparados aos métodos candidatos ao estado da arte para o domínio da pesquisa, comprovam a eficiência do método MDAP para a identificação de atividade predatória em conversas textuais, se apresentando como uma alternativa para promoção de um ambiente virtual mais seguro para crianças e adolescentes.

Dissertação