Categoria:Notícias

Defesa de dissertação (31/01/2020): Ivair Nobrega Luques

Discente: Ivair Nobrega Luques

Título: Inteligência Computacional Aplicada à Detecção Intrínseca de Plágio em Documentos Textuais

Orientadores: Eduardo Bezerra (orientador), Pedro Henrique González Silva (co-orientador)

Banca: Eduardo Bezerra (presidente), Pedro Henrique González Silva (CEFET/RJ), Jorge de Abreu Soares (CEFET/RJ),  Igor Machado Coelho (UFF)

Dia/Hora: 31 de janeiro de 2020/ 10h

Sala: Auditório V – Bloco E

Resumo:

O acesso à produção acadêmica na forma de documentos relacionados ao ensino e à pesquisa científica tem sido fomentado por movimentos de divulgação de documentos digitais. No entanto, o uso indevido desses documentos está contribuindo para o crescimento de casos de plágio. Redes neurais artificiais têm obtido resultados surpreendentes na solução de vários problemas de na área de Processamento de Linguagem Natural. Inspirados por isso, neste trabalho, aplicamos uma combinação simples, porém eficaz, de técnicas de Aprendizagem Profunda à tarefa de detecção intrínseca de plágio. Em particular, usamos Skip-Thoughts, um modelo de incorporação para representar cada frase de um documento como um vetor multidimensional. Depois disso, treinamos uma rede neural siamesa usando como conjunto de treinamento uma coleção de pares de frases (cada frase representada como um vetor Skip-Thoughts) extraída de documentos no corpus PAN11. Em seguida, modelamos cada documento como um grafo ponderado e não-dirigido para viabilizar a aplicação do algoritmo de correlação de clusters, que possibilita identificar passagens potencialmente plagiadas. Nossos experimentos computacionais mostram que o modelo neural de rede siamesa resultante é capaz de reconhecer diferenças estilísticas entre frases em um documento. Além disso, a identificação de passagens potencialmente plagiadas por meio da abordagem de correlação de clusters produz resultados comparáveis aos da literatura.

Dissertação

Defesa de dissertação (31/01/2020): Wellington Souza Amaral

Discente: Wellington Souza Amaral

Título: Análise de grafos para apoio em auditoria de licitações públicas

Orientador: Leonardo Lima (orientador), Eduardo Bezerra (co-orientador)

Banca: Leonardo Lima (presidente), Eduardo Bezerra (CEFET/RJ), Eduardo Ogasawara (CEFET/RJ),  Claudia Justel (IME)

Dia/Hora: 31 de janeiro de 2020/ 14h

Sala: a definir

Resumo:

O presente trabalho apresenta proposta de pesquisa para identificação de inconformidades nos processos licitatórios realizadas por órgãos do Estado do Rio de Janeiro. Esse interesse é motivado pela necessidade de se selecionar os gastos públicos com maiores  suspeitas de conter irregularidades, já que é inviável investigar em detalhe todas as despesas e contratos públicos do estado. Métodos correlatos às áreas de mineração de dados, teoria de grafos e a teoria da informação são utilizados. O método proposto consiste em modelar o problema em dois tipos de redes: uma rede bipartida de empresas e órgãos públicos e, outra rede formada somente de empresas. A entropia de cada vértice e algoritmos de identificação de comunidades são utilizados para identificar possíveis conluios de empresas nas licitações públicas. Os experimentos  computacionais foram realizados com mais de 140 redes a partir de um conjunto  de dados reais e em cada rede subconjuntos de licitações com possíveis conluios foram indicados pelos algoritmos desenvolvidos.

Dissertação

Defesa de dissertação (30/01/2020): Francimary Procopio Garcia de Oliveira

Discente: Francimary Procopio Garcia de Oliveira

Título: Integração de Dados na Detecção de Alvos para Fármacos de Schistosoma mansoni.

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (presidente), Rafaelli de Carvalho Coutinho (CEFET/RJ), Ana Carolina Ramos Guimaraes (FIOCRUZ)

Dia/Hora: 30 de janeiro de 2020/ 11:00h

Sala: a ser definida

Resumo:

A esquistossomose causada pelo organismo Schistosoma mansoni é uma doença negligenciada importante por sua ocorrência no mundo. Contudo, existe um único medicamento recomendado pela Organização Mundial de Saúde para o seu tratamento. Logo, pesquisas por alvos para fármacos alternativos no combate à doença são importantes. Este trabalho tem como objetivo identificar possíveis novos alvos para fármacos de S. mansoni. A metodologia adota uma abordagem baseada na integração de dados biológicos que se encontram dispersos por diversos bancos de dados públicos e na utilização dos conceitos de ortologia e homologia para identificação dos atributos de essencialidade e drogabilidade das proteínas. Também foi abordado o método de aprendizado de maquina para identificação do atributo de essencialidade das proteínas do S. mansoni, a partir das bases de proteínas essenciais e não-essenciais dos organismos modelo.
Considerando as etapas da metodologia que utilizaram abordagem baseada em homologia, para as quais as características de essencialidade e drogabilidade foram pretendidas, os resultados apresentam uma lista de 15 proteínas candidatas a alvos para fármaco do S. mansoni. Em relação ao método de aprendizado de máquina, o classificador Random Forest foi indicado como o de melhor desempenho, apresentando um percentual de 79% de acurácia nas atividades de aprendizado. A partir do classificador, 1.412 proteínas foram indicadas como essenciais na atividade de predição das proteínas do S. mansoni. A análise comparativa entre os dois métodos, baseado em homologia e baseado em aprendizado de máquina, foi realizada e uma lista das seis proteínas melhor ranqueadas foi apresentada.

Dissertação

Defesa de dissertação (17/01/2020): Ribamar Santos Ferreira Matias

Discente: Ribamar Santos Ferreira Matias

Título: Integração de Dados como Apoio a Modelagem de Célula Inteira da Bactéria Pseudomonas aeruginosa CCBH4851

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (presidente), Eduardo Bezerra da Silva (CEFET/RJ), Fabrício Alves Barbosa da Silva (FIOCRUZ)

Dia/Hora: 17 de janeiro de 2020/ 10:00h

Sala: Auditório V – 5º andar

Resumo:

A análise comparativa de genomas por meio de processos computacionais é uma abordagem de baixo custo e com potencial promissor para apoiar pesquisadores. Tal análise é favorecida ao considerar os diversos dados oriundos de estudos sobre organismos modelo, disponíveis em bancos de dados públicos. Esta abordagem foi utilizada no presente trabalho, para analisar o genoma da cepa Pseudomonas aeruginosa CCBH4851. Esta cepa, identificada no Brasil em 2008, está sendo pesquisada pela FIOCRUZ e parceiros, em função de sua associação a infecções hospitalares, e do seu alto grau de resistência, detectado após testes com diversos antibióticos. Neste sentido, o levantamento de proteínas essenciais, que possam auxiliar no desenvolvimento de novos antibióticos no combate à bactéria, torna-se relevante. Deste modo, o objetivo deste trabalho é construir uma base de dados para ampliar o conhecimento disponível sobre a P. aeruginosa CCBH4851, a partir de dados provenientes de estudos aprofundados com outros organismos. Esta base de dados reúne informações como anotações por ontologia das proteínas da bactéria, dados sobre homologia e ortologia, e indicadores de similaridade semântica funcional, entre suas proteínas e as de organismos de referência no estudo da espécie P. aeruginosa. Como complemento, foi elaborado um processo de aprendizado de máquina, com intuito de inferir quais proteínas da bactéria têm características essenciais, que são o alvo preferencial para ação dos antibióticos. Para reunir este conjunto de informações, foram empregados métodos estritamente computacionais, com o apoio de ferramentas para análise de sequências genômicas, como Blast2GO, InterProScan, GOGO, Blastp e Orthofinder, referenciando conjuntos de proteínas provenientes de bancos de dados genômicos públicos, como Uniprot, OGEE, Interpro e KEGG. O processo de aprendizagem de máquina consistiu na execução de uma rede neural LSTM, cujas predições seriam posteriormente confrontadas com os resultados de anotação, semelhança e similaridade semântica. Embora sejam menos precisos que as análises por curadoria manual, os métodos computacionais evoluem continuamente, e novas tecnologias e ferramentas para bioinformática são frequentemente disponibilizadas. Estes recursos têm potencial promissor para auxiliar os pesquisadores nas tarefas de conhecimento dos genomas e tomada de decisão. Na base de dados criada, estão disponíveis as anotações pela ontologia Gene Ontology, de aproximadamente 60% do total de proteínas, indicadores de similaridade semântica, assim como o conjunto de proteínas ortólogas da cepa P. aeruginosa CCBH4851, obtidos através de processos comparativos com proteomas de referência. Por fim, o projeto sugere um fluxo de atividades que pode ser aplicado como abordagem inicial genérica nos estudos de novos genomas, que pode ser aprimorado e estendido por trabalhos futuros.

Dissertação

Defesa de dissertação (23/12/2019): Carlos Alberto Martins de Sousa Teles

Discente: Carlos Alberto Martins de Sousa Teles

Título: Um Arcabouço de Caixa-Preta para a Detecção de Tráfego Malicioso em Ambientes de TIC

Orientadores: Felipe da Rocha Henriques (orientador), Raphael Carlos Santos Machado (co-orientador)

Banca: Felipe da Rocha Henriques (presidente), Raphael Carlos Santos Machado (UFF), Pedro Henrique González Silva

 (CEFET/RJ),  Michel Pompeu Tcheou (UERJ)

Dia/Hora: 23 de dezembro de 2019/ 15:30h

Sala: Auditório V – 5º andar

Resumo:

A segurança da informação está se tornando gradualmente uma área que desempenha um papel importante em nossas vidas cotidianas, em função do crescimento dos ativos de Tecnologia da informação e de comunicações (TIC) e os ambientes cada vez mais conectados. Como resultado, os problemas de segurança da informação agora devem ser considerados relevantes a nossa sociedade. Cada vez mais temos informações de Governos, empresas e pessoas tendo seus dados vazados em função de falhas de segurança da informação, tanto em Hardware e Software dos ativos de TIC. Para a inspeção dos ativos de TIC existem oo processos de avaliação de segurança, que são procedimentos para verificar o atendimento a requisitos por meio da execução de testes sistemáticos denominados ensaios, os chamados de Programas de Avaliação da Conformidade (PACs). No intuito de identificar as falhas dos ativos de TIC, através da detecção de tráfego malicioso, este trabalho propõe uma estrutura baseada em caixa preta em ambientes de TIC. O método de caixa preta permite monitorar a rede sem acessar o código do software, que pode ser inviável nas empresas,para seus funcionários. Em nossa proposta, unimos a segurança da informação e do uso de recursos de rede para executar uma detecção confiável de tráfego malicioso. Primeiramente, coletamos informações de tráfego de rede, gerando um conjunto de dados a partir de ferramentas comerciais de rede. Nosso esquema de detecção proposto foi validado verificando a correlação entre alertas de segurança de rede e uso de recursos de rede, como taxa de transferência e número de conexões TCP. Os resultados mostram que o esquema proposto pode detectar com segurança o tráfego malicioso em um ambiente real de rede de TIC.

Dissertação

Defesa de dissertação (23/12/2019): Carlos Roberto Gonçalves Viana Filho

Discente: Carlos Roberto Gonçalves Viana Filho

Título: Uma Proposta de Padronização Brasileira para a Avaliação de Risco em Ambientes Computacionais

Orientadores: Felipe da Rocha Henriques (orientador), Raphael Carlos Santos Machado (co-orientador)

Banca: Felipe da Rocha Henriques (presidente), Raphael Carlos Santos Machado (UFF), Diego Nunes Brandão

 (CEFET/RJ),  Michel Pompeu Tcheou (UERJ)

Dia/Hora: 23 de dezembro de 2019/ 13h

Sala: Auditório V – 5º andar

Resumo:

As sociedades modernas encontram-se cada vez mais dependentes de sistemas computacionais, serviços e de toda sua infraestrutura. Portanto, erros, instabilidades e indisponibilidades destes, podem trazer grandes prejuízos materiais e financeiros para empresas, indústrias  e governos em seus diversos níveis. Com o objetivo de garantir a segurança para os seus sistemas computacionais e minimizar os riscos inerentes a sua crescente utilização as organizações têm trabalhado e investido na implantação de programas de avaliação da conformidade para ativos computacionais.

No Brasil, atualmente não existe uma legislação própria (ou padronização) que exija que os sistemas tenham um mínimo de requisitos de segurança e consequentemente que sua avaliação seja realizada e devidamente comprovada. Em muitos casos, padrões internacionais são usados por empresas Brasileiras para avaliação de conformidade. Porém, nem sempre esses padrões estão adequados ao cenário nacional. Nota-se, seja pela falta de padronização e pela sua pouca maturidade em relação os quesitos de segurança, que o país sofre com vários desafios para assegurar que seus ativos computacionais estejam devidamente protegidos contra os mais diversos tipos de ataques existentes. Entretanto embora o estabelecimento de Programas de Avaliação de Conformidade para Tecnologia da Informação e Ativos de Comunicação seja considerado um grande desafio, podemos afirmar que a avaliação de alguns programas através de uma abordagem orientada para o risco tem contribuído concretamente para a solução do problema supracitado. A adoção de tal abordagem pressupõe a definição de um conjunto de requisitos que devem ser atendidos por um  determinado produto e de uma série de ensaios que deverão ser executados sobre o mesmo, de modo a atestar o atendimento àqueles requisitos.

Neste trabalho, propomos uma padronização para o cenário brasileiro para avaliação de riscos em ambientes computacionais. Uma metanálise é considerada para avaliar a proposta e, com base nos resultados obtidos, verificamos que a adaptação de padrões internacionais para o cenário brasileiro é uma boa alternativa para implantação em larga escala, o que pode levar à redução de custo e tempo para empresas.

Dissertação

Aluno do Grupo de Robótica coordenado por docente do PPCIC é premiado na OBI

O aluno do médio/técnico Erick Gaiote integrante do Grupo de Robótica Maracanã coordenado pelo docente João Quadros do PPCIC recebeu a premiação de Honra ao Mérito na modalidade Programação Nível 2 da Olimpíada Brasileira de Informática (OBI) de 2019. Essa é mais uma  conquista do trabalho do professor João Quadros articulado pela verticalização da educação no CEFET/RJ, e virou notícia no site da instituição (confira a notícia na íntegra aqui).

Aluno do PPCIC desenvolve Pesquisa sobre Análise de Dados em Evasão na UFF

O aluno Gustavo Alexandre do PPCIC, orientado pelo professor Diego Brandão e responsável pela área de Gestão e Governança de Dados na TI da Universidade Federal Fluminense (UFF), está desenvolvendo no seu trabalho de mestrado um modelo de predição capaz de identificar alunos com risco de evasão. A pesquisa foi publicada no Simpósio Brasileiro de Banco de Dados (SBBD) deste ano e ganhou destaque com a divulgação do trabalho no site da UFF.

Também são colaboradores da pesquisa os docentes Diego Haddad (CEFET/RJ), Kele Belloze (CEFET/RJ)  e Luiz Tarracata (CEFET/RJ).

Confira a notícia completa em Produção de conhecimento: estudo sobre evasão no ensino superior.

Defesa de dissertação (16/12/2019): Alexandre Cunha

Discente: Alexandre Cunha

Título: Detecção de Sinais de eventos Adversos de Medicamentos em Textos Informais

Orientador: Gustavo Paiva Guedes e Silva (orientador)

Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Ogasawara (CEFET/RJ), Kele Belloze (CEFET/RJ), Fellipe Duarte (UFRRJ)

Dia/Hora: 16 de dezembro de 2019 / 14h

Sala: Auditório 5 (Bloco E, 5o andar)

Resumo:

A vigilância em saúde, conhecida como farmacovigilância, se define como: “a ciência e as atividades relativas à identificação, avaliação, compreensão e prevenção dos efeitos adversos ou qualquer outro problema relacionado com medicamentos” WHO [2002].  Eventos adversos a medicamentos são responsáveis por aproximadamente 25% dos pacientes internados no atendimento primário, sendo considerados graves em 13% dos casos Meyboom et al. [1999]. A farmacovigilância atua no período de pós-aprovação do medicamento, podendo evitar e atenuar certos eventos adversos. O acesso às várias categorias de dados de saúde no período atual, expande a capacidade de análise para pesquisa relacionada a farmacovigilância. Com o advento das técnicas de mineração de texto (MT), processamento de linguagem natural (PLN), aprendizagem de máquina (AM) e extração da informação (EI), houve a possibilidade de extração de conhecimento de textos não estruturados e informais, obtidos de mídias sociais. O objetivo desta dissertação é, ao utilizar a extração da informação, criar um modelo a partir da MT e PLN e detectar sinais de eventos adversos em medicamentos nos textos da mídia social (Twitter) escritos em português do Brasil. A dissertação apresenta extensa revisão bibliográfica sobre os conceitos citados. Guiando o processo, foi desenvolvida uma abordagem baseada na metodologia de MT para identificar possíveis sinais de eventos adversos. Esse processo foi implementado com auxílio do CoreNLP. Para essa dissertação, foi escolhido o idioma português brasileiro, para o qual não existe suporte nativo do CoreNLP, dessa forma,foram implementados o analisador sintático (Pos-Tagger) e o parse de dependência (DEP-PARSER) em português brasileiro, bem como, treinado um modelo de detecção de entidades nomeadas no domínio da farmacovigilância em português Brasileiro, utilizando AM em uma abordagem híbrida. Foi proposto um algoritmo para efetiva detecção de sinal de eventos adversos em medicamentos. Complementa-se a metodologia com a experimentação dos modelos criados e do algoritmo desenvolvido. Os resultados representem um esforço inicial na tentativa de atuar sobre o idioma português brasileiro no campo da farmacovigilância. Os experimentos abriram caminho para fomentar o tema e fornecer um instrumental para caminhar em direção ao estado da arte, especificamente para a língua portuguesa.

Dissertação

 [:en]Discente: Alexandre Cunha

Título: Detecção de Sinais de eventos Adversos de Medicamentos em Textos Informais

Orientador: Gustavo Paiva Guedes e Silva (orientador)

Banca: Gustavo Paiva Guedes e Silva (presidente), Eduardo Ogasawara (CEFET/RJ), Kele Belloze (CEFET/RJ), Fellipe Duarte (UFRRJ)

Dia/Hora: 16 de dezembro de 2019 / 14h

Sala: Auditório 5 (Bloco E, 5o andar)

Resumo:

A vigilância em saúde, conhecida como farmacovigilância, se define como: “a ciência e as atividades relativas à identificação, avaliação, compreensão e prevenção dos efeitos adversos ou qualquer outro problema relacionado com medicamentos” WHO [2002].  Eventos adversos a medicamentos são responsáveis por aproximadamente 25% dos pacientes internados no atendimento primário, sendo considerados graves em 13% dos casos Meyboom et al. [1999]. A farmacovigilância atua no período de pós-aprovação do medicamento, podendo evitar e atenuar certos eventos adversos. O acesso às várias categorias de dados de saúde no período atual, expande a capacidade de análise para pesquisa relacionada a farmacovigilância. Com o advento das técnicas de mineração de texto (MT), processamento de linguagem natural (PLN), aprendizagem de máquina (AM) e extração da informação (EI), houve a possibilidade de extração de conhecimento de textos não estruturados e informais, obtidos de mídias sociais. O objetivo desta dissertação é, ao utilizar a extração da informação, criar um modelo a partir da MT e PLN e detectar sinais de eventos adversos em medicamentos nos textos da mídia social (Twitter) escritos em português do Brasil. A dissertação apresenta extensa revisão bibliográfica sobre os conceitos citados. Guiando o processo, foi desenvolvida uma abordagem baseada na metodologia de MT para identificar possíveis sinais de eventos adversos. Esse processo foi implementado com auxílio do CoreNLP. Para essa dissertação, foi escolhido o idioma português brasileiro, para o qual não existe suporte nativo do CoreNLP, dessa forma,foram implementados o analisador sintático (Pos-Tagger) e o parse de dependência (DEP-PARSER) em português brasileiro, bem como, treinado um modelo de detecção de entidades nomeadas no domínio da farmacovigilância em português Brasileiro, utilizando AM em uma abordagem híbrida. Foi proposto um algoritmo para efetiva detecção de sinal de eventos adversos em medicamentos. Complementa-se a metodologia com a experimentação dos modelos criados e do algoritmo desenvolvido. Os resultados representem um esforço inicial na tentativa de atuar sobre o idioma português brasileiro no campo da farmacovigilância. Os experimentos abriram caminho para fomentar o tema e fornecer um instrumental para caminhar em direção ao estado da arte, especificamente para a língua portuguesa.

Dissertation

 

Manual de Manutenção e Suporte a Drones

O Projeto Grupo Robótica Maracanã, coordenado pelo prof. João Quadros do PPCIC, produziu o Manual de Manutenção e Suporte de Drones F450 em 2017, que recebeu atualizações em 2018 e 2019. O manual contém informações úteis a quem deseja construir, configurar e pilotar um drone F450 e pode ser acessado através deste link.

 

Artigo de Professor do PPCIC recebe Menção Honrosa em Evento

O artigo do professor Felipe Rocha Henriques do PPCIC, intitulado “Performance Evaluation and Comparison of Default and Small Private Key Rainbow Digital Signature Scheme for IoT Devices“, recebeu menção honrosa no XXV Simpósio Brasileiro de Sistemas Multimídia e Web (WebMedia 2019). O evento foi realizado entre os dias 29  de outubro e 01 de novembro no CEFET/RJ.
Também são coautores do trabalho Matheus Dornelles (CEFET/RJ) e Pedro Lara (CEFET/RJ).

Dissertação de Mestrado do PPCIC foi premiada em 1º lugar no Concurso de Teses e Dissertações durante o WebMedia 2019

A dissertação de mestrado do Raphael Abreu, que concluiu seu Mestrado em 2018 no PPCIC, foi premiada em 1º lugar no Concurso de Teses e Dissertações durante o XXV  Simpósio Brasileiro de Sistemas Multimídia e Web (WebMedia 2019). O evento aconteceu entre os dias 29 de outubro e 01 de novembro no CEFET/RJ. A dissertação intitulada “Mais de um sentido: Facilitando a autoria, sincronização e execução de efeitos sensoriais em linguagens multimídia“, foi orientada pelos docentes Joel dos Santos e Eduardo Bezerra do PPCIC.

 

Equipes de Robótica do CEFET/RJ participam de Competição noticiada em Programa de TV

As duas equipes, a Winged Wolves Sr e a Winged Wolves Jr, do Projeto Grupo Robótica Maracanã (PGRM) do CEFET/RJ – Maracanã apareceram no quadro “Hoje é dia de drone” do programa “Como Será?” com Sandra Annenberg da Rede Globo. A reportagem exibida em 19/10/2019 foi sobre a Competição Fórmula Drone 2019 que contou com a participação das nossas equipes. A competição é patrocinada pela SAE Brasil e foi realizada entre os dias 05 e 08 de setembro de 2019 na Universidade Federal de Itajubá (MG). O docente João Quadros do PPCIC é o chefe desse projeto.

Confira a reportagem: Hoje é dia de drone: a competição

Para maiores informações sobre esse projeto, acesse Projeto Grupo Robótica Maracanã (PGRM).

Artigo de docente do PPCIC é premiado como “best paper” pela Sociedade Brasileira de Robótica

O docente Diego Haddad do PPCIC conseguiu o prêmio de melhor artigo do LARS/SBR 2019, o maior evento de robótica da América Latina, que aconteceu entre os dias 22 e 26 de outubro na Universidade Federal do Rio Grande (FURG) com o trabalho intitulado “A novel sequential activation method for the locomotion of quadrupedal soft robots” (e acessível em https://ieeexplore.ieee.org/document/9018579).

O evento internacional foi composto por diversos subeventos: a Mostra Nacional de Robótica (MNR); as finais da Olimpíada Brasileira de Robótica (OBR); a Competição Brasileira de Robótica (CBR), a Competição de Robótica Latino-americana (LARC); o Workshop de Robótica na Educação (WRE); o Simpósio Brasileiro de Robótica (SBR); e o Simpósio Latino-americano de Robótica (LARS).

Promovido pela Sociedade Brasileira de Computação (SBC), pelo Institute of Electrical and Electronic Engineers (IEEE) e pelo RobCup Brasil, o evento visa promover um abrangente encontro científico na área de Robótica Inteligente. A programação incluiu sessões técnicas de apresentação oral de trabalhos completos e palestras técnicas de reconhecida importância na área.

Defesa de dissertação (13/11/2019): Leonardo da Silva Moreira

Discente: Leonardo da Silva Moreira

Título: Evaluation of Data Preprocessing Methods for Predicting Brazilian Flight Delays

Orientador: Jorge de Abreu Soares (orientador), Eduardo Soares Ogasawara (co-orientador)

Banca: Jorge de Abreu Soares (presidente), Eduardo Soares Ogasawara (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Leonardo Gresta Paulino Murta (IC/UFF)

Dia/Hora: 13 de novembro de 2019 /14 horas

Sala: E-522

Resumo:

Em 2016, as receitas do setor de serviços aéreos do Brasil alcançaram um recorde histórico de receita de R$35,59 bilhões, transportando 109,6 milhões de passageiros de acordo com levantamento da Agência Nacional de Aviação Civil (ANAC). Considerando esse cenário, atrasos nos voos causam vários inconvenientes para as companhias aéreas, aeroportos e passageiros como ocorreram entre 2009 e 2015, onde cerca de 22% dos voos domésticos realizados no Brasil sofreram atrasos superiores a 15 minutos. A previsão desses atrasos é fundamental para mitigar sua ocorrência e otimizar o processo de tomada de decisão de um sistema de transporte aéreo. Particularmente, companhias aéreas, aeroportos e usuários podem estar mais interessados em saber quando é provável que ocorram atrasos do que a previsão precisa de quando não ocorrerão. Neste contexto, esta pesquisa apresenta uma avaliação experimental de métodos de pré-processamento de dados para modelos de classificação de aprendizado de máquina para a predição dos atrasos aéreos, de forma a identificar quais métodos e combinações destes métodos podem auxiliar na melhora da predição e dos resultados do classificador sob uma distribuição desequilibrada de classes de atraso. Para isto a metodologia utilizada inclui a integração de dados aéreos e meteorológicos, etapas de pré-processamento [limpeza, transformação, redução] e finalmente a comparação da predição de dados a partir destes diferentes métodos de pré-processamento. Particularmente, esta pesquisa contribui com a análise de um espectro de métodos de pré-processamento de dados quando comparado à revisão bibliográfica, focando especialmente a distribuição das classes de atraso. Incluem-se entre os objetivos deste trabalho a verificação mais detalhada em relação aos atributos do classificador,a normalização e discretização, principalmente no que diz respeito à faixa de parâmetros do filtro.

Dissertação

 [:en]Student: Leonardo da Silva Moreira

Title: Evaluation of Data Preprocessing Methods for Predicting Brazilian Flight Delays

Advisors: Jorge de Abreu Soares (advisor), Eduardo Soares Ogasawara (co-advisor)

Committee: Jorge de Abreu Soares (president), Eduardo Soares Ogasawara (CEFET/RJ), Eduardo Bezerra da Silva (CEFET/RJ), Leonardo Gresta Paulino Murta (IC/UFF)

Day/Time: November 13, 2019 / 14h

Room: E-522

Abstract:

In 2016, revenues from Brazil’s air services sector reached record revenue of $ R$ 35.59$ billion, transporting 109.6 million passengers, according to a survey by the National Civil Aviation Agency (ANAC). Considering this scenario, delays in flights cause several inconveniences to airlines, airports, and passengers as they occurred between 2009 and 2015, where about 22% of domestic flights made in Brazil were delayed for more than 15 minutes. Predicting these delays is critical to mitigate their occurrence and optimize the decision-making process of an air transport system. In particular, airlines, airports, and users may be more interested in knowing when delays are likely to occur than the forecast needs to know when they will not occur. In this context, this research presents an experimental evaluation of data preprocessing methods for machine learning classification models for the prediction of flight delays, in order to identify which methods and combinations of these methods can help improve prediction and results of the classifier under an unbalanced distribution of delay classes. For this, the methodology used includes the integration of aerial and meteorological data, pre-processing steps [cleaning, transformation, reduction] and finally the comparison of data prediction from these different pre-processing methods. In particular, this research contributes to the analysis of a spectrum of data preprocessing methods when compared to the bibliographic review, especially focusing on the distribution of delay classes. Among the objectives of this work are the more detailed verification in relation to the attributes of the classifier, the normalization, and discretization, mainly with respect to the range of parameters of the filter.

Dissertation

 

Artigo de discente do Programa recebe prêmio de melhor artigo do SBBD 2019 (short, vision, industry)

O Simpósio Brasileiro de Banco de Dados (http://sbbd.org.br/2019) é o evento mais importante de Banco de Dados do Brasil. Neste ano, o discente Arthur Ronald e os Professores Eduardo Ogasawara e Kele Belloze receberam o prêmio de best paper (short, vision, industry) do SBBD 2019 com o trabalho intititulado “Modelo autorregressivo de integração adaptativa”.

Título: Modelo autorregressivo de integração adaptativa

Resumo:

Diversas técnicas de preprocessamento combinadas a modelos de séries temporais vêm sendo utilizadas para previsão de séries temporais não-estacionárias. O estudo das propriedades matemáticas e estatísticas dos dados e das técnicas de preprocessamento pode auxiliar no ajustamento de modelos de aprendizado de máquina. Tal estudo, entretanto, muitas vezes não é facilmente obtido. Modelos lineares, por sua vez, possibilitam a interpretação de tais propriedades. Este artigo introduz e analisa, por meio de prova de conceito, um novo modelo linear aplicado a séries estacionárias construídas com base em normalização adaptativa. O modelo viabiliza o uso de modelos autorregressivos em cenários de janelas deslizantes que preservam as propriedades da série original, e permitem acompanhar a sua inércia. O modelo foi capaz de apresentar desempenho de previsão superior a outros modelos lineares consolidados na literatura, principalmente em horizontes de curto-prazo.

 

 

Apresentação

Artigo

Temas de Pesquisa dos Docentes

Nesta página encontram-se os vídeos dos temas de pesquisa dos docentes permanentes do Programa que estão oferecendo vagas no processo seletivo.

 

Diego Brandão

 

Diego Haddad

https://youtu.be/SsPd5kO6yNM

 

Eduardo Bezerra

Eduardo Ogasawara

https://youtu.be/BcGEi66qWMA

 

Gustavo Guedes

 

João Quadros

 

Joel Santos

 

Kele Belloze

 

Laura Assis

 

Pedro Gonzalez

 

Rafaelli Coutinho

 

Docentes do PPCIC estão na organização do SBrT 2019

O Simpósio Brasileiro de Telecomunicações e Processamento de Sinais é organizado pela Sociedade Brasileira de Telecomunicações (SBrT). A SBrT foi fundada em 1983, e é uma sociedade científica sem fins lucrativos que reúne profissionais dos setores acadêmico, industrial e de serviços de telecomunicações e áreas afins. Em setembro de 1983, realizou-se o primeiro Simpósio Brasileiro de Telecomunicações no Rio de Janeiro. Desde então a Sociedade Brasileira de Telecomunicações organiza anualmente o Simpósio Brasileiro de Telecomunicações (SBrT), que se tornou o fórum de referência para os profissionais do setor. Em sua trigésima sétima edição, o Simpósio Brasileiro de Telecomunicações e Processamento de Sinais será realizado em Petrópolis/RJ entre os dias 29 de setembro e 02 de outubro de 2019. O tema geral do SBrT em 2019 é Comunicação, Aprendizado e Cooperação entre Máquinas, Objetos e Humanos. Esta edição do SBrT contará com a participação dos seguintes docentes do PPCIC:
  • prof. Diego Barreto Haddad, como Coordenador de Minicursos;
  • prof. Felipe da Rocha Henriques, como Coordenador Local.
Mais informações sobre o evento em: http://sbrt.org.br/sbrt2019/

Projetos aprovados para apoio ao WebMedia 2019

O professor Joel Santos teve aprovados os projetos CAPES PAEP (Edital 07/2019) e FAPERJ APQ2 (Edital 03/2019) para apoio a eventos científicos. Ambos os projetos apoiarão a realização do XXV Simpósio Brasileiro de Sistemas Multimídia e Web (WebMedia 2019) a ser realizado no CEFET/RJ de 29 de outubro a 1 de novembro.