Palestrante(s): Claudio Teixeira
Local: Canal no Youtube "PPCIC CEFET-RJ"
Data: 27/04/2021 às 19:30
Tópico(s): Mineração de Dados Padrões Frequentes
Canal no Youtube "PPCIC CEFET/RJ" - SEIC 2021 - Claudio Teixeira
Resumo: Analisar tabelas de horários de transportes é uma tarefa que traz a oportunidade de descobrir quais as rotas que geralmente levam a atrasos. A mineração de padrões frequentes é uma técnica usada para apoiar tal tipo de descoberta. No entanto, dependências funcionais são propriedades intrínsecas presentes nas tabelas de horários de transporte. Tais dependências comprometem a busca de padrões, pois geram-se um elevado número de regras de associação (RAs), bem como um custo computacional que pode se tornar inviável. Várias dessas RAs referem-se às mesmas informações. As técnicas de remoção de redundância podem reduzir o número de RAs. No entanto, essas técnicas são projetadas para serem usadas após o término da mineração, o que aumenta o custo computacional de encontrar RAs úteis. Este trabalho apresenta Timetable Pattern Mining (T-mine), um novo método para mineração de padrões que melhora a descoberta de conhecimento em tabela de horários. Avaliamos o T-mine usando o dataset Brazilian Flight Data (BFD) e comparamos o T-mine com a aplicação direta da mineração de padrões frequentes por meio das abordagens com e sem dependências funcionais. Nossos experimentos indicam que o método T-mine é cerca de uma ordem de magnitude mais rápido do que os método tradicional com dependências funcionais.