{"id":1762,"date":"2018-11-30T14:46:32","date_gmt":"2018-11-30T16:46:32","guid":{"rendered":"http:\/\/eic.cefet-rj.br\/ppcic\/?p=1762"},"modified":"2025-09-03T18:55:14","modified_gmt":"2025-09-03T21:55:14","slug":"defesa-de-dissertacao-05-02-2019-rodrigo-tavares-de-souza","status":"publish","type":"post","link":"https:\/\/eic.cefet-rj.br\/ppcic\/defesa-de-dissertacao-05-02-2019-rodrigo-tavares-de-souza\/","title":{"rendered":"Defesa de disserta\u00e7\u00e3o (05\/02\/2019):  Rodrigo Tavares de Souza"},"content":{"rendered":"<p><strong>Discente<\/strong>: Rodrigo Tavares de Souza<\/p>\n<p><strong>T\u00edtulo<\/strong>:\u00a0 Appraisal-Spark: uma abordagem para imputa\u00e7\u00e3o em larga escala<\/p>\n<p><strong>Orientadores<\/strong>: Jorge Abreu Soares (orientador)<\/p>\n<p><strong>Banca<\/strong>: Jorge Abreu Soares (CEFET\/RJ) (presidente), Eduardo Soares Ogasawara (CEFET\/RJ), Ronaldo Ribeiro Goldschmidt (IME)<\/p>\n<p><strong>Dia\/Hora<\/strong>: 05 de fevereiro \/ 10h<\/p>\n<p><strong>Sala<\/strong>: Audit\u00f3rio V<\/p>\n<p><strong>Resumo<\/strong>:<\/p>\n<p>Cresce continuamente o volume de dados armazenados e a demanda por integra\u00e7\u00e3o entre os mesmos. Esse cen\u00e1rio aumenta a ocorr\u00eancia de um problema bastante conhecido dos cientistas de dados: as diversas possibilidades de inconsist\u00eancias. E um tipo de seus tipos comuns, a aus\u00eancia de dados, pode prejudicar a an\u00e1lise e resultado de qualquer t\u00e9cnica produtora de informa\u00e7\u00e3o. A imputa\u00e7\u00e3o \u00e9 a \u00e1rea que estuda m\u00e9todos que buscam aproximar o valor imputado do real. A t\u00e9cnica de imputa\u00e7\u00e3o composta aplica tarefas de aprendizado de m\u00e1quina neste processo. Ela utiliza o conceito de plano de imputa\u00e7\u00e3o, uma sequ\u00eancia l\u00f3gica de estrat\u00e9gias e algoritmos utilizados na produ\u00e7\u00e3o do valor imputado final. Neste trabalho, expandiremos a utiliza\u00e7\u00e3o desta t\u00e9cnica, complementando sua utiliza\u00e7\u00e3o com o classificador ensemble <em>bagging<\/em>. Neste m\u00e9todo, os dados s\u00e3o divididos em grupos aleat\u00f3rios e atrelados a classificadores chamados base <em>learners<\/em>. Para os <em>subsets<\/em> gerados no <em>bagging<\/em> ser\u00e3o retornadas as pontua\u00e7\u00f5es (percentual de assertividade) de cada plano de imputa\u00e7\u00e3o. O plano com maior assertividade dentre todos os <em>subsets<\/em> ser\u00e1 indicado como a sugest\u00e3o de imputa\u00e7\u00e3o para o conjunto completo. O trabalho \u00e9 implementado em um sistema desenvolvido para a ferramenta Spark, denominado Appraisal-Spark, que tem como objetivo gerar valores com maior acur\u00e1cia e desempenho preditivos para ambientes de larga escala. Atrav\u00e9s dele ser\u00e1 poss\u00edvel compor diversos planos de imputa\u00e7\u00e3o de alto desempenho, avaliando estrat\u00e9gias e comparando resultados.<\/p>\n<div><\/div>\n<div><a href=\"https:\/\/sucupira.capes.gov.br\/sucupira\/public\/consultas\/coleta\/trabalhoConclusao\/viewTrabalhoConclusao.jsf?popup=true&amp;id_trabalho=7629786#\"> <img decoding=\"async\" class=\"alignnone wp-image-3271\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/logo-sucupira.png\" alt=\"\" width=\"81\" height=\"29\" \/><\/a><\/div>\n<div><strong>Disserta\u00e7\u00e3o <\/strong><a href=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/11\/04-Rodrigo-Tavares-de-Souza.pdf\"><img decoding=\"async\" class=\"alignnone wp-image-3273\" style=\"-webkit-text-stroke: 0.15px;\" src=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png\" alt=\"\" width=\"15\" height=\"14\" srcset=\"https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2.png 222w, https:\/\/eic.cefet-rj.br\/ppcic\/wp-content\/uploads\/2018\/05\/download-logo2-150x150.png 150w\" sizes=\"(max-width: 15px) 100vw, 15px\" \/><\/a><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Discente: Rodrigo Tavares de Souza T\u00edtulo:\u00a0 Appraisal-Spark: uma abordagem para imputa\u00e7\u00e3o em larga escala Orientadores: Jorge Abreu Soares (orientador) Banca: Jorge Abreu Soares (CEFET\/RJ) (presidente), Eduardo Soares Ogasawara (CEFET\/RJ), Ronaldo Ribeiro Goldschmidt (IME) Dia\/Hora: 05 de fevereiro \/ 10h Sala: Audit\u00f3rio V Resumo: Cresce continuamente o volume de dados armazenados e a demanda por integra\u00e7\u00e3o [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"footnotes":""},"categories":[14,33],"tags":[],"class_list":["post-1762","post","type-post","status-publish","format-standard","hentry","category-defesas","category-noticias-pt"],"_links":{"self":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/1762","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/comments?post=1762"}],"version-history":[{"count":9,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/1762\/revisions"}],"predecessor-version":[{"id":3310,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/posts\/1762\/revisions\/3310"}],"wp:attachment":[{"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/media?parent=1762"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/categories?post=1762"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/eic.cefet-rj.br\/ppcic\/wp-json\/wp\/v2\/tags?post=1762"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}