Defesa de dissertação (12/08/2020): Aíquis Rodrigues Gomes

Discente: Aíquis Rodrigues Gomes

Título: Rumo à Publicação de Dados Abertos Governamentais como Dados Abertos Ligados utilizando uma Abordagem baseada em Ontologias

Orientadora: Kele Teixeira Belloze

Banca: Kele Teixeira Belloze (presidente), Laura Silva de Assis (CEFET/RJ) e Maria Claudia Reis Cavalcanti (IME)

Dia/hora: 12 de agosto de 2020, às 14h.

Sala remota: meet.google.com/vmx-bzig-jbt

Resumo:

Governos sao grandes produtores e publicadores de dados e têm buscado utilizá-los como forma de aumentar a transparencia e gerar mais valor para a sociedade. No entanto, o nível de maturidade na publicação de dados governamentais ainda é baixo, o que resulta na publicação utilizando formatos que dificultam a conexão com outros conjuntos de dados e a leitura por parte de maquinas, além de publicações que não
são realmente em formatos abertos. Dados Abertos Ligados constituem um conjunto de tecnologias e padrões da web semântica que permitem a ligação entre diferentes conjuntos de dados abertos publicados na web. Por intermédio dos Dados Abertos Ligados, governos podem atingir alto grau de maturidade na publicação de dados utilizando um formato realmente aberto, que permite a leitura por máquinas e que pode potencializar o valor gerado para a sociedade com iniciativas de dados. No entanto, existem algumas barreiras para a publicação dos dados utilizando essas tecnologias e padrões. Uma dessas barreiras refere-se a falta de um guia para sua implementação que possa direcionar, de maneira estruturada, os passos a serem seguidos para a publicação de um conjunto de dados como Dados Abertos Ligados. Nesse trabalho é apresentada uma metodologia baseada no uso de ontologia para que conjuntos de dados publicados em formatos tradicionais possam ser publicados como
Dados Abertos Ligados. A metodologia é composta por quatro etapas: (i) identificação, análise e integração dos dados; (ii) desenvolvimento da ontologia; (iii) publicação dos dados como Dados Abertos Ligados; e (iv) publicação de endpoint SPARQL. Dois experimentos utilizando conjuntos de dados governamentais reais dos domínios eleitoral e da saúde foram realizados seguindo a metodologia proposta. Como resultados houve a produção de duas ontologias, sobre as eleições brasileiras e sobre as Unidades Básicas de Saúde em funcionamento no Brasil, e a disponibilização dos dois conjuntos de dados referentes a essas ontologias em arquivos RDF com alguns dos recursos ligados a outros conjuntos de dados. Com os experimentos foi possível comprovar que por meio de um processo estruturado e possível evoluir na publicação de dados abertos e que os passos propostos podem ser aplicados independente do domínio dos dados.

Dissertação