Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem RDB2LOD

Autores

  • Clayton Martins Pereira Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP http://orcid.org/0000-0003-0432-4216
  • Edberto Ferneda Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP http://orcid.org/0000-0002-8808-1217
  • José Eduardo Santarem Segundo Universidade de São Paulo, Faculdade de Filosofia Ciências e Letras de Ribeirão Preto. http://orcid.org/0000-0003-3360-7872

DOI:

https://doi.org/10.19132/1808-5245263.94-120

Palavras-chave:

Recuperação da informação, Bases de dados relacionais, Dados ligados, Dados abertos ligados, Web Semântica.

Resumo

Os dados abertos ligados têm se tornado um padrão para publicação e enriquecimento de dados, o que promove a transição de uma Web orientada a documentos para uma Web de dados e, por conseguinte, para a Web Semântica. Por outro lado, bases de dados relacionais compõem o núcleo da maioria dos sistemas de informação atualmente em operação. Assim, a publicação da imensa quantidade de dados mantidos em bases de dados relacionais, seguindo as boas práticas e recomendações do Linked Data, pode contribuir significativamente para a consolidação das ferramentas e tecnologias da Web Semântica. É nesse contexto que surgiu a abordagem RDB2LOD para publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. Porém, depois de os dados serem efetivamente publicados, o passo seguinte é recuperá-los de forma eficiente para o seu devido consumo. Este trabalho, de natureza qualitativa e do tipo exploratório, tem como objetivo fazer uma análise do processo de recuperação da informação na abordagem RDB2LOD, a fim de averiguar se a utilização desta abordagem pode facilitar a formulação de consultas SPARQL e, consequentemente, melhorar a visualização e exploração dos dados recuperados. Para isso foi realizada uma pesquisa bibliográfica e documental, além de um experimento no qual a abordagem teve seu processo de recuperação da informação avaliado em dois casos distintos. Ficou demonstrado que, ao levar em consideração os aspectos semânticos dos termos empregados nas expressões de consulta, por meio da aplicação de ontologias, é possível tornar mais eficiente e precisa a recuperação de dados.

Downloads

Não há dados estatísticos.

Biografia do Autor

Clayton Martins Pereira, Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP

Doutorando em Ciência da Informação, área Informação, Tecnologia e Conhecimento, na Universidade Estadual Paulista Júlio de Mesquita Filho (UNESP), onde é membro do Grupo de Pesquisa NEWSDA - Núcleo de Estudos em Web Semântica e Análise de Dados. Mestre em Engenharia Eletrônica e Computação, área Informática, pelo Instituto Tecnológico de Aeronáutica (ITA). Especialização em Gerência de Projetos de Tecnologia da Informação pela Universidade do Sul de Santa Catarina (UNISUL). Exerce o cargo de Analista em C&T (área TI) no Instituto Nacional de Pesquisas Espaciais (INPE), unidade de pesquisas do Ministério da Ciência, Tecnologia, Inovações e Comunicações (MCTIC), onde atua nas áreas de Gestão da Informação e Gestão da Produção Científica. Atualmente é Administrador da Biblioteca Digital e Membro do Comitê Assessor de Tecnologia da Informação do INPE.

Edberto Ferneda, Universidade Estadual Paulista (UNESP), Faculdade de Filosofia e Ciências, Marília – SP

Livre-Docente em Recuperação de Informação (2016). Pós-doutorado pela Universidade Federal da Paraíba (2013). Doutor em Ciências da Comunicação (Ciência da Informação) pela Universidade de São Paulo (2003). Mestre em Informática pela Universidade Federal da Paraíba (1997). Possui graduação em Processamento de Dados pela antiga Fundação Educacional de Bauru (1985). Atualmente é Professor Associado do Departamento de Ciência da Informação da Universidade Estadual Paulista 'Julio Mesquita Filho' (UNESP) - Campus de Marília. Atua na Ciência da Informação, principalmente nas áreas de Indexação Automática e Recuperação de Informação. Bolsista Produtividade em Pesquisa CNPq - Nível 2

José Eduardo Santarem Segundo, Universidade de São Paulo, Faculdade de Filosofia Ciências e Letras de Ribeirão Preto.

Pós-Doutorado pela Faculdade de Engenharia da Computação da Western University/Canadá. Doutor e Mestre em Ciência da Informação pela Universidade Estadual Paulista Júlio de Mesquita Filho-UNESP-Marília/SP; Professor Doutor no Departamento de Educação, Informação e Comunicação, da Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, da Universidade de São Paulo (USP); Docente do Programa de Pós-Graduação em Ciência da Informação da UNESP/Marília na linha de Informação e Tecnologia. Coordenador do GT8 - Informação e Tecnologia, da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB). Atua na linha de pesquisa - Ambientes Digitais e Tecnologias Aplicadas a Informação e Comunicação - , com ênfase em Web Semântica, Linked Data, Big Data, Aprendizado de Maquina (Machine Learning), Dados Abertos e Acervos Digitais. Lider do NEWSDA - Núcleo de Estudos em Web Semantica e Dados Abertos. Recebeu o Prêmio de Melhor Tese pela Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (ANCIB) - Ano 2011. Recebeu também Menção Honrosa no Prêmio Capes de Teses - 2011 (Ciências Sociais Aplicadas)

Referências

BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, v. 284, p. 28-37, 2001.

CONEGLIAN, C. S. et al. O papel estratégico da Web Semântica no contexto do big data. In: WORKSHOP DE INFORMAÇÃO, DADOS E TECNOLOGIA, 1., 2017, Florianópolis. Anais [...]. Florianópolis: UFSC, 2017. p. 1-6.

CRISTOVÃO, H. M.; FERNANDES, J. H. C. Recuperação de informação em dados ligados: um modelo baseado em mapas conceituais e análise de redes complexas. Transinformação, Campinas, v. 30, n. 2, p. 193-207, 2018.

CUBA RODRÍGUEZ, Y.; OLIVERA BATISTA, D. Los metadatos, la búsqueda y recuperación de información desde las Ciencias de la Información. e-Ciencias de la Información, San José, v. 8, n. 2, p. 3-13, 2018.

DEVI, R.; MEHROTRA, D.; BAAZAOUI-ZGHAL, H. Pubworld - A R2RML mapping driven approach to transform relational database data into shareable format. In: INSTITUTE OF ELECTRICAL AND ELETRONICS ENGINEERS INTERNATIONAL ADVANCE COMPUTING CONFERENCE, 8., 2018, Greater Noida. Proceedings […]. Piscataway: IEEE, 2018. p. 221-227.

FERNÁNDEZ, M. et al. Semantically enhanced Information Retrieval: an ontology-based approach. Journal of Web Semantics, Amsterdam, v. 9, n. 4, p. 434-452, 2011.

FERNEDA, E. Material da disciplina Recuperação de Informação: técnicas e tecnologias. Marília: Unesp, 2019. 1 diapositivo. Acesso em: 6 set. 2019.

GONZALEZ, M.; LIMA, V. L. S. Recuperação de Informação e Processamento da Linguagem Natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO, 23., 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003. p. 347-395.

LANTI, D.; XIAO, G.; CALVANESE, D. VIG: Data scaling for OBDA benchmarks. Semantic Web, Amsterdam, v. 10, n. 2, p. 413-433, 2019.

LAUFER, C. Guia de Web semântica. São Paulo: Projeto SPUK, 2015.

LIDDY, E. D. Enhanced Text retrieval using natural language processing. Bulletin of the American Society for Information Science and Technology, New Jersey, v. 24, n. 4, p. 14-16, 1998.

LING, H.; ZHOU, S. Translating relational databases into RDF. In: INTERNATIONAL CONFERENCE ON ENVIRONMENTAL SCIENCE AND INFORMATION APPLICATION TECHNOLOGY, 2., 2010, Wuhan. Proceedings [...]. Piscataway: IEEE, 2010. p. 464-467.

PABÓN, O. S.; GONZÁLEZ, M. E. del S. M. Propuesta para extender semánticamente el proceso de recuperación de información. Escuela de ingenieria de Antioquia, Envigado, v. 11, n. 22, p. 51-65, 2014.

PATEL, A.; JAIN, S. Present and future of semantic web technologies: a research statement. International Journal of Computers and Applications, Abingdon, p. 1-10, 2019.

PEREIRA, C. M. Uma abordagem para a publicação de dados abertos ligados obtidos a partir de bases de dados relacionais. 2012. Dissertação (Mestrado em Informática) - Curso de Pós-Graduação em Engenharia Eletrônica e Computação, Instituto Tecnológico de Aeronáutica, São José dos Campos, 2012.

SANTAREM SEGUNDO, J. E.; CONEGLIAN, C. S. Web semântica e Ontologias: um estudo sobre construção de axiomas e uso de inferências. Informação & Informação, Londrina, v. 21, n. 2, p. 217-244, 2016.

SANTAREM SEGUNDO, J. E. Web semântica: fluxo para publicação de dados abertos e ligados. Informação em Pauta, Fortaleza, v. 3, n. esp., p. 117-140, 2018.

SCHAIBLE, J.; GOTTRON, T.; SCHERP, A. Survey on common strategies of vocabulary reuse in Linked Open Data modeling. In: PRESUTTI, V.; D’AMATO, C.; GANDON, F.; D’AQUIN, M.; STAAB, S.; TORDAI, A. (ed.). ESWC 2014: the Semantic Web: trends and challenges. Berlin: Springer, 2014. p. 457-472 (Lecture Notes in Computer Science, v. 8465).

SILVELLO, G. et al. Semantic representation and enrichment of information retrieval experimental data. International Journal of Digital Libraries, Berlin, v. 18, p. 145-172, 2017.

ULUTAŞ KARAKOL, D. et al. Semantic linking spatial RDF data to the web data sources. International Archives of Photogrammetry and Remote Sensing Spatial Information Science, Delft, v. XLII-4, p. 639-645, 2018.

Downloads

Publicado

2020-09-16

Como Citar

MARTINS PEREIRA, C.; FERNEDA, E.; SANTAREM SEGUNDO, J. E. Análise do processo de recuperação da informação em bases de dados publicadas como dados abertos ligados utilizando a abordagem RDB2LOD. Em Questão, Porto Alegre, v. 26, n. 3, p. 94–120, 2020. DOI: 10.19132/1808-5245263.94-120. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/98764. Acesso em: 28 mar. 2024.

Edição

Seção

Artigo

Artigos mais lidos pelo mesmo(s) autor(es)