Absorção das tarefas de processamento de Linguagem Natural (NLP) pela Ciência da Informação (CI)

uma revisão da literatura para tangibilização do uso de NLP pela CI

Autores

DOI:

https://doi.org/10.19132/1808-5245281.13-34

Palavras-chave:

Ciência da Informação, Processamento de Linguagem Natural (NLP), Rede Neural, Revisão Sistemática da Literatura

Resumo

Um dos recentes desafios da abordagem denominada Big Data tem sido extrair informações relevantes de grandes quantidades de dados não estruturados, como por exemplo de textos escritos em diversos idiomas. A principal abordagem de análise de texto e linguagem por meio computacional é chamada de Processamento de Linguagem Natural (Natural Language Processing - NLP, na sigla em inglês). Identificar como as áreas do conhecimento estão utilizando as evoluções em seus domínios, no que tange à NLP, especialmente a Ciência da Informação, por fornecer os principais conceitos de tratamento de dados, informações e conhecimento, é o cerne desse estudo. Este foi estruturado tendo como base uma Revisão Sistemática da Literatura, entendendo ser essa uma abordagem capaz de fundamentar noções iniciais e, ao mesmo tempo, consistentes para a análise da questão central que motivou esse trabalho. Dentre os resultados encontrados está a pouca utilização dos recursos de NLP pela Ciência da Informação.

Downloads

Não há dados estatísticos.

Biografia do Autor

Luander Cipriano de Jesus Falcão, Universidade Federal de Minas Gerais

Doutorando em Ciência da Informação pela UFMG, mestre em Administração, com ênfase em Inteligência Competitiva. Pós-graduado em Finanças e Controladoria, e graduado em Ciências Econômicas pela PUC Minas. Especialista em projetos de inteligência e data analytics.

Brenner Lopes, Universidade Federal de Minas Gerais

Possui graduação em Economia, com mestrado em Administração e é doutorando na Escola de Ciência da Informação da UFMG. Executivo da área de consultoria em Inteligência Competitiva e Big Data Analytics, atua ainda como professor de pós-graduação.

Renato Rocha Souza, Universidade Federal de Minas Gerais

Possui graduação em Engenharia Elétrica pela Pontifícia Universidade Católica do Rio de Janeiro (1993), mestrado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2000), doutorado em Ciência da Informação pela Universidade Federal de Minas Gerais (2005) e pós-doutorado (01/2009-01/2010) em Tecnologias Semânticas para Recuperação de Informação - University of Glamorgan, UK, sob supervisão de Douglas Tudhope e com bolsa do CNPQ.

 

É atualmente professor e pesquisador da Escola de Matemática Aplicada (EMAp) da Fundação Getulio Vargas e professor colaborador da Escola de Ciência da Informação da Universidade Federal de Minas Gerais. É Visiting Fellow da University of Glamorgan (2009-2014) e Editor Adjunto do periódico New Review of Hypermedia and Multimedia.

 

Tem experiência na área de Ciência da Informação, com ênfase em Representação do Conhecimento e Recuperação de Informação, atuando principalmente nos seguintes temas: Sistemas de Recuperação de Informações, Processamento de Linguagem Natural, Indexação Automática, Representação do Conhecimento, Ontologias, Gestão do Conhecimento. Tem também experiência em Tecnologia na Educação, Software Educativo e Ensino a Distância.

Referências

AGERRI, Rodrigo et al. Big data for Natural Language Processing: a streaming approach. Knowledge-Based Systems, Amsterdam, v. 79, p. 36-42, 2015. DOI: 10.1016/j.knosys.2014.11.007.

BOTELHO, Louise Lira Roedel; CUNHA, Cristiano Castro de Almeida; MACEDO, Marcelo. O método da revisão integrativa nos estudos organizacionais. Gestão e Sociedade, Belo Horizonte, v. 5, n. 11, p. 121-136, 2011. DOI: 10.21171/ges.v5i11.1220.

BUSH, Vannevar. As we may think. Atlantic Monthly, Boston, v. 176, n. 1, p. 101-108, 1945.

CHANG, Yu-Wei. Examining interdisciplinarity of library and information science (LIS) based on LIS articles contributed by non-LIS authors. Scientometrics, Dordrecht, v. 116, n. 3, p. 1589-1613, 2018. DOI: 10.1007/s11192-018-2822-7.

CRESWELL, John W. Research design: qualitative, quantitative, and mixed methods approaches. 4. ed. Los Angeles: Sage Publications, 2014.

CROWSTON, Kevin; ALLEN, Eileen E.; HECKMAN, Robert. Using natural language processing technology for qualitative data analysis. International Journal of Social Research Methodology, London, v. 15, n. 6, p. 523-543, 2012.

CULURCIELLO, Eugenio. Neural Network Architectures. Towards data science, [S.l.], 23 Mar., 2017.

DATA SCIENCE ASSOCIATION. About data science. [S.l.]: Data Science Association, 2020.

DEVLIN, Jacob et al. BERT: pre-training of deep bidirectional transformers for language Understanding. Computation and Language, New York, 2018.

DHAR, Vasant. Data science and prediction. Communications of the ACM, New York, v. 56, n. 12, p. 64-73, 2013.

FALESSI, Davide; CANTONE, Giovanni; CANFORA, Gerardo. Empirical principles and an industrial case study in retrieving equivalent requirements via natural language processing techniques. IEEE Transactions on Software Engineering, Washington, D.C., v. 39, n. 1, p. 18-44, 2013.

FARIA, Paulo M. Revisão sistemática da literatura: contributo para um novo paradigma investigativo. Champaign: CG Publisher, 2019.

FOSSO WAMBA, Samuel; AKTER, Shahriar; EDWARDS, Andrew; CHOPIN, Geoffrey; GNANZOU, Denis. How “big data” can make big impact: findings from a systematic review and a longitudinal case study. International Journal of Production Economics, Amsterdam, v. 165, p. 234-246, 2015.

FURNER, Jonathan. Information Science is neither. Library Trends, Baltimore, v. 63, n. 3, p. 362-377, 2015.

GALVÃO, Taís Freire; PEREIRA, Mauricio Gomes. Revisões sistemáticas da literatura: passos para sua elaboração. Epidemiologia e Serviços de Saúde, Brasília, DF, v. 23, n. 1, p. 183–184, 2014.

GIL, Antônio Carlos. Métodos e técnicas de pesquisa social. 6. ed. São Paulo: Atlas, 2008.

GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep Learning. Cambridge: MIT Press, 2016.

HAYKIN, Simon O. Neural networks: a comprehensive foundation. 2. ed. Ontario.

HJØRLAND, Birger. Library and Information Science (LIS), Part 1. Knowledge Organization, Kent, v. 45, n. 3, p. 232-254, 2018.

ISOTANI, Seiji; BITTENCOURT, Ig Ibert. Dados abertos. São Paulo: Novatec, 2015.

JIN, Xiaolong et al. Significance and Challenges of Big Data Research. Big Data Research, Amsterdam, v. 2, n. 2, p. 59-64, 2015.

KOCEJKO, Szymon. Neural networks: what are neural networks and how do they work? 2018.

LAKATOS, Eva Maria; MARCONI, Marina de Andrade. Fundamentos de metodologia científica. 5. ed. São Paulo: Atlas, 2008.

LAUSCH, Angela; SCHMIDT, Andreas; TISCHENDORF, Lutz. Data mining and linked open data: new perspectives for data analysis in environmental research. Ecological Modelling, Amsterdam, v. 295, p. 5-17, 2015.

LI, Fan; WANG, Zhisen. The study on the out-structure information classification based on observers. Journal of Physics: Conference Series, [S. l.], v. 1168, n. 2, 2019.

MARTINEZ, Angel R. Natural language processing. Wiley Interdisciplinary Reviews: Computational Statistics, Hoboken, v. 2, n. 3, p. 352-357, 2010.

MILLER, Jerry P. O milênio da inteligência competitiva. Porto Alegre: Bookman, 2002.

MITRA, Manu. Neural processor in artificial intelligence advancement. Journal of Autonomous Intelligence, [S. l.], v. 1, n. 1, p. 2, 2018.

NESI, Paolo; PANTALEO, Gianni; SANESI, Gianmarco. A hadoop based platform for natural language processing of web pages and documents. Journal of Visual Languages and Computing, Pittsburgh, v. 31, n. 2015, p. 130-138, 2015.

NIELSEN, Michael A. Neural networks and deep learning. [S.l.]: Determination Press, 2015.

RODIONOV, I. I.; TSVETKOVA, V. A. Information management in information science. Scientific and Technical Information Processing, [S. l.], v. 42, n. 2, p. 73–77, 2015.

SAMPAIO, RF; MANCINI, MC. Estudos de revisão sistemática: um guia para síntese criteriosa da evidência científica. Revista Brasileira de Fisioterapia, São Carlos, v. 11, n. 1, p. 83–89, 2007.

SARACEVIC, Tefko. Ciência da informação: origem, evolução e relações. Perspectiva em Ciência da Informação, Belo Horizonte, v. 1, n. 1, p. 41–62, 1996.

SARACEVIC, Tefko. Information science. Journal of the American Society for Information Science, New York, v. 50, n. 12, p. 1051–1063, 1999.

SKALSKI, Piotr. Deep dive into math behind deep networks. Towards data science, 17 Aug. 2018.

STANTON, Jeffrey M. Data science: what’s in it for the newlibrarian? Syracuse University, Syracuse, 16 Jul. 2012.

WANG, Lin. Twinning data science with information science in schools of library and information science. Journal of Documentation, West Yorkshire, v. 74, n. 6, p. 1243-1257, 2018.

WAZLAWICK, Raul Sidnei. Metodologia de pesquisa para ciência da computação. 2. ed. Rio de Janeiro: Grupo Gen, 2014.

WEISSENBERGER, Lynnsey. Toward a universal, meta-theoretical framework for music information classification and retrieval. Journal of Documentation, West Yorkshire, v. 71, n. 5, p. 917–937, 2015.

ZEROUAL, Imad; LAKHOUAJA, Abdelhak. Data science in light of natural language processing: an overview. Procedia Computer Science, [S. l.], v. 127, p. 82–91, 2018.

ZHANG, Aston et al. Dive into deep learning. [S. l]: arXiv preprint, 2021

ZINS, Chaim. Conceptual approaches for defining data, information, and knowledge. Journal of the American Society for Information Science and Technology, [S. l.], v. 58, n. 4, p. 479-493, 2007.

Downloads

Publicado

2021-12-07

Como Citar

FALCÃO, L. C. de J.; LOPES, B.; SOUZA, R. R. Absorção das tarefas de processamento de Linguagem Natural (NLP) pela Ciência da Informação (CI): uma revisão da literatura para tangibilização do uso de NLP pela CI. Em Questão, Porto Alegre, v. 28, n. 1, p. 13–34, 2021. DOI: 10.19132/1808-5245281.13-34. Disponível em: https://seer.ufrgs.br/index.php/EmQuestao/article/view/111323. Acesso em: 28 mar. 2024.

Edição

Seção

Artigo