Mapeamento de conhecimento científico: modelagem de tópicos das teses e dissertações do Programa de Pós-Graduação em Ciência da Informação da UFMG

Autores

DOI:

https://doi.org/10.19132/1808-5245273.228-250

Palavras-chave:

Modelagem de tópicos, Aprendizagem de Máquina, Alocação de Dirichlet Latente, Mapeamento Científico, Ciência da Informação.

Resumo

O uso das ferramentas computacionais tem sido cada vez mais exigido para organizar, recuperar e compreender o crescente volume de dados. A comunicação científica tem contribuído, por meio de trabalhos formais e informais, para esse fenômeno; entretanto, a organização de uma grande coleção de documentos pode se tornar um processo lento e questionável quando realizado sem recursos tecnológicos. A modelagem de tópicos, por meio de algoritmos de aprendizagem de máquina, tem possibilitado organizar e resumir corpora de dados. A problemática da pesquisa é descobrir como se têm apresentado os temas das teses e dissertações produzidas pelo Programa de PósGraduação em Ciência da Informação da Universidade Federal de Minas Gerais. Busca-se identificar os tópicos de maior relevância do corpus de dados, constituído por documentos do tipo teses e dissertações desse programa de pósgraduação, assim como os termos de cada tópico e os pesos atribuídos a cada um desses termos. Na modelagem de tópicos, utilizou-se o modelo de alocação de Dirichlet latente, configurado para identificar 6, 8, 10, 12, 14, 16, 18 e 20 tópicos junto ao corpus de dados, o que permitiu realizar o mapeamento científico dos documentos analisados. Os resultados com 14 tópicos foram mais coesos e apresentaram menos ruídos e, por isso, permitiram inferir os nomes dos tópicos de maneira mais segura e estabelecer correlações com as linhas de pesquisa do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Minas Gerais.

Downloads

Não há dados estatísticos.

Biografia do Autor

Marcos de Souza, Universidade Federal de Minas Gerais, MG, Brasil.

Pós-graduação stricto sensu (Doutorando) em Gestão e Organização do Conhecimento pela Universidade Federal de Minas Gerais - UFMG na linha de pesquisa em "Gestão & Tecnologia da Informação e Comunicação" com previsão para defesa da tese em julho de 2019; Pós-graduação stricto sensu (Mestrado) em Cogni-ção e Linguagem pela Universidade Estadual do Norte Fluminense Darcy Ribeiro - UENF na linha de pesquisa em Pesquisas Interdiscipli-nares em Comunicação, Educação e Novas Tecnologias da Informação; Pós-graduação lato sensu em: Informática na Educação pelo Instituto Federal do Espírito Santo - IFES; Do-cência do Ensino Superior pelo Centro Univer-sitário São Camilo - Espírito Santo - CeUSC; Desenvolvimento de Aplicação para WEB pelo Centro de Ensino Superior de Juiz de Fora – CESJF e; Graduado em Sistemas de Informação pelo Centro Universitário São Camilo - Espíri-to Santo – CeUSC.

Renato Rocha Souza, Fundação Getúlio Vargas, Rio de Janeiro, RJ, Brasil / Universidade Federal de Minas Gerais, Belo Horizonte, MG, Brasil

Pós-Doutorado pela Österreichischen Akade-mie der Wissenschaften, OeAW, Austria. Pós-Doutorado pela Columbia University, COLUMBIA, Estados Unidos. Pós-Doutorado pela University of South Wales, SOUTHWALES, Gales. Pós-graduação stricto sensu (Doutorado) em Ciências da Informação pela Universidade Federal de Minas Gerais – UFMG; Pós-graduação stricto sensu (Mestrado) em Engenharia de Produção pela Universidade Federal de Santa Catarina – UFSC; Pós-graduação lato sensu em Informática na Edu-cação pela Pontifícia Universidade Católica de Minas Gerais – PUC-Minas e; Graduação em Engenharia Elétrica pela Pontifícia Universi-dade Católica do Rio de Janeiro - PUC-Rio.

Professor do departamento de Matemática Aplicada da Fundação Getúlio Vargas / Professor do programa de pós-graduação em Gestão e Organização do Conhecimento da Escola de Ciência da Informação da Universidade Federal de Minas Gerais. Doutor em Ciência da Informação pela Universidade Federal de Minas Gerais.

Downloads

Publicado

2021-06-30

Como Citar

DE SOUZA, M.; SOUZA, R. R. Mapeamento de conhecimento científico: modelagem de tópicos das teses e dissertações do Programa de Pós-Graduação em Ciência da Informação da UFMG. Em Questão, Porto Alegre, v. 27, n. 3, p. 228–250, 2021. DOI: 10.19132/1808-5245273.228-250. Disponível em: https://www.seer.ufrgs.br/index.php/EmQuestao/article/view/104211. Acesso em: 24 maio. 2022.

Edição

Seção

Artigos