Comparativo entre o algoritmo de Luhn e o algoritmo GistSumm para sumarização de documentos

Authors

  • Eduardo Muller Universidade do Contestado
  • Jones Granatyr UNC
  • Otto Robert Lessing UNC

DOI:

https://doi.org/10.22456/2175-2745.47524

Abstract

Este artigo descreve um comparativo entre dois algoritmos da área de mineração de textos, os quais são utilizados na tarefa de sumarização automática de documentos. Foram comparados nos experimentos o algoritmo clássico de Luhn e o algoritmo GistSumm, sendo realizadas dois tipos de avaliação, ambas utilizando o Português do Brasil como idioma alvo. A primeira consistiu em gerar um resumo de um texto fonte com cada algoritmo,e a avaliação foi conduzida utilizando avaliadores humanos que indicaram a coerência nos resumos de cada um. Por outro lado, a segunda foi conduzida por meio de uma avaliação baseada no resumo, no qual os avaliadores responderam perguntas sobre o texto original possuindo como fonte de consulta somente o resumo gerado pelos algoritmos. Após as análises, foi demonstrado que o algoritmo GistSumm possui maior capacidade para gerar resumos que mantenham a ideia principal do texto, sendo classificado com 81,6% de eficiência no primeiro experimento e 90% no segundo experimento.

Downloads

Download data is not yet available.

Published

2015-05-04

How to Cite

Muller, E., Granatyr, J., & Lessing, O. R. (2015). Comparativo entre o algoritmo de Luhn e o algoritmo GistSumm para sumarização de documentos. Revista De Informática Teórica E Aplicada, 22(1), 75–94. https://doi.org/10.22456/2175-2745.47524

Issue

Section

Regular Papers