Comparação de desempenho entre Máquina de Vetor de Suporte e Comitê de Redes Neurais Artificiais para Classificação de Spam

André Hermenegildo Costa Silva, Wilian Soares Lacerda, Bruno de Abreu Silva

Resumo


O e-mail é uma das mais populares formas de comunicação. Porém, não é raro encontrar mensagens indesejadas nas caixas de entrada do correio eletrônico. Estas mensagens são conhecidas como spams. Em um contexto onde uma quantidade cada vez maior de mensagens são enviadas e recebidas por todo mundo, técnicas para filtrar automaticamente estas mensagens consideradas como spams são de grande importância. O objetivo deste artigo é apresentar dois classificadores para filtrar mensagens de e-mail indesejadas, isto é, identificar se determinado e-mail é ou não é um spam. Foram utilizadas duas técnicas de aprendizado de máquina: Máquina de Vetor de Suporte (SVM, do inglês SupportVectorMachine) e Rede Neural Artificial (RNA). Para o segundo classificador, utilizou-se 5 (cinco) RNAs do tipo MultilayerPerceptron (MLP) com o algoritmo de aprendizagem ResilientPropagation - Rprop (variação do Backpropagation), com arquiteturas (camadas) e configurações (taxa de aprendizado e número de épocas) distintas, formando um comitê de redes. Os dois classificadores apresentaram taxas médias de acerto de 91,3\% e 93,6\%, respectivamente. Percebeu-se que a técnica de aprendizado SVM apresentou resultados superiores quando comparada a uma única RNA específica (dependendo da arquitetura), porém mostrou-se inferior quanto ao desempenho de um comitê de RNA. Além disso, SVM se mostrou mais rápida na realização do treinamento do que as RNAs.

Palavras-chave


SPAM; redes neurais; SVM

Texto completo:

PDF


A REIC mudou de endereço! Para acessar as edições publicadas e/ou submeter seu artigo, acesse https://sol.sbc.org.br/journals/index.php/reic.