HASCH: Um Corretor Ortográfico Automático de Alto Desempenho para Textos Oriundos da Web
Palavras-chave:
Corretor Ortográfico, Paralelização, web 2.0Resumo
A Web 2.0 provocou uma democratização no âmbito da geração de dados, providos na grande maioria na forma de textos, tanto formais, como reportagens providas por portais de noticias, quanto informais ("Internetês"), como comentários em micro-blogging. Tratar essa heterogeneidade é uma preprocessamento indispensável para que esses dados possam ser utilizados por ferramentas que visam inferir informações precisas. Apresentamos nesse trabalho o HASCH: High Performance Automatic Spell CHecker, um corretor ortográfico automático, completamente paralelizado em memória compartilhada, cujo objetivo é preprocessar grandes volumes de textos em português coletados da Web, de forma eficiente.Downloads
Não há dados estatísticos.
Downloads
Publicado
2013-04-02
Edição
Seção
CTIC