Desenvolvimento do Módulo de Pre-processamento da ferramenta SentimentALL
Resumo
.
Os sistemas que utilizam em seu processo de análise a linguagem natural (por exemplo, sistemas que analisam comentários de sites, reviews de filmes, posts em redes sociais etc.) geralmente usam técnicas relacionadas ao Processamento de Linguagem Natural (PLN). Neste artigo, serão apresentadas as etapas de PLN utilizadas no desenvolvimento do Módulo de Pré-Processamento da Ferramenta SentimentALL, que tem como propósito realizar análises de textos que emitem opiniões sobre produtos. O módulo foi desenvolvido para ser usado em qualquer contexto, mas neste trabalho foi utilizado na análise dos comentários extraídos do site de turismo TripAdvisor. O módulo é composto das etapas de normalização, correção ortográfica, pos-tagging e identificação de expressões compostas. Para a sua implementação, foi utilizada a biblioteca NLTK, da linguagem de Programação Python.
- A publicação se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua, respeitando, porém, o estilo dos autores;
- As provas finais não serão enviadas aos autores;
- Os originais não serão devolvidos aos autores;
- Os trabalhos publicados passam a ser propriedade da Revista Singular, ficando sua reimpressão total ou parcial, sujeita à autorização expressa da direção do Centro Universitário Luterano de Palmas;
- Deve ser consignada a fonte de publicação original;
- As opiniões emitidas pelos autores dos artigos são de sua exclusiva responsabilidade;