Módulo de Pré-Processamento da Ferramenta SentimentALL

Luan Gomes de Almeida Araújo Araújo, L. G. A.

Parcilene Fernandes de Brito Brito, P. F.

Resumo

Este artigo apresenta um módulo que realiza o pré-processamento de dados textuais em língua portuguesa extraídos do site de Turismo TripAdvisor. Para tanto, foi realizado o processamento de linguagem natural, com as técnicas de normalização, correção ortográfica, pos tagging e identificação de expressões multipalavras. Para o desenvolvimento desse módulo, foi utilizada a biblioteca para Python chamada NLTK. Contudo, algumas alterações foram necessárias no corpus Mac-Morpho presente na NLTK. Ao final da etapa de correção ortográfica e identificação de expressões multipalavras, foram realizados testes para avaliar o desempenho dessas etapas.

21 de Maio de 2018

86-94

Palmas-TO

e-ISSN:2447-0767

Como referenciar

Araújo, L. G. A.; Brito, P. F.. Módulo de Pré-Processamento da Ferramenta SentimentALL. In: ENCOINFO - Congresso de Computação e Tecnologias da Informação, 20., 2018, Palmas - TO. Anais [...]. Palmas - TO: CEULP/ULBRA, 2018. p. 86 - 94. ISSN e-ISSN: 2447-0767 versão online. Disponível em: https://ulbra-to.br/encoinfo/edicoes/2018/artigos/modulo-de-pre-processamento-da-ferramenta-sentimentall/. Acesso em: 20 mai. 2024