Guilherme G. Horta Horta, G. G.
Murilo B. Loiola Loiola M. B.
As fraudes em cartões de crédito são um problema crescente na sociedade moderna, especialmente com o aumento das modalidades de compras e pagamentos online. Portanto, há demanda para sistemas de prevenção e detecção de fraudes. Geralmente a tarefa de detecção de fraudes é tratada como um problema de classificação e múltiplos autores relatam dificuldades ao treinar classificadores em conjuntos de dados com desbalanceamento e sobreposição entre classes neste contexto. Técnicas de pré-processamento de amostragem, como sobre-amostragem e sub-amostragem são frequentemente utilizadas para tratar o problema do desbalanceamento. Por outro lado, métricas de avaliação como o R-Valor e o R-Valor Aumentado foram apresentadas nos últimos anos para medir o nível de sobreposição presente nos dados. O objetivo deste trabalho se divide em dois: medir os efeitos de sobre-amostragem nas métricas de sobreposição e comparar seu impacto no desempenho dos classificadores. Conforme outros trabalhos também concluíram, a utilização de R-Valor Aumentado foi verificada como mais apropriada no cenário de dados desbalanceados em detrimento de sua predecessora R-Valor. Este artigo conclui que, para o conjunto de dados estudado, os resultados de classificaç̧ao obtidos após a aplicação das técnicas escolhidas de sobre-amostragem não apresentaram melhoria significativa em relação a não aplicação das mesmas. Algoritmos de classificação baseados em árvores de decisão obtiveram um bom desempenho com este conjunto de dados, considerando as circunstâncias de alto desbalanceamento e sobreposição entre classes.
28 de Novembro de 2022
45-54
Palmas-TO
e-ISSN:2447-0767
Horta, G. G.; Loiola M. B.. Efeitos da Sobre-amostragem na Sobreposição e Classificação de Dados de Fraudes em Cartões de Crédito. In: ENCOINFO - Congresso de Computação e Tecnologias da Informação, 24., 2022, Palmas - TO. Anais [...]. Palmas - TO: CEULP/ULBRA, 2022. p. 45 - 54. ISSN e-ISSN: 2447-0767 versão online. Disponível em: https://ulbra-to.br/encoinfo/edicoes/2022/artigos/efeitos-da-sobre-amostragem-na-sobreposicao-e-classificacao-de-dados-de-fraudes-em-cartoes-de-credito/. Acesso em: 14 nov. 2024