Efeitos da Sobre-amostragem na Sobreposição e Classificação de Dados de Fraudes em Cartões de Crédito

Guilherme G. Horta Horta, G. G.

Murilo B. Loiola Loiola M. B.

Resumo

As fraudes em cartões de crédito são um problema crescente na sociedade moderna, especialmente com o aumento das modalidades de compras e pagamentos online. Portanto, há demanda para sistemas de prevenção e detecção de fraudes. Geralmente a tarefa de detecção de fraudes é tratada como um problema de classificação e múltiplos autores relatam dificuldades ao treinar classificadores em conjuntos de dados com desbalanceamento e sobreposição entre classes neste contexto. Técnicas de pré-processamento de amostragem, como sobre-amostragem e sub-amostragem são frequentemente utilizadas para tratar o problema do desbalanceamento. Por outro lado, métricas de avaliação como o R-Valor e o R-Valor Aumentado foram apresentadas nos últimos anos para medir o nível de sobreposição presente nos dados. O objetivo deste trabalho se divide em dois: medir os efeitos de sobre-amostragem nas métricas de sobreposição e comparar seu impacto no desempenho dos classificadores. Conforme outros trabalhos também concluíram, a utilização de R-Valor Aumentado foi verificada como mais apropriada no cenário de dados desbalanceados em detrimento de sua predecessora R-Valor. Este artigo conclui que, para o conjunto de dados estudado, os resultados de classificaç̧ao obtidos após a aplicação das técnicas escolhidas de sobre-amostragem não apresentaram melhoria significativa em relação a não aplicação das mesmas. Algoritmos de classificação baseados em árvores de decisão obtiveram um bom desempenho com este conjunto de dados, considerando as circunstâncias de alto desbalanceamento e sobreposição entre classes.

28 de Novembro de 2022

45-54

Palmas-TO

e-ISSN:2447-0767

Como referenciar

Horta, G. G.; Loiola M. B.. Efeitos da Sobre-amostragem na Sobreposição e Classificação de Dados de Fraudes em Cartões de Crédito. In: ENCOINFO - Congresso de Computação e Tecnologias da Informação, 24., 2022, Palmas - TO. Anais [...]. Palmas - TO: CEULP/ULBRA, 2022. p. 45 - 54. ISSN e-ISSN: 2447-0767 versão online. Disponível em: https://ulbra-to.br/encoinfo/edicoes/2022/artigos/efeitos-da-sobre-amostragem-na-sobreposicao-e-classificacao-de-dados-de-fraudes-em-cartoes-de-credito/. Acesso em: 14 nov. 2024