Temas acerca de Inteligencia Artificial
Foto de Usuario
gian20132

Ranking Troomes
Mensajes: 7
Registrado: 22 Jun 2020, 22:24

Detección de valores atípicos con técnicas de minería de datos y métodos estadísticos

Mensaje por gian20132 » 09 Jul 2020, 22:39

En el artículo se propone un método para detectar valores que se consideran valores atípicos en una base de datos de datos. En específico en el área financiera, en donde mediante la minería de datos se pueden detectar fraudes financieros o encontrar errores producidos por los usuarios.
Utilizan 1180 tuplas(Perfil de clientes con tarjeta de créditos) de un conjunto de datos para el experimento, en donde, deliberadamente se introdujeron valores atípicos.
El método que propone se dividió en tres fases principales:
1. Uso del método estadístico chi-cuadrado para definir una ponderación o peso W que indica la relevancia de la columna del perfil del cliente en comparación con la cantidad de crédito otorgado,
2. Se utilizó el algoritmo de agrupación denominado KNN Global Anomaly (KNN) que calcula la puntuación de los valores atípicos
3. El algoritmo K-Means que es utilizado para separar los valores atípicos de los valores falsos-positivos.
Imagen

El procedimiento fue adecuado para la identificación de valores atípicos, una vez que los parámetros y los filtros están adecuadamente configurados en cada parte del método, en este caso llegó a detectar el 100 % de los valores atípicos.
También se concluye que metodología tiene dos aspectos importantes que lo diferencian de otros métodos:
• Una prueba estadística que otorga relevancia a las columnas
• Dos técnicas de minería de datos que separan las anomalías de los datos normales.

Referencia:
Orellana,Marcos. (19/01/2020). Outlier detection with data mining techniques and statistical methods . Enfoque UTE Revista.
url:https://www.redalyc.org/jatsRepo/5722/5 ... index.html


Responder