Aprendizaje Automático para detectar fraude en comercio electrónico

Síguenos en:

El Machine Learning se alza como una tecnología especialmente útil para la detección de fraude en comercio electrónico. Descubre cómo y por qué.

Por Redacción España, el 24/11/2020

¿Te ha gustado nuestro artículo? ¡Vota!

Las compras online traen consigo riesgos de seguridad. El robo de datos y el fraude en los pagos online son dos problemas que preocupan tanto a los consumidores como a las grandes compañías. El Aprendizaje Automático o Machine Learning se postula como una de las tecnologías para combatirlos.

Fraude en e-commerce, un reto para las compañías

Las compras online han aumentado ostensiblemente en los últimos años, como consecuencia de la mejora tecnológica y por las ventajas y comodidades que conlleva. El confinamiento derivado del COVID-19 incrementó aún más el número de transacciones digitales, lo que ha supuesto una oportunidad para los ciberdelincuentes.

Además, con la mejora de las grandes tecnologías al servicio del cliente, también han surgido nuevas formas de fraude, mucho más complejas y específicas, las cuales convierten la seguridad en un reto para las compañías que venden a través de internet. Las acciones fraudulentas repercuten en tres vertientes principales del comercio electrónico:

Pérdida de ingresos.
Insatisfacción del cliente.
Aumento de gastos operativos.

Existen métodos focalizados en detectar y combatir problemas de fraude en e-commerce de forma automatizada gracias al Data Science. Uno de ellos es el Machine Learning.

Desarrollo del Machine Learning para detectar fraude en comercio electrónico

Simplificado, el Machine Learning consiste en desarrollar e implementar softwares que aprendan por sí mismos. En esta tecnología se utilizan algoritmos que se entrenan con unos datos iniciales. Después, los algoritmos procesan datos y aprenden de ese procesamiento, en un modelo que se va perfeccionando continuamente.

Aplicado a la detección del fraude, el Aprendizaje Automático implica un proceso con distintas fases, que comienza por entender cuál es la raíz del problema y termina por la implementación de una solución a medida. Entremedias, hay cuatro fases fundamentales: recopilación de datos, entrenamiento, cross validation y evaluación de resultados.

Datos y análisis descriptivo

Para la construcción del modelo de Machine Learning es necesario un dataset inicial, es decir, un conjunto de datos tabulados que proporciona un modelo de programación relacional. El ejemplo más común es una base de datos SQL.

Las filas y columnas, junto con los valores asociados a cada celda, conforman el dataset. En este caso, deben aparecer todos los datos relativos a la metodología de fraude (impagos, deuda existente en listas de morosos, listas de antiguos malos clientes, etcétera). De esta forma, el sistema analizará las características en busca de patrones y aprenderá a distinguir las clases.

Construcción del modelo y aprendizaje

La construcción del modelo se estructura partir de los datos que se extraen de una amplia gama de fuentes y de la programación de uno o varios algoritmos especializados en la detección de patrones de anomalías.

Tanto los modelos supervisados como los modelos no supervisados se usan mejor en conjunto, aunque todo dependerá del caso y el uso que se le vaya a dar al modelo.

El hecho de disponer de varios algoritmos aumenta las posibilidades de resolución más fácilmente. Así pues, es posible obtener mejores resultados a la vez que se invierte menos tiempo en el entrenamiento y en la obtención del modelo.

Cross Validation

La técnica de cross validation o validación cruzada busca evaluar los modelos de Machine Learning y garantizar que son independientes de la partición entre datos de entrenamiento y datos de prueba.

Consiste en calcular la media aritmética obtenida de las medidas de evaluación sobre diferentes particiones. Se utiliza en entornos de Machine Learning donde el fin último es la predicción, es decir, estimar con certeza la precisión del modelo utilizado ante una determinada situación, en este caso, la tendencia al fraude en el comercio electrónico.

Las muestras utilizadas en la etapa de validación permitirán, en caso de precisarlo, modificar el sistema para que el modelo se ajuste a los datos generados.

Evaluación

La evaluación, al igual que la validación cruzada, es un método centrado en medir el rendimiento de un modelo de Machine Learning a partir de métricas de evaluación que pueden inspeccionarlo o compararlo con el de otros modelos.

Se puede usar una matriz de confusión para evaluar un clasificador, en base a un conjunto de datos de prueba para los cuales se conocen los valores reales. Es una herramienta simple que ayuda a proporcionar una buena visión general del rendimiento del algoritmo que se está utilizando.

Con la implantación de un modelo de Machine Learning, es posible llegar a una primera toma de contacto con las herramientas de análisis predictivo que ayuden posteriormente en la toma de decisiones, a fin de eliminar el fraude en las e-commerce.

TAGS:

Redacción España

Equipo de redacción de B12 España: Marketing, Big Data, Inteligencia Artificial y Ventas.