Qué son regresión y clasificación en Machine Learning

Síguenos en:

Mediante el uso del Machine Learning es posible realizar tareas de clasificación o de regresión con conjunto de datos. Profundizamos más en la diferencia.

Por Redacción España, el 29/10/2020

¿Te ha gustado nuestro artículo? ¡Vota!

Machine Learning es un subcampo de las ciencias de la computación y la inteligencia artificial, que se sirve de algoritmos que permiten a las máquinas aprender imitando la forma en la que los seres humanos desarrollan acciones.

Los métodos de clasificación y regresión se encuentran dentro de una rama del Machine Learning conocida como aprendizaje automático supervisado. Te explicamos qué son y en qué se diferencian.

Grupos de algoritmos en Machine Learning

El Machine Learning se fundamenta en cuatro grandes grupos de algoritmos:

Machine Learning supervisado.
Machine Learning no supervisado.
Machine Learning semisupervisado.
Machine Learning por refuerzo.

Aprendizaje supervisado

El aprendizaje supervisado trabaja con datos etiquetados, es decir, datos para los que ya conoce la respuesta de destino. En base a un histórico, trata de buscar patrones relacionándolos con un campo especial, llamado objetivo, dadas unas variables de entrada.

A través de dicho histórico de datos, el algoritmo puede aprender a asignar una etiqueta de salida o función que le permita predecir el atributo objetivo para una nueva acción.

El aprendizaje supervisado se utiliza en dos tipos de problemas: clasificación (por ejemplo, detección de fraude) y regresión (por ejemplo, predicciones meteorológicas).

Aprendizaje no supervisado

El aprendizaje no supervisado está formado por datos de entrada, pero no se conocen los datos de salida, es decir, no cuenta con un conjunto de datos etiquetados para las pruebas de entrenamiento. Este modelo suele utilizarse como método exploratorio o de análisis.

Los usos más comunes de este tipo de aprendizaje son: problemas de clustering, agrupamientos de co-ocurrencia o profiling de datos.

Aprendizaje semisupervisado

El aprendizaje semisupervisado es una técnica de aprendizaje automático que utiliza datos de entrenamiento tanto etiquetados como no etiquetados.

Aprendizaje por refuerzo

Por último, el aprendizaje por refuerzo se basa en un sistema de prueba y error. Su objetivo principal es generar un aprendizaje que permita obtener una recompensa específica a medio-largo plazo.

1. Algoritmos de clasificación

En el aprendizaje supervisado, los algoritmos de clasificación se usan cuando el resultado es una etiqueta discreta. Esto quiere decir que se utilizan cuando la respuesta se fundamenta en conjunto finito de resultados.

El ejemplo más común de algoritmos de clasificación es el detector de correo no deseado del correo electrónico. Partimos de dos únicas etiquetas: spam o no spam. ¿Cómo consigue categorizarlo? En base a una serie de parámetros:

Remitente.
Destinatario individual o en listado.
Símbolos y lenguaje utilizado en el asunto.

Cuando queda definida esta función, el algoritmo de clasificación es capaz de asignarle la etiqueta correcta. A este tipo de metodología se le conoce como clasificación binaria.

Técnicas de Machine Learning para Clasificación

Actualmente, existen diferentes técnicas de aprendizaje automático para problemas de clasificación. Algunas de las más destacables son las siguientes:

Regresión logística.
Árboles de decisión.
Clasificación de Naïve Bayes.
Bosques aleatorios.

2. Algoritmos de regresión

El análisis de regresión es un subcampo del aprendizaje automático supervisado cuyo objetivo es establecer un método para la relación entre un cierto número de características y una variable objetivo continua.

En este sentido, el ejemplo más común es la regresión lineal. ¿Qué significa este concepto? Se trata de un algoritmo de aprendizaje supervisado que se utiliza en ML y en estadística y, en términos sencillos, establece una recta para proporcionar la tendencia de un conjunto de datos.

Algunos de los usos son los siguientes: la predicción del precio de la vivienda, el tiempo de permanencia de un empleado en una empresa, tiempo que tardará un vehículo en ir de un punto a otro, estimación de ventas de productos...

Técnicas de Machine Learning para regresión

Existen diferentes técnicas de aprendizaje automático para problemas de regresión. Algunas de las más destacables son las siguientes:

Regresión lineal (utiliza datos continuos).
Regresión logística (utiliza datos discretos).
Árboles de decisión.
Deep Learning.

TAGS:

Redacción España

Equipo de redacción de B12 España: Marketing, Big Data, Inteligencia Artificial y Ventas.