Aprendizaje Automático no Supervisado
En este tipo de aprendizaje, solo se dan las características explicativas o las variables de entrada (X), sin ninguna etiqueta correspondiente (label) o variable de salida. El objetivo de los algoritmos de aprendizaje no supervisados es tomar en cuenta las estructuras ocultas y ejemplos que se encuentran en la información.
Este tipo de aprendizaje se denomina no supervisado a la luz del hecho de que no hay marcas relacionadas con las muestras de entrenamiento. Entonces, es un procedimiento de aprendizaje sin correcciones y el algoritmo intentará encontrar la estructura básica por sí mismo.
Tipos de Aprendizaje Automático no Supervisado
Los algoritmos de aprendizaje no supervisado pueden ser de dos tipos:
- Clustering: una tarea de clustering se usa cuando se quiere descubrir grupos similares de muestras de entrenamiento y agruparlos. Intentan agrupar los individuos por su similaridad, sin ningún criterio especial a priori. Esta técnica es útil para observar los grupos naturales que existen.
Problemas tipo que podrían resolver serían:
- Segmentación de tipos de clientes.
- Predecir gustos de clientes.
- Buscar relaciones entre clientes.
- Asociación: una tarea de aprendizaje de reglas de asociación se emplea cuando se desea descubrir algunas reglas que describen las relaciones en sus muestras de entrenamiento, como los clientes que han comprando cierto producto X también tienden a comprar otra producto Y. Mientras que el clustering se basa en los atributos de las instancias, en este caso, se mira a la co-ocurrencia de esas instancias en transacciones.
- Profiling: intentan caracterizar el comportamiento típico de un individuo o grupo. Por ejemplo un problema tipo que podrían resolver sería: ¿cuál es el patrón de comunicación típico en este segmento de clientes?
El proceso de entrenamiento y uso de un modelo basado en un algoritmo de aprendizaje no supervisado es el siguiente:
Primeramente tendremos la fase de entrenamiento del modelo en la que utilizaremos los datos de entrenamiento que se encuentran sin etiquetar. Posteriormente evaluaremos el modelo entrenado validando los resultados obtenidos y finalmente ya podríamos utilizar el modelo en un entorno de producción para predecir nuevos resultados.