Descripción
En la actualidad una de las necesidades más grandes de los nuevos sistemas de distribución de contenido como Netflix, YouTube o Spotify es la de ser capaces de recomendar el contenido apropiado para sus suscriptores. Dado que estos ofrecen una cantidad de contenido extremadamente grande, es sumamente importante conectar este contenido con los consumidores que puedan apreciarlo, de modo que las tres partes involucradas vean cumplidas sus metas en el proceso: los creadores vean sus canciones recomendadas a más usuarios potenciales, los consumidores vean más recomendaciones de acuerdo con sus gustos y la plataforma vea que el uso se incrementa.
Para solucionar este problema a lo largo del tiempo se han desarrollado diferentes estrategias entre las cuales encontramos:
Filtrado por contenido
Es aquel donde se generan perfiles tanto para los usuarios como para los contenidos. La idea es luego asociar estos perfiles para que los usuarios puedan acceder a contenido relevante. El problema consiste en que muchas veces es difícil o incluso imposible conseguir esta información externa, necesaria para generar estos perfiles. (Koren, 2009)
Filtrado colaborativo
Aquí los dos principales métodos son los enfocados a los vecindarios o a los factores latentes
Los métodos enfocados a vecindarios se basan en analizar las interacciones que se han dado entre los usuarios y el contenido. Estos pueden ser enfocados tanto en el usuario como en contenido. Cuando se enfocan en el contenido se trata de asignar una calificación a un contenido en función a como se han calificado contenidos vecinos por un mismo usuario. Para esto, un contenido vecino es aquel que ha sido calificado de manera similar por un mismo usuario. (Koren, 2009)
Por otro lado, cuando el enfoque se basa en el contenido la idea es analizar a que usuarios les agrada determinado contenido. Tomemos un ejemplo:
A Luis le gustar tres películas de acción. Basado en esto el sistema busca otros usuarios a los que les agraden estas tres películas de acción. Luego, analiza el total de películas que son del agrado de estos usuarios. La s que más se repitan serán aquellas que tendrán mayor probabilidad de gustarle a Luis.
Otro método es del factor latente. Aquí se infieren características tanto de los contenidos como de los usuarios a partir de los patrones de calificación, de manera que se obtienen características similares al filtrado por contenido. Uno de los métodos más exitosos para obtener estos modelos de características es el de la factorización matricial.
La data para obtener la data a factorizar es principalmente de dos tipos: Explicita e implícita.
La data explicita es aquella que es el resultado de una acción directa de los usuarios, como un pulgar arriba o abajo luego de ver una película o una calificación de 5 estrellas al final de un episodio.
Por el contrario, la data implícita es aquella que se obtiene a través del análisis del comportamiento del usuario en la plataforma, midiendo, por ejemplo, los clics que realiza o sus búsquedas más frecuentes.
El método de factorización matricial se base principalmente en crear vectores que representen la afinidad de un usuario por determinada característica y la presencia de determinada característica en un contenido. Una vez que se ha resuelto esta dificultad el método genera recomendaciones simplemente realizando una multiplicación punto entre el vector contenido y el vector usuario:
Para poder realizar esta factorización es necesario contar con una matriz densa, esto es, sin espacios en blanco. El problema radica en encontrar los datos para llenar esta matriz, de modo que se puedan aplicar los métodos de factorización matricial.
Conclusiones
Vemos como la necesidad de conectar los productos de la industria del entretenimiento con los consumidores más adecuados ha llevado a un rápido desarrollo de diversos sistemas de recomendación, los cuales tienen profundas raíces matemáticas, y que han logrado una cuantiosa investigacion en el campo, utilizando tanto metodos matriciales como el filtrado colaborativo como las nuevas tendencias de machine learning
Referencias
- Zheng, H.-T., Chen, J.-Y., Liang, N., Sangaiah, A., Jiang, Y., & Zhao, C.-Z. (2019). A Deep Temporal Neural Music Recommendation Model Utilizing Music and User Metadata. Applied Sciences, 9(4), 703.
- Koren, Y., Bell, R. M., & Volinsky, C. (2009). Matrix Factorization Techniques for Recommender Systems. IEEE Computer, 42(8), 30–37.