¿Cómo aplicar machine learning al entorno publicitario?

Es un término recurrente en las noticias sobre tecnología…Pero ¿qué es machine learning? Es una herramienta para extraer patrones de

Artículo sobre machine learning y sus aplicaciones en publicidad. Es un término recurrente en las noticias sobre tecnología…Pero ¿qué es machine learning? Es una herramienta para extraer patrones de un conjunto de datos, con la particularidad de que el proceso está totalmente informatizado y su resultado final puede ser aplicado directamente por una máquina. Esta es mi definición, alejada del concepto de “la máquina aprende” tan extendido. 

Manuel Fernández Moya, director de data science de Infinia Mobile, habla sobre machine learning aplicado a la publicidad, un tema recurrente en las noticias sobre tecnología.
Manuel Fernández Moya, director de data science de Infinia Mobile.

Es comprensible el entusiasmo que suscita el machine learning (en adelante ML) hoy en día, pues los avances que se han producido en los últimos años como: los sistemas de traducción automática, los asistentes de los smartphones, la detección de objetos en las fotos, la recomendación de artículos en una tienda online, el filtro anti-spam del email, etc. han sido posibles gracias a esta nueva disciplina.

Todo proceso de ML comienza a partir de datos disponibles y su resultado es un modelo que permite realizar predicciones para casos nuevos. Ejemplo: a partir de un conjunto de emails, clasificados como spam o no, se elabora un modelo que permite clasificar los nuevos emails según su probabilidad de que sean no deseados.

¿CÓMO SE PRODUCE LA MAGIA?

El proceso de modelización CRISP-DM (cross-industry standard process for data mining) es uno de los más usados por los data scientists para desarrollar modelos de ML. Incorpora la mejora continua, una vez finalizada una fase se verifica de forma sistemática si el resultado es adecuado a los fines.
El proceso consta de seis fases:
1. Comprensión del negocio: definición de objetivos y requisitos del proyecto desde una perspectiva empresarial.
2. Comprensión de datos: conocer los datos con los que se va a hacer el modelo.
3. Preparación de datos: selección de datos que sirva a nuestros fines, selección de variables informativas, tratamiento de valores perdidos, creación de nuevas “features” para el modelado.
4. Modelado: se seleccionan las técnicas y algoritmos para la tarea y se calibran los parámetros de los modelos.
5. Evaluación: se comprueba si el resultado del modelado es satisfactorio.
6. Despliegue: una vez verificado que el modelo es útil hay que concretar la forma en la que se integran con los procesos organizativos.

¿CÓMO APRENDEN LAS MÁQUINAS? 

La idea que perseguía Arthur Samuel, investigador pionero en el campo de la Inteligencia Artificial, cuando acuñó el término “machine learning” en 1959 y ahora tan presente en las noticias sobre tecnología era crear programas capaces de generalizar comportamientos a partir de una información suministrada en forma de ejemplos.

PATRONES. Existen distintas estrategias para conseguir identificar patrones en los datos, que el profesor John Kelleher clasifica en estos grupos:

1. Aprendizaje en base a la información: un ejemplo sería el juego del quién es quién, en el que cada jugador tiene que adivinar el personaje de su contrincante, en base a preguntas, antes de que él lo haga. La estrategia ganadora es la que ordena las preguntas por las características más informativas, intentando hacer el menor número de preguntas para identificar al personaje. Los algoritmos se basan en métricas como la ganancia de información con los que se elaboran árboles de decisión, que permiten generar predicciones en base a la información disponible.
2. Aprendizaje basado en la similitud: conociendo las características principales de un conjunto de individuos, estos algoritmos permiten encontrar casos similares a los nuevos datos. El principal algoritmo es el k-Nearest Neighbor, que calcula la distancia entre un caso nuevo, sobre el que se quiere hacer una predicción, y los datos con los que está hecho el modelo.
3. Aprendizaje basado en la probabilidad: conociendo el evento que se quiere predecir, teniendo información previa de su probabilidad de ocurrencia, los modelos calculan la verosimilitud de que algo ocurra, según las evidencias disponibles en cada momento. El algoritmo más común es Naive Bayes.
4. Aprendizaje basado en el error: consiste en elaborar un modelo en base a parámetros que se van ajustando para que el error que ofrece la predicción en casos conocidos sea mínimo. Los modelos de regresión son los más representativos.

¿Cómo se puede aplicar a la publicidad? En Infinia lo utilizamos para dos fines principalmente: inferir el género, la edad, ubicar el hogar, la zona vital y el trabajo, mediante la aplicación del ML a los miles de millones de datos que tenemos en nuestro data lake (apps disponibles en el terminal del usuario, localizaciones, urls visitadas…); y elaborar audiencias look-a-like, integrado con la plataforma big data para que el resultado esté automáticamente disponible.

Actualmente estamos trabajando para ampliar su uso hacia la optimización del performance de campañas, integrando el ML en el proceso de compra programática.

Manuel Fernández Moya, director de data science de Infinia Mobile