menéame

Inteligencia Artificial y la portada de 2018

Gracias al artículo publicado por José Martínez Heras y con la ayuda de Alfonso Martínez Heras contamos con un análisis y visualización gráfica de todas las noticias que llegaron a la Portada durante el 2018.

Ya contamos con una primera aproximación a este tipo de análisis, donde aplicamos la Inteligencia Artificial a la Portada de Menéame.

A continuación destacamos los datos que más nos han llamado la atención.

Distribución de clicks y meneos

Distribución entre el número de meneos y el número de clicks para las noticias de portada de meneame.net en 2018
Distribución entre el número de meneos y el número de clicks para las noticias de portada de meneame.net en 2018. Cada punto representa una noticia.

En este gráfico quería representar cómo los meneos afectan al número de clicks. Hay dos cosas que me han sorprendido de este gráfico y que he destacado en el siguiente:

  1. Hay un suelo en el número de clicks que va creciendo con el número de meneos. Investigando un poco, ya sé por qué ocurre esto. Menéame implementa un sistema que asegura que una noticia no puede tener más meneos que visitas. Dicho de otra forma, menéame requiere un cierto número de visitas (clicks) antes de aceptar otro meneo.
  2. Lo más sorprendente para mi es que parece que el número de clicks decrece con el número de meneos! Cuantos más meneos tiene una noticia, menos visitas recibe (salvo excepciones, claro está). Me esperaba que las noticias más visitadas serían aquellas con más meneos. Aunque también hay una explicación para esto… Lo vemos en un momento.
La Inteligencia Artificial nos va a ayudar a descubrir por qué disminuye el número de clicks cuando aumenta el número de meneos
Análisis de la distribución entre el número de meneos y el número de clicks para las noticias de portada de meneame.net en 2018. 1: hay un suelo en el número de clicks que va creciendo con el número de meneos 2: cuantos más meneos tiene una noticia, menos visitas recibe.

Modelos de Machine Learning

He construido varios modelos de aprendizaje automático supervisados para estudiar qué influye en el número de meneos:

  1. para entender qué temas tienen más / menos meneos, clicks, comentarios
  2. para entender qué palabras tienen más / menos meneos, clicks, comentarios

Hay varios tipos de modelos que podría haber utilizado. Como el objetivo de este proyecto es entender las influencias, he usado modelos de Inteligencia Artificial explicables. En particular he experimentado con árboles de decisión y regresión logística. La regresión logística parece dar mejores resultados. Así que usaremos este modelo para el resto del artículo.

Explicación de por qué el número de visitas decrece con el número de meneos

La inteligencia artificial no nos da una respuesta clara en este punto. Así que echar mano de la inteligencia humana asistida por la inteligencia artificial.

La inteligencia artificial nos ha dicho que muchos de los temas de los que cabe esperar muchos meneos, también cabe esperar pocos clicks. Y ahí se queda.

Así que he estado mirando las noticias para varios temas clave y palabras clave para ofreceros mi interpretación humana.

Interpretación humana

Muchas noticias de actualidad (política, la muerte de alguien, la decisión de un tribunal, etc.) están autocontenidas.

Con autocontenidas quiero decir que mirando la información que hay en la portada menéame, es decir, el título y el resumen, es suficiente para estar informado.

Otras historias, en cambio, realmente necesitan que hagamos click. Sin hacer click no seremos capaces de saber qué ha pasado. Esto es evidente en palabras tales como: vídeo, imágenes, imagen, foto, fotos, viñeta, etc. Aunque también para noticias de historia, cultura, etc.

Dicho esto, encuentro muy útil que muchas historias estén autocontenidas. Así podemos informarnos rápidamente de lo que está ocurriendo. Las historias no-autocontenidas nos permiten profundizar más en los temas que nos interesen.

Ejemplo de noticias autocontenidas y no-autocontenidas

2 noticias de meneame.net

Por ejemplo, en la figura anterior vemos 2 historias:

  1. La primera historia no está autocontenida. Si queremos saber “por qué cayó el imperio romano”, necesariamente tendremos que visitar (hacer click) en la noticia. Tiene pocos meneos y muchos clicks.
  2. La segunda historia está autocontenida. Para saber lo que pasó con la causa de Dani Mateo no es imprescindible visitar la noticia. Tiene muchos meneos y pocos clicks.

Puedes leer el artículo completo aquí