Archivos Mensuales: diciembre 2007

La inocentada del meneaRank

inocenteTodo comenzó el día 23 de diciembre. Estábamos hablando de otras cosas vía email con Rogelio cuando lanza su propuesta:

Ah, si se te ocurre alguna inocentada guapa que podamos montar juntos para el dia 28, me avisas :-) … No se, desde un delirio tipo X compra Y (donde X/Y pueden ser coRank/Meneame o Meneame/coRank), hasta un “Rogelio y Ricardo lanzan un videoblog de noticias conjunto donde ellos son los presentadores, llamado De la isla al valle”. O alguna otra animalada que se te ocurra. pero para currarse al menos una paginita o algo que le de mas realismo al tema :-) Si no, no pasa nada. Se me acaba de ocurrir :-)

Obviamente, no nos pudimos resistir. Aunque casi se nos va de las manos y ahora tendremos que dar algunas explicaciones a gente que no tenía nada que ver y nos preguntaba sobre el tema… lo único que pudimos llegar a decir para no arruinar la broma era que Digg no estaba involucrado, pero sirvió de poco.

Todo comenzó porque habíamos quedado en que debíamos decir algo que la gente esté más desprevenida. Así Rogelio escribió en su blog:

Y segundo, aprovecho también para adelantaros que dentro de muy poco espero poder publicar por aquí un notición – yo pienso que bastante majo – que posiblemente va a impresionar a más de uno – para bien, espero.

Nosotros hicimos algo similar en este blog:

Queríamos además dar un notición estos días, pero el retraso de los trámites por las fiestas nos arruinó la noticia de nochebuena. Pero esperamos poder hacerlo al menos antes de fin de año, o en nochevieja

A partir de eso comenzaron a correr los rumores que acabaron en que Digg pensaba comprar coRank y Menéame. Basta ver los trackbaks de los apuntes anteriores –que incluyen a Techcrunch, Mashable, etc.– e incluso llegó hasta el Business Week:

Then, on Christmas day, the blog message boards began buzzing about a report that Digg was acquiring Spanish-language counterpart, Menéame, and possibly purchasing content-sharing site coRank.

Nada, que casi nos arruina la broma, y no podíamos decir nada porque sino se arruinaría todo. Nos sentíamos víctimas prematuras de nuestra propia broma.

Al final la hicimos, claro, pero lo mejor –o lo peor según como se mire– había ocurrido antes.

Nada, perdón a los que creyeron las noticias previas, no era nuestra intención. Y gracias –o todo lo contrario, según como se mire :-) — a los que ayudaron a divulgar los rumores.

Ahora a ver si empezamos a enviar correos explicando a los norteamericanos que por aquí también tenemos nuestro April fools’ day, pero que no cae en abril.

PS: Aunque no todo lo que se dijo era inocentada, algo quedará :-)

Fusión de menéame y coRank: meneaRank

meneaRankEsta era la noticia que adelantábamos hace unos días (también lo adelantó Rogelio Bernal). Estoy con un gripazo muy fuerte (y Benjamí tampoco se encuentra muy bien), así que seré muy breve, daremos más detalles más adelante. Rogelio también lo cuenta en su blog.

coRank y menéame se fusionan al 50% para crear una nueva empresa meneaRank. Rogelio vino a España para para terminar de arreglar los asuntos burocráticos –además fue complicado porque Martín Varsavsky estaba de viaje y hacía falta su aprobación. Hizo falta discutir y tomar decisiones técnicas importantes que necesitaban largas charlas.

Por ahora menéame y coRank seguirán igual y se abrirá un nuevo portal, menearank.com, donde serán accesibles los nuevos servicios agregados de coRank y menéame. Los usuarios de menéame y coRank podrán participar en ambos sitios de forma indistinta gracias al nuevo sistema de autentificación basado en OpenID. Esta integración comenzará a funcionar desde finales de enero.

Los datos en tiempo real de coRank y menéame se usarán para mejorar ambos sistemas y además tener portadas independientes y por preferencias en cualquiera de los dos sitios.

Uno de los primeros servicios de meneaRank será un ranking de blogs agrupados por temáticas y preferencias (se espera para finales de enero). Luego lanzaremos un buscador que no sólo tendrá en cuenta las palabras claves y frecuencias de aparición, sino también el número de votos que han recibido y el número de lecturas desde menéame o coRank.

Aunque todavía tenemos que negociar más y hacer una auditoria de copyrights fichero a fichero, esperamos poder liberar todo el código fuente.

Felicidades

logo nadal Que paséis bien el puente, el solsticio de invierno, el aniversario del nacimiento de Newton o cualquier otra festividad religiosa o no –incluida la de El Corte Inglés– que festejéis estos días.

Queríamos además dar un notición estos días, pero el retraso de los trámites por las fiestas nos arruinó la noticia de nochebuena. Pero esperamos poder hacerlo al menos antes de fin de año, o en nochevieja.

Stay tuned :-)

“Stemmer” en castellano del buscador

Queda un problema con el buscador: que también busque por palabras raíces, y derivadas del lexema original. Con eso se mejora la búsqueda porque también busca las palabras en plural/singular, masculino/femenino, en diferentes tiempos verbales, gerundio, etc.

Para realizar ese proceso se reducen las palabras a sus lexemas básicos, el proceso se denomina stemming. El Sphinx sólo trae stemmers en inglés y ruso, afortunadamente Jose Manuel Peso desarrolló un stemmer castellano para el Sphinx. El problema es que ya no funcionaba con la última versión del Sphinx, por lo que le hice unas pocas modificaciones (parche) y ya lo tenemos en marcha.

Espero que mejore aún más la calidad de los resultados. Si no es así seguro que nos enteraremos rápido ;-)

Problemas de acceso

Desde hace poco más de 15 minutos (15:57 GMT+1) hay problemas de acceso a Menéame. No es problema de servidores sino de la red de Ferca (hay muchas pérdidas de paquetes). En cuanto tengamos más información avisaremos.

Perdón por las molestias.

Actualización: desde las 16:40 parece funcionar todo normal. Nota, mi móvil no ha dejado de vibrar por los avisos SMS del Nagios, interesante característica :-)

OpenSearch del Menéame (compatible con Firefox e IE)

UnoDeTantos nos sugirió en un comentario que pongamos el plugin OpenSearch en el Menéame. Una hora después estaba funcionando :-)

El plugin sirve para agregar el buscador del Menéame a la barra de búsquedas del Firefox2 o IE7. Como es un estándar abierto –y muy simple– supongo que lo adoptarán los demás navegadores.

Para activarlo basta con visitar el Menéame, desplegar el menú y “agregar” el plugin del Menéame.

open search menéame

Una vez que está en la lista se lo puede seleccionar para buscar en el Menéame.

OpenSearch del Menéame (compatible con Firefox e IE)

Sí, pijaditas, pero no cuesta nada hacerlas y quizás a algunos les sea útil (aunque sea para mirar el código y usarlo de ejemplo) :-)

A tomar por… o yet another search engine

Con un cabreo monumental hice un cambio drástico, deseché el “nuevo buscador” basado en Zend Lucene y lo reimplementé en Sphinx. Por ahora funciona todo igual salvo las operaciones booleanas que ya implementaré estos días (con mejoras).

El Zend Lucene tenía muchos problemas: mucho consumo de memoria –hasta centenares de megas por cada consulta–, por lo que hay que limitar los resultados que ordena, muy lento, falla el sistema de locking cuando se actualizan varios artículos concurrentemente, problemas con las tablas de conversión UTF-8. Además de ello hay que reconocer que indexar textos tan cortos tiene sus problemas.

Perdí más de una semana tocando el Lucene y creando nuevas clases, pero cuando solucionaba un problema surgían dos más.

Hoy Ayer con el cabreo me puse a estudiar el Sphinx, y salvo que tuve que haer la tabla de conversión de caracteres españoles y catalanes, lo demás funcionó como una seda. Además el servidor lo tenemos en marcha en el servidor de backup, así que ni siquiera va a molestar al principal aunque tenga fallos graves.

Otra de las ventajas del Sphinx es que se pueden enviar “colas de consultas”, por lo que para búsquedas de varias palabras se hace el ordenamiento por varios criterios, prima el de de la frase completa, luego con contenga todas las palabras buscadas y finalmente cualquiera de ellas. En las dos primeras consultas se ordena por fecha –lo que soluciona una parte importante del problema del menéame, encontrar los “dupes” recientes– y la última consulta ordena por relevancia/frecuencia. Estas preferencias por frases largas versus por fecha para menos palabras se nota en menéame es un saco y menéame saco (en el primera consulta sale en primera posición, en la segunda sale en sexta posición).

Ya iremos afinando, pero con las cientos de pruebas que hice (con ayuda de algunos que estaban por la fisgona) parece dar muchos mejores resultados, y la diferencia de velocidad y tiempo de respuesta es muy notable. Demasiada diferencia como para seguir con el anterior un día más.

menéame en el informe 2007 de Telefónica

El ciudadano ha adoptado el rol de productos de contenidos, hasta el punto de que a este hecho se le ha dado en denominar como la killer application de Internet. Esta tendencia se plasma en la popularización de las redes sociales como MySpace o Facebook, de sitios web para compartir vídeos online como YouTube, de herramientas de promoción social de la información como Digg o Meneame, sin olvidar los blogs, los podcast, los wikis y el recién llegado microblogging de servicios como Twitter. Esta influencia del papel de los internautas se refleja también en las empresas. Surge la idea del crowdsourcing en los procesos de generación de productos definida como una tendencia que permite a los clientes diseñar los productos que compran o influir en su diseño. En relación a todo esto surge el papel relevante de las técnicas de marketing viral: las redes sociales y la relación de las personas en ellas favorece la popularización de muchos servicios en cuestión de días. Es el caso de ilike (una red social creada entorno a los gustos musicales, que permite descubrir lo que otros escuchan, enterarse de nuevas tendencias y compartir con la comunidad lo que se encuentre interesante) que comenzó con 1.000 abonados y que a los dos días de lanzarse en Facebook el número ya alcanzaba los 300.000.

–Página 168 del informe «La sociedad de la información en España 2007» (PDF completo).

Nuevo buscador

Desde hace unos minutos está en funcionamiento “público” el nuevo buscador del Menéame basado en Zend Lucene. Así se soluciona –o eso esperamos– una de las cosas más criticadas por los usuarios habituales. El buscador anterior funcionaba con las búsquedas full text del MySQL y tenía sus “cosillas”. ¿Es ahora un poco menos saco? :-)

Escribí una pequeña ayuda en el wiki. Ya iremos solucionando todos los problemillas, el Zend Lucene también tiene sus glitches (además de numerosos, asustan al usuario desprevenido).

Respuestas breves a Alianzo

Vía Lo que me gusta del Menéame de Faqoff –gracias– veo el apunte Lo que no me gusta del Menéame de Alianzo.

Intenté dejar varias veces un comentario con respuestas breves punto por punto, pero el servidor me dió varios errores, ahora están inaccesibles (prometo que no hice nada raro :-) ). Afortunadamente tenía una copia en el clipboard, así que la pongo aquí editada mínimamente para que quede algo más “digno” de un apunte (aún así disculpad por el estilo, de todas maneras las respuestas de Faqoff son mejores, más claras y seguro que más objetivas que las mías).

1. Ya no, así que ya no servirá más como excusa. Y si no se muestran los anteriores –a pesar que era mi intención inicial– es porque pedimos opinión y varios (por ejemplo) nos han comentado que sería “violar las condiciones anteriores”, que incluso afecta a la privacidad.

Un curiosidad sobre los votos negativos públicos, me sorprendió bastante (aunque el período es todavía muy corto para que sea fiable).

2. Si hay ordenación cronológica es porque no sabemos como hacer una mejor, de todas formas está la pestaña de populares para verlas ordenadas por votos y por períodos diferentes. ¿Alguna otra propuesta? Si es posible la probamos (aunque tampoco lo han cambiado en Negóciame, con participación de Alianzo, será que tampoco es tan obvio).

3. Sí, diariamente hay intentos de “fraudes”, algunos se cuelan, pero son muy pocos y si son “gordos” lo avisamos. Estos intentos de fraude son siempre envíando con muchos usuarios –uno llegó a tener hasta 60– y reseteando routers para cambiar la IP. Otros abusos suelen ser usar dominios alternativos con redirecciones en Javascript para saltarse los bans[*], pero como no son “graves” ni afectan demasiado no solemos comentarlos, preferimos no levantar tantas veces el dedo acusador.

Tenemos un programa que cada hora detecta estos intentos y banea [*] los dominios… que por supuesto generan quejas de por qué “censuramos”. Las IPs corporativas están muy “vigiladas” y de hecho hay muchas baneadas, la mayoría de medios de comunicación (y todas las de TOR).

4. El “sesgo”, sí, lo más probable –unos dicen que de Linux, otros de Ubuntu, otros del PSOE y algunos hasta monarquistas o de extrema derecha– pero no podemos hacer nada salvo dar nuestra opinión personal en los comentarios y votar acorde a ellos.

Pero el hecho que haya menos tecnológicas no sólo es normal, sino que es bueno. No todo el mundo está interesado en el último API de Google o el iPhone y la charla de Jobs –menos en un sitio tan alejado de Silicon Valley–. Además al variar acercamos las noticias tecnológicas a gente que nunca las leería. De todas formas están las metacategorías, puedes seguir sólo las tecnológicas e incluso marcarla para que se muestre por defecto en la página principal y seguir sólo a estas por los RSS.

5. No sé qué es eso de la “sensación de manipulación”. Si es porque “toquemos” votos, siento decepcionarte, pero no, nunca lo hemos hecho. Si es porque haya “mafias”, ver el punto #3, dedicamos mucho esfuerzo para evitarlas. Si es porque la gente vota “raro”, pues sí, es lo que tienen los sistemas de votaciones, que rara vez sale lo que esperas.

Ya que hablas de “manipulación”, te olvidas de mencionar algo no demasiado infrecuente. El trolleo, mentiras y manipulación de uno de los socios del Negóciame para desacreditar al Menéame y autopromocionarse. Fue otro caso de los varios que tuvimos que aguantar y parece que se olvidan rápido.

6. Intenta definir “interesante”. Es un tema de nunca acabar y que no tiene respuesta. Lo que es interesante para tí no tiene por qué serlo para la mayoría. Lo que para unos es “interesante” por rara o extravagante para otros es irrelevante.

Sobre mezclar medios editoriales con sistemas de votos… pues cada vez lo veo más difícil. O es uno u otro. O pagas a todos por igual o no pagas a nadie. O es libre o es privativo. Pero las mezclas no suelen funcionar, la gente que colabora espera coherencia y que su aportación valga (y retribuya) exactamente igual que las otras. Un sistema editorial no está mal, pero es otra cosa y los intentos de mezclarlos (como el de Netscape/Calacanis) falló. Obviamente puedo estar equivocado, pero sistemas mixtos de estos no han prosperado (ni en el Web 2.0, ni en comunidades de desarrollo de software libre, ni en la Wikipedia, hasta hay artículos de Yochai Benkler).

Por supuesto, para gusto colores y un sitio como el Menéame nunca terminará de agradar ni siquiera a una minoría importante, normal, ni hace falta. A mi tampoco me gustan la inmensa mayoría de las que salen en portada, pero es que además de leer mucho las pendientes estoy mucho más interesado en el proceso que en el resultado –parcial, las de “portada” son sólo una parte– del mismo.

Lo que no es normal tantas críticas por “supuestas manipulaciones”, “supuestos engaños” sin poner pruebas o sin hacer el mínimo analisis riguroso a pesar de que el Menéame es en su clase –incluyendo a Digg o cualquier otro lejano o cercano– el que más información publica (desde el software, karma, todos los cálculos… hasta las visitas al web).

¿No es digno es estudio esta manía tan extraña? ;-)