Gravatar de Armonth

Script para comprobar tu popularidad en del.icio.us

Zootropo se ha currado un script en python que pasando como argumento un fichero XML (ya sea el feed o un Google Sitemap) comprueba la popularidad de las entradas en del.icio.us.

Entre otras cosas, sirve para comprobar aquella regla del 20/80 donde el 20% del esfuerzo (en este caso entradas) genera el 80% de tráfico (en este caso popularidad).

El script tiene, como ya indica Zootropo, algunos problemas como por ejemplo que llegado a un punto, del.icio.us envía un error 999 quejándose del exceso de peticiones hechas. Se me ocurren dos o tres posibles mejoras al script (a ver qué te parecen Zootropo :-)):

  1. Usar opcionalmente la búsqueda, si buscas “SigT” en del.icio.us ya te salen las entradas más populares por ese término y como “SigT” es un término poco común y que siempre aparece en los titulos…

    Por si acaso, los falsos positivos se pueden filtrar por dominio. Y creo que es más interesante este método, mi sitemap mínimo tiene 1300 URLs (= peticiones) pero en del.icio.us sólo hay archivadas 284 entradas (joder… 21% la regla 20/80 se cumple cosa mala): 1300 peticiones vs 28 (10 resultados por página).

  2. Por lotes, parece que el máximo de peticiones ronda las 180 (a Zootropo le ha “petado” en la 181, a mí en la 182). Por lo que se podría buscar las primeras 150, esperar $X (1, 2, 5) minuto(s) y seguir.

Bueno y ahora a modo de meme (¿hace un meme de esto para conocer las entradas más populares de los blogs? :-P) para la búsqueda SigT:

  1. Traducción de “20 Rules of Smart And Successful Web-development”: 72.
  2. SigT: 60.
  3. XHTML 2.0: El futuro de la web “y que no nos pase ná”: 64.
  4. Diez cosas que DEBES conocer ANTES de registrar un dominio con cualquiera: 38.
  5. Guía del Fansuber by Kazka: 36.
  6. Cómo hacer un Planet con WordPress: 35
  7. Cinco consejos de seguridad para WordPress: 32.
  8. Creando páginas de error 404 amigables para el usuario: 30.
  9. Lecturas recomendables: 28.
  10. Top-ten de killer-apps para GNU/Linux: 28.

PD: Esto me recuerda que tengo que volver a añadir las imágenes de comentar/añadir a del.icio.us a los feeds, que siempre que actualizo WordPress me olvido de hacer el cambio en el wp-rss2.php.

4 Comentarios (feed)

  1. Gravatar de Zootropo Zootropo nos comenta:

    El fallo de la primera forma es que hay mucha gente (yo, por poner un ejemplo) que no muestra el título de la web en el title. Luego si busco mundogeek en del.icio.us casi todo son entradas del wiki, en el que si que pongo el nombre de la web en el título

    Lo segundo si que se puede hacer, y de hecho muy facilmente, simplemente cambiando el código que trata la excepción URLError (la que se lanza cuando del.icio.us dice que nanai) por time.sleep(segundos) y otra llamada a get_count con lo que falte de lista.

    Pero no he visto en ninguna parte de del.icio.us cuánto tiempo hay que esperar hasta que te permiten volver a floodearlos, y como tengas que estar parando media hora por cada 180 peticiones…

    Miércoles, 6 de Junio/2007 @ 15:55

  2. Gravatar de Zootropo Zootropo nos comenta:

    Por cierto, muy interesantes las entradas :-)
    Es una buena forma de hacer que los lectores redescubran pequeñas joyas escondidas

    Miércoles, 6 de Junio/2007 @ 15:56

  3. Gravatar de Armonth Armonth nos comenta:

    Zootropo ¡ya te digo!, si la gente usase más del.icio.us (el permitir con un click en el propio feed añadir a del.icio.us creo que influye en ello) sería perfecto para — al menos en mi caso — tener un “Best post’s” a mano.

    Sobre el fallo de la primera forma, creo que es obvio que me refiero a un segundo método, tipo ./delicious.py -by-search=”SigT” -domain=sigt.net

    :-)

    Miércoles, 6 de Junio/2007 @ 17:40

  4. Gravatar de InKiLiNo InKiLiNo nos comenta:

    En el curro no puedo, pero esta noche cuando llege a casa lo pruebo ;)

    Jueves, 7 de Junio/2007 @ 8:00

No seas tímido, da tu opinión

Sé respetuoso con los demás, la diferencia de opiniones enriquece la discusión, los comentarios bajo ciertas circunstancias pueden ser moderados y requerir aprobación.