HMSE_Robot es un “nuevo” bot de origen coreano que recorre la red en busca de direcciones que recolectar para hacer spam y contenido que plagiar y lucrarse. No respeta el robots.txt y en poco más de 16 horas ha visitado más de 3000 páginas de SigT cuando antes ni existía en las estadísticas, 3000 [...]
Cuando uno se aburre, las ideas aparentemente estúpidas aparecen. Estaba pensando si es cierto que los amigos suelen enlazar más a menudo y me he dicho: vamos a ver quién me enlaza más. Para ello decido usar la lista de trackbacks, así que mediante MySQL vamos a sacar dicha lista a un fichero de texto: SELECT comment_author_url [...]
No sé muy bien cómo debería empezar ésta entrada, en principio preferiría hablar con Ashacz primero pero localizarlo por IM en verano es algo difícil. Lo primero de todo que quiero dejar claro es que yo nunca he tenido intención de hacer spam en ningún sitio. Ni en nótame ni en ningún sitio. Podría mandarme mis [...]
Vaya, se puede decir que hasta ahora no había tenido SPAM manual de forma masiva en SigT… hasta ahora. Digo manual porque es demasiado poco complejo para pensar en spam organizado usando redes de ordenadores zombie, aunque quizá me equivoque. Aproximadamente cada 12 horas recibo una oleada de 15 o 20 comentarios spam con particularidades poco [...]
Un resumen de las búsquedas en buscadores por las cuales llegan a SigT, como siempre las lógicas, “normales” o relevantes no cuentan™… El mes pasado no hubo selección, pero éste viene cargado con algunas sorpresas: shrink Del Olmo: shrink es encoger / reducir… me parece que hay gente que le ha cogido manía al juez :P. buscar bronca [...]
Pues eso, que ya he vuelto de mis vacaciones por Barcelona y mañana (hoy) a recoger el coche y ver si me voy poniendo al día. Como supongo que a muchos los asuntos personales no interesan mucho que digamos (y porque aquí, salvo excepciones siempre hemos abogado por evitar hablar del joputa del gato que [...]
Zootropo se ha currado un script en python que pasando como argumento un fichero XML (ya sea el feed o un Google Sitemap) comprueba la popularidad de las entradas en del.icio.us. Entre otras cosas, sirve para comprobar aquella regla del 20/80 donde el 20% del esfuerzo (en este caso entradas) genera el 80% de tráfico (en [...]