Publicado el Sábado 11 de Agosto del 2007 @ 20:42 por Armonth.
Manz ha escrito un artículo titulado Robots.txt: todo lo que deberia saber que recomiendo si todavía no dominas su uso.
A lo que Manz tocaría añadir unas pequeñas notas:
Si en algún momento impides la indexación de las imágenes (por error o similar) y con ello te quedas sin ninguna imagen en Google Images hay que tener en cuenta que aunque vuelvas a permitir la indexación los efectos no se verán hasta la próxima gran actualización de imágenes (usualmente 3 meses).
Un error en el robots.txt puede desindexar páginas no esperadas, especialmente cuando se usan los comodines, comprobad en Google Sitemaps vuestro robots.txt para ver que páginas filtra. De lo contrario os puede llegar a salir muy caro.
Si de contenido duplicado y WordPress se trata, seguramente os interese un código de robots.txt que comente para filtrar las páginas duplicadas que son:
Por último añadir que cuánto más complejo es un sitio más difícil es saber qué restringir o que no y más fácilmente se cae en errores ya que los comodines se vuelven imprescindibles. Una vez más: mucho cuidado con los cambios que se hacen en el robots.txt.
Ves, ves, ya lo decía yo en la entrada de Manz, eso de que se muestren los feeds en los resultados de las búsquedas es un coñazo.
Ainsss… si hubiera sabido esto un mes antes… qué mala es la ignorancia :P
Ahora toca esperar 2 meses como condena xD
Un apunte…
Armonth, el tema del bot de imagenes de Google creo que es cierto en su estado “por defecto”. Pero en google webmasters hay (no se si para todo el público, o solo para sitios con mucho flujo de visitas) una opción para realizar una búsqueda mejorada de imagenes en fase beta.
Con este sistema la indexación normalmente es mucho más rápida que 2 meses. Al menos en mi caso he hecho pruebas y en apenas unos días (ni una semana) el ritmo de visitas a las imagenes se dispara.
Liamngls para los que quieran “des-indexar” los feeds rapidamente, también pueden usar la opción de eliminar directorios del mencionado central de Google Webmasters.
Eso si, en experiencia personal, se demoran bastante en eliminarlos.
Saludos,
Corrijeme si me equivoco, pero bloquear el /feed/ creo que no te indexa en la búsqueda de blogs de google. En mi caso, cuando hice eso (hace tiempo) no indexaba a BlogHogwarts
Saludos