El tema del contenido duplicado se está comentando bastante por la blogosfera. Sin ir más lejos yo mismo lo hice hace un par de días y hoy voy a comentarlo de nuevo pero para centrarme en exclusiva en WordPress.
Lo primero, decir que Online Marketing Research ha escrito How to Make a WordPress Blog Duplicate Content Safe que explica bastante bien las medidas.
En resumidas cuentas dice para evitar el contenido duplicado en WordPress debes:
-
Añadir el metatag
noindex,follow
a los archivos mensuales / semanales / diarios (se olvida de los anuales), siguientes entradas (los /page/) y -- si es necesario -- a las categorías. -
Asegurarse que todas las páginas tienen un
meta description
único. -
Activar redirecciones 301 para tus páginas no-www y sin las barras finales.
-
Impedir a los crawlers indexar tus páginas de feeds y trackbacks.
-
Usar la etiqueta "more" (``) para mostrar extractos en tu home en lugar de entradas completas.
-
Reducir el número de entradas mostradas en el home.
Mi opinión es la siguiente:
Los puntos 1 y 2 no me afectan, ya que mis archivos no son "copias" de los posts, son listados de enlaces y/o con un extracto en el caso de las búsquedas / tags. Además no uso un meta description. La excepción son las "páginas" (/page/)...
El tercer punto lo puse desde el principio (aunque impidiendo el uso de
las www y todavía se puede usar la barra final). El cuarto lo hacía
mediante un enlace nofollow pero no es mala idea añadirlo por
robots.txt
.
El quinto de momento me niego, sólo sirve para que la gente que entra por web tenga que hacer clicks innecesarios para terminar de leer las entradas. Pero por otro lado tal como está si hay mucha entrada larga tiene que hacer mucho scrolling. Por último el sexto lo hice a raíz de la longitud media de las entradas.
Personalmente me pregunto: ¿Te puede afectar tanto el contenido duplicado?. Entendiéndolo como el "por defecto" (dejemos aparte el contenido duplicado claramente intencionado) que trae WordPress dado que hay muchos blogs bien posicionados con WP.
Creo que lo que voy a hacer es lo siguiente:
-
Usar el robots.txt para restringuir el
/trackback/
y el/feed/
(veo que el nofollow hace su trabajo, pero a la que alguien me enlace un link de estos sin nofollow no valdrá de nada). -
Añadir noindex a
/page/
(salvo en las etiquetas), total viendo el índice en Google sólo salen dos o tres por lo que seguramente caen en suplementarios.
Me gusta mejorar, pero encuentro contradictorio que por un lado se nos
inste a no pensar para los buscadores y por otro a facilitarles el
trabajo ¬_¬U
.
Comentarios