Contenido duplicado y una respuesta a Denken Über

Autor: Armonth | El viernes 22 de diciembre del 2006 @ 04:34.

Pensaba dejarlo en forma de comentario, pero por extensión he pensado que quizá sea más adecuado por aquí. Denken Über habla sobre que Google ha escrito por primera vez de forma oficial sobre el contenido duplicado.

De ello también hablan OjoBuscador, Telendro, Dirson, etcétera. Pero me enfoco en lo dicho por Mariano ya que se centra en la relación del problema del contenido duplicado (Nota: en ese enlace lo enfoco desde los recursos que pierden los buscadores al tener que indexar cosas repetidas) los planetas y los agregadores:

Y esto es uno de los problemas que aparecen con algunos "scrappers" y que los DIFERENCIAN de los "planetas" donde el título linkea al artículo original y no hay permalinks que rivalicen con el original; mientras en los "agregadores" se puede perjudicar al original porque [...]

Luego utiliza el Planet Webdev como ejemplo de "planeta" versus otros que no mencionan las fuentes y que directamente entran en el saco de los scrappers.

Teniendo en cuenta que es muy fácil hacer un planeta con WordPress yo me centre en tres detalles al hacerlo y parte de ello lo comente en el manual, paso a desarrollar un poco más los mismos:

  1. Reconocimiento: que el título enlazará al post original ya lo hice por aquel entonces previendo el posible daño que puedes cometer, es una forma clara de darle reconocimiento y es muy cierto que a la larga el que copia (el planet) se ve perjudicado. Es una mera herramienta de promoción de textos sobre desarrollo web.

  2. Comentarios cerrados: esto ya lo explique pero es importante. Lo único que haces al permitir comentarios es quitárselos al original y -- lo realmente importante -- dado que no puedes saber todas las dudas de los que leen los artículos es más adecuado para ellos es enviarlos al que lo ha escrito. No te creas mala imagen (por no responder/saber sobre un tema que no has escrito) y el usuario recibe (en teoría) contestación.

  3. Planeta sin publicidad: inicialmente lo hice por cuestión de ética, no me parece bien obtener beneficios de contenido ajeno sin ningún tipo de esfuerzo y de forma automatizada.

Ahora, con la experiencia en la mano creo que además es un sin sentido puro. Viendo algunas estadísticas entre ellas la del Planet Webdev, tranquilamente el 85-90% del tráfico es por feeds. Esto es así porque el volumen de entradas que tienen los planetas (incluso los pequeños) suele ser lo suficiente alto como para no poder seguirlo vía web.

Al ser todo contenido duplicado, el tráfico que llega desde buscadores es casi nulo (en mi caso: 0.01% del total, y creo que así debe ser).

Entonces, los que montan planets/scrappers para ganar dinero deben aparcar la ética a un lado y aún así cuesta. Pero de verdad que si ya de por si cuesta ganar dinero en Internet, con los planetas lo veo algo casi imposible.

La única posibilidad que me parece razonable en la que un planet pueda obtener un buen posicionamiento es que el sitio original muera indefinidamente y por tanto éste pase a ser la única copia del texto original.

Por último un consejo: si tienes un blog es casi obligatorio usar un Sitemap, esto al menos por mi experiencia es garantia de que tu contenido será el primero en ser rastreado por Google.

Y no dudéis en banear User-Agents y IPs de bots que solamente copian y no citan. Puestos a las malas debería ser algo común el mandar emails pidiendo amablemente la eliminación del contenido plagiado o la citación de la fuente. En últimas instancias el hosting del plagiador suele "ser razonable".

Comentarios