Los scrapers y spamblogs salen rentables

Autor: Armonth | El viernes 06 de julio del 2007 @ 05:59.

Los scrapers y spamblogs salen rentables... por desgracia. Hoy me han pasado los resultados de un "experimento" y me han dejado decepcionado: esperaba que los resultados no fueran tan buenos.

A principios de febrero, un amigo me comentó sobre un experimento que acababa de iniciar y al ver lo que se proponía intenté evitarlo. La idea era hacer un "planet" a modo de scraper chupando lectores RSS, sin mencionar fuente ni nada, publicidad y rematado con una serie de spamblogs.

Intenté evitarlo porque me parecía mal, entre otras cosas por lucro, cuando yo monté el Planet Webdev ya de entrada dije que no pondría publicidad al considerar el sitio un "expositor" de contenidos ajenos. Además si no se menciona la fuente el contenido duplicado puede afectar negativamente a los sitios sindicados.

No conseguí quitarle la idea de la cabeza, pero sí me prometió que cuando hubiera terminado el experimento (máximo 6 meses) borraría toda la "basura" generada en Internet: y ha cumplido. Lo cual me sorprende más que todo el resto.

Ahora vienen los resultados del experimento, querría que los publicase él mismo pero si yo (siendo un amigo) ya discutí, mejor ni hablar de lo que le pueden decir desconocidos y prefiere hacerlo él.

Resumiendo:

1 + 1 planet(s) "scraper" para robar contenido.
10 spamblogs semanales para "enlazarse".
Objetivo: ver cuánto se puede ganar con trabajo ajeno...
Una conclusión: Google tiene que mejorar.

Inicio

El primer planet se inició el 2 de febrero con un dominio registrado en el 2005 y tenia múltiples temáticas. El segundo planet el 15 de febrero y era de una sola temática: medicina.

Lo primero que me dijo es: "voy a comprobar si realmente un scraper puede generar tráfico mediante el robo de contenidos". Para mí sorpresa demostró tener "cierta lógica" y tenerlo bien pensando: "he añadido al Planet una opción para que no se publiquen las entradas automáticamente si el número de palabras en el contenido del feed y de la web es muy grande". Más tarde supe que comprobaba todo lo que había entre el <div id="content"> y su cierre </div>.

Eso lo hizo para evitar medidas que yo apoyo como enviar algo distinto en el feed según el referido.

Mencionar que todo el tráfico ha venido desde buscadores siendo Google el que ha mantenido un valor cercano al 100% y nunca por debajo del 96% del total de visitas.

Febrero y marzo: nada, cero, nothing

El primer mes, las estadísticas no marcan nada:

Tráfico:
Visitas: 58.
Páginas vistas: 79.
Otros: PR0, 40 enlaces desde spamblogs.
Adsense:
Clicks: 0.
Ganancias: 0.

En marzo los resultados son prácticamente iguales salvo un 5% más de visitas y un click de 0.12$.

Abril y mayo: Ooops

Las cosas empiezan a moverse, hay dos scrapers recibiendo 40 enlaces mensuales, veamos abril:

Tráfico:
Visitas: 210 / 80.
Páginas vistas: 263 / 99.
Otros: PR0 / PR0, 120/90 enlaces desde spamblogs.
Adsense:
Clicks: 2 / 7
Ganancias: 0.05$ / 0.70$.

Y el de mayo:

Tráfico:
Visitas: 418 / 315.
Páginas vistas: 497 / 422
Otros: PR1 / PR3, 155/160 enlaces desde spamblogs.
Adsense:
Clicks: 7 / 12
Ganancias: 0.20$ / 1.72$

Primera sorpresa: el scraper "temático" empieza a posicionar aparentemente mejor que el multi-temática. Además en la actualización de pagerank ya empieza a verse diferencias notables, por no hablar del precio por click.

Y finalmente... Junio

Tráfico:
Visitas: 618 / 704.
Páginas vistas: 865 / 1244
Otros: PR1 / PR3, 210/250 enlaces desde spamblogs.
Adsense:
Clicks: 19 / 47
Ganancias: 1.12$ / 7.05$

Aquí vemos como en 5 meses y dos scrapers ha hecho 10$, en los cinco días de julio antes de borrar los contenidos hizo 8$ más: en 5 meses ha recuperado "la inversión" (el precio de un año de dominio) y a partir de ahí, de seguir, todo son ganancias: "sinceramente hector, viendo estos resultados creo que repitiendo el proceso y eligiendo temáticas más jugosas uno puede generar mucho dinero, ¿entiendes ahora porqué hay tanto scraper pirata?".

Yo nunca he dudado de los motivos que tiene la gente para iniciar un scraper y ya me imaginaba que era rentable pero no tenía ningún caso con datos de primera mano.

Hay días en que me digo a mi mismo que no debería pensar y es que si lo piensas queda claro: si tu intención es ganar dinero deja la moral, ética o legalidad a un lado y echarle un poco de cemento a tu cara.

Ahora bien, de momento no ha podido refutar algo y es que en mi opinión no hay duda: ganar dinero manteniendo la ética tiene mucho más merito.

¿Qué hacer ante los scrapers?

En EE.UU he visto como a algunos scrapers los han demandado mediante la DMCA, nunca pensé que diría esto pero parece que "algo bueno" (¿?) tiene. La vía legal no creo que sea una medida efectiva: hay mucho "dinosaurio" que no entiende Internet como para entender qué es un blog o el concepto "un artículo no registrado en ninguna oficina y la fecha se comprueba con Internet y sitios de terceros".

Lo principal supongo es poder demostrar ante los buscadores y ante todos que tú eres el autor original y para eso sólo se puede hacer una cosa: ser el primero. Tener un Sitemap ayuda a que Google y otros buscadores te indexen primero.

Por suerte, en caso de una denuncia al revés (que el ladrón te denuncie a ti diciendo que tú eres el plagiador) con buscadores como Technorati o Google Blogsearch se puede "medio demostrar" (quizá legalmente no, pero a ojos de los entendidos sí) quién ha publicado primero.