Gravatar de Armonth

Los scrapers y spamblogs salen rentables

Los scrapers y spamblogs salen rentables… por desgracia. Hoy me han pasado los resultados de un “experimento” y me han dejado decepcionado: esperaba que los resultados no fueran tan buenos.

A principios de febrero, un amigo me comentó sobre un experimento que acababa de iniciar y al ver lo que se proponía intenté evitarlo. La idea era hacer un “planet” a modo de scraper chupando lectores RSS, sin mencionar fuente ni nada, publicidad y rematado con una serie de spamblogs.

Intenté evitarlo porque me parecía mal, entre otras cosas por lucro, cuando yo monté el Planet Webdev ya de entrada dije que no pondría publicidad al considerar el sitio un “expositor” de contenidos ajenos. Además si no se menciona la fuente el contenido duplicado puede afectar negativamente a los sitios sindicados.

No conseguí quitarle la idea de la cabeza, pero sí me prometió que cuando hubiera terminado el experimento (máximo 6 meses) borraría toda la “basura” generada en Internet: y ha cumplido. Lo cual me sorprende más que todo el resto.

Ahora vienen los resultados del experimento, querría que los publicase él mismo pero si yo — siendo un amigo — ya discutí, mejor ni hablar de lo que le pueden decir desconocidos y prefiere hacerlo él.

Resumiendo:

  • 1 + 1 planet(s) “scraper” para robar contenido.
  • 10 spamblogs semanales para “enlazarse”.
  • Objetivo: ver cuánto se puede ganar con trabajo ajeno…
  • Una conclusión: Google tiene que mejorar.

Inicio

El primer planet se inició el 2 de febrero con un dominio registrado en el 2005 y tenia múltiples temáticas. El segundo planet el 15 de febrero y era de una sola temática: medicina.

Lo primero que me dijo es: “voy a comprobar si realmente un scraper puede generar tráfico mediante el robo de contenidos”. Para mí sorpresa demostró tener “cierta lógica” y tenerlo bien pensando: “he añadido al Planet una opción para que no se publiquen las entradas automáticamente si el número de palabras en el contenido del feed y de la web es muy grande” — más tarde supe que comprobaba todo lo que había entre el <div id="content"> y su cierre </div>.

Eso lo hizo para evitar medidas que yo apoyo como enviar algo distinto en el feed según el referido.

Mencionar que todo el tráfico ha venido desde buscadores siendo Google el que ha mantenido un valor cercano al 100% y nunca por debajo del 96% del total de visitas.

Febrero y marzo: nada, cero, nothing

El primer mes, las estadísticas no marcan nada:

  • Tráfico:
    • Visitas: 58.
    • Páginas vistas: 79.
    • Otros: PR0, 40 enlaces desde spamblogs.
  • Adsense:
    • Clicks: 0.
    • Ganancias: 0.

En marzo los resultados son prácticamente iguales salvo un 5% más de visitas y un click de 0.12$.

Abril y mayo: Ooops

Las cosas empiezan a moverse, hay dos scrapers recibiendo 40 enlaces mensuales, veamos abril:

  • Tráfico:
    • Visitas: 210 / 80.
    • Páginas vistas: 263 / 99.
    • Otros: PR0 / PR0, 120/90 enlaces desde spamblogs.
  • Adsense:
    • Clicks: 2 / 7
    • Ganancias: 0.05$ / 0.70$.

Y el de mayo:

  • Tráfico:
    • Visitas: 418 / 315.
    • Páginas vistas: 497 / 422
    • Otros: PR1 / PR3, 155/160 enlaces desde spamblogs.
  • Adsense:
    • Clicks: 7 / 12
    • Ganancias: 0.20$ / 1.72$

Primera sorpresa: el scraper “temático” empieza a posicionar aparentemente mejor que el multi-temática. Además en la actualización de pagerank ya empieza a verse diferencias notables, por no hablar del precio por click.

Y finalmente… Junio

  • Tráfico:
    • Visitas: 618 / 704.
    • Páginas vistas: 865 / 1244
    • Otros: PR1 / PR3, 210/250 enlaces desde spamblogs.
  • Adsense:
    • Clicks: 19 / 47
    • Ganancias: 1.12$ / 7.05$

Aquí vemos como en 5 meses y dos scrapers ha hecho 10$, en los cinco días de julio antes de borrar los contenidos hizo 4$ más: en 5 meses ha recuperado “la inversión” (el precio de un año de dominio) y a partir de ahí, de seguir, todo son ganancias: “sinceramente hector, viendo estos resultados creo que repitiendo el proceso y eligiendo temáticas más jugosas uno puede generar mucho dinero, ¿entiendes ahora porqué hay tanto scraper pirata?”.

Yo nunca he dudado de los motivos que tiene la gente para iniciar un scraper y ya me imaginaba que era rentable pero no tenía ningún caso con datos de primera mano.

Hay días en que me digo a mi mismo que no debería pensar y es que si lo piensas queda claro: si tu intención es ganar dinero deja la moral, ética o legalidad a un lado y echarle un poco de cemento a tu cara.

Ahora bien, de momento no ha podido refutar algo y es que en mi opinión no hay duda: ganar dinero manteniendo la ética tiene mucho más merito.

¿Qué hacer ante los scrapers?

En EE.UU he visto como a algunos scrapers los han demandado mediante la DMCA, nunca pensé que diría esto pero parece que “algo bueno” (¿?) tiene. La vía legal no creo que sea una medida efectiva: hay mucho “dinosaurio” que no entiende Internet como para entender qué es un blog o el concepto “un artículo no registrado en ninguna oficina y la fecha se comprueba con Internet y sitios de terceros”.

Lo principal supongo es poder demostrar ante los buscadores y ante todos que tú eres el autor original y para eso sólo se puede hacer una cosa: ser el primero. Tener un Sitemap (1) ayuda a que Google y otros buscadores te indexen primero.

Por suerte, en caso de una denuncia al revés (que el ladrón te denuncie a ti diciendo que tú eres el plagiador) con buscadores como Technorati o Google Blogsearch se puede “medio demostrar” (quizá legalmente no, pero a ojos de los entendidos sí) quién ha publicado primero.

13 Comentarios (feed)

  1. Gravatar de DragoN DragoN nos comenta:

    Sorprendente esos datos, de razón estamos tan llenos de estos sitios en la web.

    Me imagino que lo mismo se aplica a sitios MFA.. seguro que con eso generan mas, si no es asi… ¿por que hay tantos?

    Viernes, 6 de Julio/2007 @ 8:27

  2. Gravatar de Gilberto Galea Gilberto Galea nos comenta:

    El que existán este tipo de mecanismos no es algo nuevo. Ha veces se ha hablado si google news hace algo parecido, porque ellos capturan noticias de diferentes fuentes y las publican (aunque colocan la fuente en todas ellas), son contenidos ajenos y no pagan por ellos.
    Si todo es moralidad en los blogs, no sería interesante, y son los lectores los que tienen que mejorar. Ya me decía un profesor en bachillerato, que hay profesores piratas (malos enseñando) mientras existán alumnos piratas (no preparados). Entonces los scrapers y spamblogs existen, porque no hay usuarios preparados o consientes cuando visitan la web.

    Un saludo,

    Viernes, 6 de Julio/2007 @ 8:31

  3. Gravatar de Troy Troy nos comenta:

    Excelente trabajo.
    Y coincido en tu conclusión: ” Google tiene que mejorar”… mucho

    Viernes, 6 de Julio/2007 @ 9:16

  4. Gravatar de Shora Shora nos comenta:

    jejeje, creo que ya sé cual planet de medicina era. Será porque algunos de “sus” artículos, eran míos

    Viernes, 6 de Julio/2007 @ 11:45

  5. Gravatar de Armonth Armonth nos comenta:

    Shora frío frío, el planet de medicina que yo recuerde no te tenía (lo cual no se si se puede considerar un “insulto”).

    Gilberto no mezclemos cosas, existen muchos agregadores, planets, etcétera. Lo importante es que citen la fuente (si es en el propío título mejor). Luego si añaden publicidad o hacen otras cosas ya entra dentro de la moralidad y el juicio de cada uno.

    Viernes, 6 de Julio/2007 @ 15:47

  6. Gravatar de Marlex Systems Marlex Systems nos comenta:

    Concuerdo contigo Armonth, pero tambiñen la blogósfera está invadida de Blogs que se autoescriben a través de los Feeds y que, en muchos casos ni siquera citan la fuente y dejan un Correo o algo para contactarles…

    En fin, banearlos y dejarlos fuera, pero el Plagio no parará si hay alguien detrás que busca beneficio.

    Saludos!

    Viernes, 6 de Julio/2007 @ 17:27

  7. Gravatar de InKiLiNo InKiLiNo nos comenta:

    O sea que me tengo que hacer un scrapper ;)

    Viernes, 6 de Julio/2007 @ 19:39

  8. Gravatar de Artux Artux nos comenta:

    La realidad es que solo el 30% de los blogs genera contenidos, y el resto solo replica, traduce, cita y/o copia.

    Es muy dificil escribir cosas nuevas todo el tiempo.

    Sábado, 7 de Julio/2007 @ 1:32

  9. Gravatar de tomas tomas nos comenta:

    la realidad es solo el 1% de los blogs genera contenido, recordemos que hay 1,4 blogs nuevos por segundo, eso significa q si todos se unirian en unasola web y crearan contenido serian un caos, pero es una buena idea.

    Lo otro es q google no esquien tiene q mejorar, son las personas, recordemos q esto es poco etico, no poco no es la palabra, esto no tiene nada de etica.

    Viernes, 13 de Julio/2007 @ 21:49

  10. Gravatar de Armonth Armonth nos comenta:

    Tomas si google mejora y termina identificando y filtrando los spamblogs/scrapers estos dejarán de existir al menos a la hora de adquirir publicidad con Adsense…

    Sábado, 14 de Julio/2007 @ 8:26

  11. Gravatar de Carmen Carmen nos comenta:

    Estoy deacuerdo con lo que dices Armonth que google debería de ponerse las pilas con estos temas y darle al César lo que es del César, y no a cualquier listo que se limita a robarlo de forma impune y sin consentimiento.

    Pero de forma más inmediata lo que realmente haría falta serían usuarios más capacitados a la hora de emitir un juicio y actuar ante estos fraudes como sugiere Gilberto. Y ya no solo con scrapers, porque te aseguro que se hace en blogs que actualmente están gozando de una buena posición y se están beneficiando de la información que ofrecen otros sin emitir una referencia, para que sus noticias robadas y sin referenciar se vean primero en los motores de búsqueda.

    Lunes, 10 de Septiembre/2007 @ 13:52

  12. Gravatar de Federico Federico nos comenta:

    Buenas! Yo tengo mi pequeño blog con unas pocas entradas, pero el 99% son enteramente mias y con horas dedicadas.

    Hace poco descubri una personilla que se esta dedicando a rellenar su blog con mis articulos sin cumplir con la licencia CC que uso… salvo cuando por error olvida reemplazar alguno de los enlaces internos que suelo colocar. Incluso se baja mis ejemplos y los sube en su sitio quitando todas las referencias a mi sitio…

    No tiene formulario de contacto, le deje comentarios que no publico, mande mails a abuse@[suhosting.com] y no pasa nada.

    Y me da muchisima bronca que alguien con dos clicks pueda hacerce con el trabajo de los demas sin dejarle una sola referencia.

    ¿Que hay que hacer? Me preocupo solo de aparecer primero en el buscador y “paso” de el?

    Este asunto no me quita el sueño, pero la verdad es que me desanima mucho cuando decido sentarme a escribir. Armonth, te ha pasado? que sueles hacer? se resuelve? :/

    Gracias por cualquier comentario

    Miércoles, 12 de Marzo/2008 @ 14:45

  13. Gravatar de nadie007 nadie007 nos comenta:

    vaya excelente post!
    hasta me dan ganas de copiarlo! jejeje broma!
    muy buen experimento, vaya que hay gente que le busca la manera de posicionarse y ganar dinero de mala manera

    Martes, 18 de Marzo/2008 @ 5:00

No seas tímido, da tu opinión

Sé respetuoso con los demás, la diferencia de opiniones enriquece la discusión, los comentarios bajo ciertas circunstancias pueden ser moderados y requerir aprobación.