Publicado el Viernes 06 de Julio del 2007 @ 5:59 por Armonth.
Los scrapers y spamblogs salen rentables… por desgracia. Hoy me han pasado los resultados de un “experimento” y me han dejado decepcionado: esperaba que los resultados no fueran tan buenos.
A principios de febrero, un amigo me comentó sobre un experimento que acababa de iniciar y al ver lo que se proponía intenté evitarlo. La idea era hacer un “planet” a modo de scraper chupando lectores RSS, sin mencionar fuente ni nada, publicidad y rematado con una serie de spamblogs.
Intenté evitarlo porque me parecía mal, entre otras cosas por lucro, cuando yo monté el Planet Webdev ya de entrada dije que no pondría publicidad al considerar el sitio un “expositor” de contenidos ajenos. Además si no se menciona la fuente el contenido duplicado puede afectar negativamente a los sitios sindicados.
No conseguí quitarle la idea de la cabeza, pero sí me prometió que cuando hubiera terminado el experimento (máximo 6 meses) borraría toda la “basura” generada en Internet: y ha cumplido. Lo cual me sorprende más que todo el resto.
Ahora vienen los resultados del experimento, querría que los publicase él mismo pero si yo — siendo un amigo — ya discutí, mejor ni hablar de lo que le pueden decir desconocidos y prefiere hacerlo él.
Resumiendo:
El primer planet se inició el 2 de febrero con un dominio registrado en el 2005 y tenia múltiples temáticas. El segundo planet el 15 de febrero y era de una sola temática: medicina.
Lo primero que me dijo es: “voy a comprobar si realmente un scraper puede generar tráfico mediante el robo de contenidos”. Para mí sorpresa demostró tener “cierta lógica” y tenerlo bien pensando: “he añadido al Planet una opción para que no se publiquen las entradas automáticamente si el número de palabras en el contenido del feed y de la web es muy grande” — más tarde supe que comprobaba todo lo que había entre el <div id="content"> y su cierre </div>.
Eso lo hizo para evitar medidas que yo apoyo como enviar algo distinto en el feed según el referido.
Mencionar que todo el tráfico ha venido desde buscadores siendo Google el que ha mantenido un valor cercano al 100% y nunca por debajo del 96% del total de visitas.
El primer mes, las estadísticas no marcan nada:
En marzo los resultados son prácticamente iguales salvo un 5% más de visitas y un click de 0.12$.
Las cosas empiezan a moverse, hay dos scrapers recibiendo 40 enlaces mensuales, veamos abril:
Y el de mayo:
Primera sorpresa: el scraper “temático” empieza a posicionar aparentemente mejor que el multi-temática. Además en la actualización de pagerank ya empieza a verse diferencias notables, por no hablar del precio por click.
Aquí vemos como en 5 meses y dos scrapers ha hecho 10$, en los cinco días de julio antes de borrar los contenidos hizo 4$ más: en 5 meses ha recuperado “la inversión” (el precio de un año de dominio) y a partir de ahí, de seguir, todo son ganancias: “sinceramente hector, viendo estos resultados creo que repitiendo el proceso y eligiendo temáticas más jugosas uno puede generar mucho dinero, ¿entiendes ahora porqué hay tanto scraper pirata?”.
Yo nunca he dudado de los motivos que tiene la gente para iniciar un scraper y ya me imaginaba que era rentable pero no tenía ningún caso con datos de primera mano.
Hay días en que me digo a mi mismo que no debería pensar y es que si lo piensas queda claro: si tu intención es ganar dinero deja la moral, ética o legalidad a un lado y echarle un poco de cemento a tu cara.
Ahora bien, de momento no ha podido refutar algo y es que en mi opinión no hay duda: ganar dinero manteniendo la ética tiene mucho más merito.
En EE.UU he visto como a algunos scrapers los han demandado mediante la DMCA, nunca pensé que diría esto pero parece que “algo bueno” (¿?) tiene. La vía legal no creo que sea una medida efectiva: hay mucho “dinosaurio” que no entiende Internet como para entender qué es un blog o el concepto “un artículo no registrado en ninguna oficina y la fecha se comprueba con Internet y sitios de terceros”.
Lo principal supongo es poder demostrar ante los buscadores y ante todos que tú eres el autor original y para eso sólo se puede hacer una cosa: ser el primero. Tener un Sitemap (1) ayuda a que Google y otros buscadores te indexen primero.
Por suerte, en caso de una denuncia al revés (que el ladrón te denuncie a ti diciendo que tú eres el plagiador) con buscadores como Technorati o Google Blogsearch se puede “medio demostrar” (quizá legalmente no, pero a ojos de los entendidos sí) quién ha publicado primero.
Sorprendente esos datos, de razón estamos tan llenos de estos sitios en la web.
Me imagino que lo mismo se aplica a sitios MFA.. seguro que con eso generan mas, si no es asi… ¿por que hay tantos?
El que existán este tipo de mecanismos no es algo nuevo. Ha veces se ha hablado si google news hace algo parecido, porque ellos capturan noticias de diferentes fuentes y las publican (aunque colocan la fuente en todas ellas), son contenidos ajenos y no pagan por ellos.
Si todo es moralidad en los blogs, no sería interesante, y son los lectores los que tienen que mejorar. Ya me decía un profesor en bachillerato, que hay profesores piratas (malos enseñando) mientras existán alumnos piratas (no preparados). Entonces los scrapers y spamblogs existen, porque no hay usuarios preparados o consientes cuando visitan la web.
Un saludo,
Excelente trabajo.
Y coincido en tu conclusión: ” Google tiene que mejorar”… mucho
jejeje, creo que ya sé cual planet de medicina era. Será porque algunos de “sus” artículos, eran míos
Concuerdo contigo Armonth, pero tambiñen la blogósfera está invadida de Blogs que se autoescriben a través de los Feeds y que, en muchos casos ni siquera citan la fuente y dejan un Correo o algo para contactarles…
En fin, banearlos y dejarlos fuera, pero el Plagio no parará si hay alguien detrás que busca beneficio.
Saludos!
O sea que me tengo que hacer un scrapper ;)
La realidad es que solo el 30% de los blogs genera contenidos, y el resto solo replica, traduce, cita y/o copia.
Es muy dificil escribir cosas nuevas todo el tiempo.
la realidad es solo el 1% de los blogs genera contenido, recordemos que hay 1,4 blogs nuevos por segundo, eso significa q si todos se unirian en unasola web y crearan contenido serian un caos, pero es una buena idea.
Lo otro es q google no esquien tiene q mejorar, son las personas, recordemos q esto es poco etico, no poco no es la palabra, esto no tiene nada de etica.
Estoy deacuerdo con lo que dices Armonth que google debería de ponerse las pilas con estos temas y darle al César lo que es del César, y no a cualquier listo que se limita a robarlo de forma impune y sin consentimiento.
Pero de forma más inmediata lo que realmente haría falta serían usuarios más capacitados a la hora de emitir un juicio y actuar ante estos fraudes como sugiere Gilberto. Y ya no solo con scrapers, porque te aseguro que se hace en blogs que actualmente están gozando de una buena posición y se están beneficiando de la información que ofrecen otros sin emitir una referencia, para que sus noticias robadas y sin referenciar se vean primero en los motores de búsqueda.
Buenas! Yo tengo mi pequeño blog con unas pocas entradas, pero el 99% son enteramente mias y con horas dedicadas.
Hace poco descubri una personilla que se esta dedicando a rellenar su blog con mis articulos sin cumplir con la licencia CC que uso… salvo cuando por error olvida reemplazar alguno de los enlaces internos que suelo colocar. Incluso se baja mis ejemplos y los sube en su sitio quitando todas las referencias a mi sitio…
No tiene formulario de contacto, le deje comentarios que no publico, mande mails a abuse@[suhosting.com] y no pasa nada.
Y me da muchisima bronca que alguien con dos clicks pueda hacerce con el trabajo de los demas sin dejarle una sola referencia.
¿Que hay que hacer? Me preocupo solo de aparecer primero en el buscador y “paso” de el?
Este asunto no me quita el sueño, pero la verdad es que me desanima mucho cuando decido sentarme a escribir. Armonth, te ha pasado? que sueles hacer? se resuelve? :/
Gracias por cualquier comentario
vaya excelente post!
hasta me dan ganas de copiarlo! jejeje broma!
muy buen experimento, vaya que hay gente que le busca la manera de posicionarse y ganar dinero de mala manera