Publicado el Jueves 09 de Agosto del 2007 @ 5:09 por Armonth.
aNieto2k me ha pasado (así, sin nada, ni un comentario ¿indirecta para que traduzca? :-P) por correo el enlace a la última entrada de High Scalability que trata sobre la arquitectura de Digg.
Y es que el Martes sin ir más lejos ya mencione éste sitio por el tema de la arquitectura de Youtube.
Digg soporta 1.2 millones de usuarios con un alto nivel de páginas vista sedientos de información, sin embargo la arquitectura de Digg se podría definir como “simplista”.
Digg funciona bajo un LAMP clásico de Linux-Apache-MySQL y PHP junto a Lucene (un motor de búsqueda de alto rendimiento de Apache), MCache 2.0 y APC.
Empezaron en el 2004 con un solo servidor con GNU/Linux, Apache 1.3, PHP 4 y MySQL 4.0 usando MyISAM como sistema por defecto para la base de datos. Ahora con 200 millones de páginas vistas al mes y 30GB de datos reparten la carga entre 100 servidores en múltiples centros de datos.
Llama la atención tanto la cantidad como que de los 100 servidores, 20 son de bases de datos, 30 para servidores web, unos pocos para Lucene y el resto para redundancia.
Ninguno de los retos de escalabilidad que han tenido que afrontar ha sido con PHP. Los mayores problemas han sido relacionados a tema de base de datos. La naturaleza ligera de PHP ha permitido mover tareas de la base de datos a PHP para mejorar la escalabilidad. Ebay hace esto mismo de forma radical. Han movido casi todo el trabajo fuera de la base de datos hacia aplicaciones, incluyendo uniones (joins), un trabajo que normalmente hace la base de datos.
Los puntos más interesantes de la parte interna de Digg son:
La parte más interesante sin duda son algunos puntos de la sección de lecciones aprendidas:
En cierto punto de la curva de crecimiento se vuelve imposible crecer añadiendo más RAM, toca crecer en arquitectura.
amen!
la voy a imprimir y la voy a pegar en la pared de mi oficina!!!!
Ja,ja,ja,ja… ese es el estilo de Andrés.
Muy buena adaptación/traducción, Héctor.
Me sorprende que sitios líderes en internet como Digg usen una arquitectura LAMP. Sería fantástico que siguieras esta serie de artículos de otros sitios de ese nivel: Flickr, Youtube, etc.
Un cordial saludo.
¡Ups! Me faltaba un café cuando escribía mi comentario.
;-)
Me sigue sorprendiendo (y mucho) que algunas de las mejores páginas del mundo empleen PHP como lenguaje de servidor…