Como es Wikipedia por dentro
En estos dos artículos en pdf: workbook2007.pdf y Wikimedia architecture.pdf encontrados en este blog se pueden ver el funcionamiento interno de todos los subsistemas que forman wikipedia.
Unos artículos muy buenos para todos aquellos que nos dedicamos al diseño de soluciones o la implementación de las mismas con software y hardware propietario.
Como resumen, wikipedia (o más bien la compleja red de sistemas de la Fundación Wikimedia) está formado por sistemas clusterizados con sistema operativo linux distribuidos geográficamente en tres continentes (America, Europa y Asia) mediante un CDN (Content Distribution Network).
La Arquitectura básica está basada en LAMP (Linux Apache MySQL y PHP) y como balanceo y cacheo de páginas estáticas el famoso squid junto con CARP. La base de datos está formada por tres clusters de MySQL.
Para montar las aplicaciones utilizan como sistema de ficheros NFS montados en cada servidor. Para el servidor/es de DNS utilizan el famoso BIND junto a un parche GeoDNS que permite la redirección geográfica de la llamada.
Para servir las imágenes de contenido estático de la web se basa en un servidor muy ligero pero potente llamado lighthttpd que da unas tasas de respuesta muy buena.
A parte de toda esta arquitectura todo esto funciona bajo un motor
MediaWiki creado por Wikimedia en PHP bajo licencia GPL y está basada en software de libre distribución.

Popularidad: 6% [?]

Posted Enero 14, 2008
Comments(0)


