Desde que se anunció que Linden Lab iba a efectuar un mantenimiento intesivo durante toda la presente semana, la pregunta que muchos se hicieron (nos hicimos) fue ¿Qué motivaba a realizar un mantenimiento tan intenso y prolongado? y, adicionalmente, otra pregunta que también ganó terreno fue respecto a cómo iba a ser el mantenimiento de cada región.
Pues bien, hoy, en su blog Oficial, Linden Lab publicó un post en el cual explican los motivos de este mantenimento. Por lo tanto comparto con ustedes dicha explicación, traducida al castellano:
Mantener los sistemas que ejecutan la infraestructura de Second Life funcionando sin problemas no es poca cosa. Nuestra infraestructura de monitoreo mantiene un ojo en nuestras máquinas cada segundo, además de un equipo de personas que trabajan día y noche para asegurarse de que Second Life funciona sin problemas. Hacemos nuestro mejor esfuerzo para reemplazar los sistemas que fallan de forma proactiva e invisible para los residentes. Por desgracia, a veces surgen problemas inesperados.
A finales de julio, un fallo de hardware derribó a cuatro de nuestros servidores anfitriones de simuladores de última generación. Inicialmente, esto se atribuyó a un fallo al azar, y la máquina fue enviada a nuestro proveedor para su reparación. A principios de octubre, un segundo fallo derribó otras cuatro máquinas. Dos semanas más tarde, otro fallora en otros cuatro anfitriones.
Cada servidore anfitrión host está colocado dentro de un chasis (rack), junto con otros tres anfitriones. Estos cuatro anfitriones comparten un panel de cableado común que proporciona a los anfiriones energía eléctrica, conectividad a redes y de almacenamiento. Los fallos se originan en un sobrecalentamiento y posterior fallo de un componente en estas paneles de cableados.
Después de una investigación exhaustiva con nuestro proveedor, la causa de las fallas resultó ser un defecto de hardware en un componente del panel posterior. Organizamos una visita in situ de nuestro proveedor para localizar, identificar y reemplazar los paneles afectados. Los miembros de nuestro equipo de operaciones han estado trabajando esta semana con nuestro proveedor en nuestro centro de datos inspeccionando todos los sistemas potencialmente afectados y reemplazando los componentes defectuosos para evitar más fallos.
Los reinicios de región que algunos de ustedes han experimentado esta semana fueron un desafortunado efecto secundario de este trabajo de mantenimiento crítico. Hemos hecho nuestro mejor esfuerzo para mantener estos reinicios al mínimo, ya que entendemos cuán perjudicial puede ser un reinicio región. Los equipos afectados se han reparado y devuelto al servicio y estamos seguros de que habrá más fallos de este tipo en el futuro. Gracias a todos por su paciencia y comprensión mientras nosotros estuvimos trabajando en esta ventana de mantenimiento extendido de esta semana.
No hay mucho mas para decir, solo que, por lo dicho, todo indica que el mantenimiento de esta semana está próximo a concluir, ya que el post habla del mismo en tiempo pasado, por lo cual, supongo que mañana se harán los últimos trabajos para verificar que todo se encuentre en orden y se procederá a dar por concluído el mismo. Ya seremos, seguramente, informados en el blog de Estado de Second Life.
Por último, tal como dijera en un artículo anterior, es un buena señal ver que Linden Lab ha retomado el camino de la comunicación con sus usuarios. Si bien no es lo que alguna vez fue, al menos, desde la llegada de Ebbe Altberg a la empresa, se ha abierto un canal de información que se extrañaba y que los usuarios necesitamos para poder manejar nuestros tiempos en el mundo virtual, brindo por ello.
SaludOS/2