Comienzo de la incidencia: 16:06 del 04/12/2018
Problema:
– Pérdida de conectividad y reinicio de algunos servidores
– Causa del fallo: pérdida de alimentación eléctrica por fallo en autómata en cuadro eléctrico
– Tiempo de afectación del servicio: entre 60 minutos y 105 minutos
Esta tarde, un automata que controla uno de nuestros cuadros eléctricos en nuestro datacenter principal ha fallado y ha enviado la orden de apagado a los SAIs que controlaban 2 armarios rack , lo que ha llevado a la pérdida de conectividad y reinicio de alguno de los servidores.
Conforme se han ido recuperando las máquinas, algunos servicios han mostrado problemas y hemos tenido que ir conectándonos uno a uno a cada servidor para resolver las incidencias particulares.
Estamos trabajando con nuestro equipo de electricistas para introducir una capa de redundancia adicional para que este problema no pueda volver a suceder.
Lamentamos las molestias causadas.
El Equipo de Hacheté Diseños Web