[Afectación de varios servidores] 30/06/2017 14:06 – Fallo en ATS

Comienzo de la incidencia: 16:22 del 12/02/2016

Problema:

– Pérdida de conectividad y reinicio de algunos servidores

– Causa del fallo: pérdida de alimentación eléctrica por fallo en ATS

– Tiempo de afectación del servicio: entre 5 minutos y 18 minutos

Esta mediodía, a las 14:06 uno de los ATS (Automatic Transfer Switch – los aparatos que intercambian la corriente entre las 2 fuentes de corriente que tienen) de nuestro CPD ha fallado y ha dejado de proporcionar corriente durante unos segundos, con lo que todos los dispositivos (switches y servidores) conectados a él se han reiniciado, lo que ha llevado a la pérdida de conectividad y reinicio de alguno de los servidores.

Tras restaurar el servicio, se ha procedido al diagnóstico del problema y el ATS ha sido reemplazado por otro, evitando así más problemas de este tipo.

Como medida de emergencia se ha planificado una revisión a fondo con nuestros técnicos electricistas a partir de las 00:30 de la noche del 30/06/2017 al 01/07/2017 y hasta las 07:00 del 01/07/2017. En ese periodo es posible que tengamos que reiniciar o detener algún servicio y alguna máquina, con lo que es posible que algunos servicios se vean afectados. Esperamos que sean los mínimos posibles.

Lamentamos las molestias causadas.

El Equipo de Hacheté Diseños Web