Problemas comunes de un centro de cómputo

Los problemas que se tienen en un centro de cómputo latinoamericano suelen ser muy diferentes a los encontrados en Estados Unidos.

Algunos de los problemas que tenemos son:

1. Limitada capacidad eléctrica en la zona, área o edificio.
2. Espacios reducidos para ubicación del centro de cómputo.
3. Limitada redundancia en componentes como UPS, aire acondicionado, etc.
4. Mala calidad de energía eléctrica (Power Quality).
5. Interrupciones o cortes eléctricos en horas de trabajo atribuibles al proveedor de energía eléctrica.
6. Costos eléctricos altos comparados contra EUA y Canada.

Todo esto sin contar que el personal de operación es reducido y solo contratado para trabajar en horarios habituales de oficina.

¿Qué pasa en la noche?
¿Qué pasa el fin de semana?

Puedo asegurar que casi todo aquel que ha tenido a su cargo desde un IDF hasta un centro de cómputo ha tenido la experiencia de llegar el lunes y encontrar todo apagado o con una temperatura superior a los 30 grados centigrados y/o ha recibido la llamada del personal de seguridad diciéndole que algo paso en el centro de cómputo.  Y como Murphy nunca falla ese día estan todos los jefes o ese día se tiene una reunión de la que no debería (deseo no posible) salir, en fin… ustedes podrán continuar esta historia.

Después de estos incidentes el reponsable del centro de cómputo siempre parte los viernes dándole la bendición a su centro de cómputo esperando encontrarlo vivo el día lunes.

¿Qué podemos hacer?

Son varios puntos que es necesario tomar en cuenta para garantizar la continuidad del servicio.

1. Tener contratos de mantenimiento preventido  y correctivo de los equipos. Tener siempre a la mano los teléfonos de los proveedores que pueden atender las fallas.
2. Contar con una planta de emergencia que pueda operar al menos 8 hrs. Esto es necesario en aquellos lugares de operación continua o de alta importancia. Contar con el servicio automatizado de llenado de tanque.
3. Contar con un aire acondicionado redundante, no necesariamente de precisión, pero que en caso de falla del principal pueda tomar la carga térmica en su totalidad. Este punto es importante pues hoy día prácticamente todos los servidores se apagan automáticamente al detectar temperaturas exteriores superiores a los 40 grados y algunos incluso a los 35 grados.
4. Mantener las baterias del UPS en buen estado. Este es el corazón de sus UPS.
5. Contar con un sistema automatizado de monitoreo y alarma de todos sus sistemas eléctricos y de aire para que reporte de manera automática cualquier anomalía detectada de manera instantanea a todos los responsables internos y externos.

La falla de uno de estos puntos, provoca en un corto plazo el colapso de un centro de cómputo y la pérdida de varios miles de dólares tanto a nivel operativo como a nivel hardware. Cuando un centro de computo se cae por falta de energía o por alta temperatura generalmente hay un muertito (y que Dios no quiera que sea el operador) como un disco duro, una fuente o peor tantito una base de datos!!.

www.energiayredes.com

Leave a Reply

*

Translate »