viernes, 30 de marzo de 2007

U´f qué caló o reflexiones sobre el cambio climático en los CPD

Durante mucho tiempo no nos importó. Simplemente no pensábamos en ello. Nos limitábamos a coger el nuevo y flamante servidor, sys correspondientes guias y lo metíamos en el rack. Y así continuábamos. De repente, una nueva especie apareció en nuestros CPD. No vestían a lo geek, en vez de un portátil y/o un cable serie llevaban mono azul y una caja de herramientas, y la verdad que no tenían pinta de Sysadmin. Hasta que un día se nos ocurre preguntarles quienes son. "Mantenimiento" nos respondieron. "¿Mantenimiento?" preguntamos. "¿de qué?".

Pues sí. Los CPD ya no son nuestros. Ese terrenito que considerábamos de nuestra exclusiva competencia ha dejado de serlo. Ese pedazo de tierra que nos pertenecía, ese hogar a donde volver cuando el mundo exterior nos rechazaba nos ha sido negado. Ahora somos un usuario de esa sala... y tenemos que pedir permiso para entrar.

Bromas aparte, los CPD se están convirtiendo en un foco de problemas para nuestros servidores que no esperábamos... y un quebradero de cabeza para nuestros financieros. Y todo es exclusivamente culpa nuestra, de los tecnólogos. Y me refiero al calor. Al incremento de temperatura de nuestras flamantes máquinas en los CPD. Y los pobres chicos de mantenimiento se las ven y se las desean para mantener el calor en esos 18-21º de temperatura a los que nuestras máquinas aspiran para mantenerse en funcionamiento.

Hemos de empezar a tener en cuenta el calor. Es nuestro peor enemigo. 45~55º hacen más daño a nuestros servidores que cualquier denial of service. Y a los grados no hay patch management o firewall que los pare. Por otro lado, el precio de las máquinas baja, pero el de los sistemas de refrigeración se mantiene o sube. En mi vida profesional he visto tres grandes desastres provocados por el sobrecalentamiento de un CPD o una sala técnica. Y fueron grandes catástrofes: Arrays de disco parados, las últimas cintas recalentadas (con la última copia válida dentro), y casi un 20 por ciento de las máquinas paradas.... y el resto a punto de pararse. Apagado de emergencia y carreras por el Corte Inglés visa en mano comprando pingüinos para intentar refrigerar lo que no podía apagarse.

En otro caso, la cosa se aderezó con un incendio de una mezcla de papeles, bolígrafo bic y bolsitas de componentes que alguien dejó metidos en un rack. Es toda una experiencia ver saltar el halón (que mata ya que desplaza al oxígeno), y escuchar una alarma al estilo de las trompas de Jericó de los stukas.

Hoy por hoy, considero mandatorio el incluir el factor de temperatura generada por los servidores a la hora de diseñar la infraestructura. Los centros de datos cada vez son más y más masivos, cada vez caben más máquinas en un rack y cada vez los llenamos más.

Soluciones como la de los Blades tampoco son tan maravillosas. Si nuestro CPD no está diseñado para un equipo que en 7 u 8 u tiene las mismas CPU que un rack (y esas sí que se calientan igual tengas blade o no) , es posible que os pase como a alguien que conozco que tuvo que apagar sus flamantes blades porque el "chorrito" de aire que tiraban por detrás freía otras máquinas.

Los procesadores también tienen la culpa: En un Xeon se puede cocinar cuando está funcionando. No olvidéis que los blades tienen exactamente los mismos procesadores que las máquinas clásicas, y que generan el mismo calor.

Mi experiencia me indica que el factor de disipación térmica es algo a tener en cuenta... y os aconsejo que lo hagáis. AMD ha ganado alguna que otra batalla con sus Opteron precisamente por esto. Conozco un caso en que la diferencia de calor entre Opterons y Xeons decidió una elección porque para la cantidad de máquinas de las que se hablaba (unas 500) la opción Xeon implicaba desembolsar casi 200.000 € en ampliar la capacidad de enfriamiento del CPD y ampliación de planta de potencia.

Virtualizar minimiza la generación del calor, pero también añade riesgos: Si se calienta el rack de nuestra plataforma virtualizada y las máquinas se apagan, no caen sólo los servidores físicos, sino además los virtuales.

Hay especialistas en el mercado en el diseño de infraestructuras. Incluso hay fabricantes que facilitan asesoramiento para lo mismo. Contad con ellos.

1 comentario:

Sauron dijo...

La verdad es que el coste de la climatización del CPD es un aspecto que cada vez gana mas importancia, desde hace tiempo monto sistemas tolerantes a fallos con modulos snmp de gestión y sensores de temperatura en todos los raks, todo monitorizado con mom o lo que toque, pero la verdad es que el coste es tremendo, asi que es cierto que los fabricantes tienen aqui un buen argumento de venta, como no son tontos estan luchando por ser los mas "verdes".
Dios el argon, que panico que se sentia al lado de esas bombonas.
Nuestros CPDs, sitio de paz y ruido, que de horas verdad?...