Wärmemanagement Ausfallsicherheit im Rechenzentrum erhöhen

Autor / Redakteur: Tobias Best * / Lea Drechsel

Falsches Wärmemanagement in Rechenzentren kann zum Ausfall der physikalischen Kapazitäten führen. Mit virtuellen Vorabanalysen lässt sich jedoch die Ausfallsicherheit erhöhen.

Firmen zum Thema

Rechenzentren: Der Betreiber muss jede Situation im Griff haben. Das richtige Werkzeug kann die Lage entspannen und frühzeitig auf Risiken hinweisen.
Rechenzentren: Der Betreiber muss jede Situation im Griff haben. Das richtige Werkzeug kann die Lage entspannen und frühzeitig auf Risiken hinweisen.
(Bild: Alpha-Numerics)

Die täglichen Herausforderungen eines Rechenzentrum-Betreibers sind die Steuerung dynamischer Prozesse, das Einbringen neuer Hardware und die gleichzeitige Sicherstellung des ununterbrochenen, sicheren Betriebs des Rechenzentrums.

Bildergalerie
Bildergalerie mit 6 Bildern

Kein Rechenzentrum gleicht dem anderen, doch wird von den Verantwortlichen erwartet, dass sie jede Situation im Griff haben. Das entsprechende Wissen lehrt nur die Erfahrung in der Praxis, doch kann auch in diesem Beruf das richtige Werkzeug so manche Lage entspannen und frühzeitig auf Risiken hinweisen. Von oben betrachtet regelt ein rentables Rechenzentrum drei Herausforderungen besonders gut:

  • Verfügbarkeit der IT,
  • Physikalische Kapazitätsauslastung,
  • Effizienz des Kühlmaßnahmen.

Diese drei Kriterien sind eng miteinander verbunden und ringen um die meiste Aufmerksamkeit. Je besser die physikalische Kapazität gemanaged wird, desto mehr IT- Ressourcen können angeboten werden. Doch kann die Kühlung einen Strich durch die Rechnung machen und die physikalische Kapazität (Platzbedarf im Rack, lokale PCU-Anbindung/Auslastung) stark einschränken.

Zwar findet die IT einen Einbauplatz und Stromversorgung in einem zur Verfügung stehenden Rack, doch nützt dieser nichts, wenn in dem lokalen Bereich im Rechenzentrum die Kühlung schon vollkommen ausgelastet ist. Des Weiteren sollte bei Redundanzsystemen (z.B.: n+1) die Änderung der lokalen Kühlkapazitäten bei einem Ausfall der ACU (Kühleiheit) auch in Betracht gezogen werden.

Es gibt hunderte und tausende lokale Echtzeitdaten, welche analysiert und grafisch vollautomatisch aufgearbeitet werden. Doch können diese Daten nur ein Bild des aktuellen Zustands wiedergeben, d.h. die physikalische Kapazität und die vorliegenden lokalen Temperaturen (eventuell sogar Luftgeschwindigkeiten) in Kombination mit der IT-Verfügbarkeit zu protokollieren.

Leider können diese Daten keine Aussage dazu treffen, inwieweit die neugeplante Hardware dieses Ökosystem beeinflussen wird. Neue Hardware benötigt Kühlleistung und diese wird entweder von frei zur Verfügung stehenden Luftwegen abgezweigt oder beispielsweise dem direkten IT-Nachbarn gestohlen.

(ID:42853024)