Suchen

So bleiben Grafikkarten jung

| Redakteur: Michael Eckstein

Forscher der TU Wien und der University of California in Irvine haben ein Thread-Management entwickelt, das den Alterungsprozess stark beanspruchter Grafikkarten bremsen und die Gesamtleistung verbessern soll.

Firma zum Thema

Kleine Ursache, große Wirkung: Kleinste Abweichungen auf Transistorebene bei der Die-Fertigung führen zu einer unterschiedlichen Abnutzung einzelner Prozessorkerne.
Kleine Ursache, große Wirkung: Kleinste Abweichungen auf Transistorebene bei der Die-Fertigung führen zu einer unterschiedlichen Abnutzung einzelner Prozessorkerne.
(Bild: Clipdealer)

Aufgrund ihrer Architektur sind Grafikkarten stark beim Berechnen paralleler Aufgaben. Daher eignen sie sich sehr gut beispielsweise für Analysen in der Forschung oder das Generieren von Kryptogeld wie Bitcoin. Allerdings verschlechtert sich die Leistung einer Grafikkarte mit der Zeit, weil die einzelnen Prozessorkerne aufgrund von Alterungseffekten nicht mehr optimal zusammenspielen.

Dieser Effekt tritt besonders dann auf, wenn die GPU-Kerne ungleichmäßig ausgelastet werden. Forscher der TU Wien haben nun in Zusammenarbeit mit der University of California (Irvine) ein Verfahren entwickelt, das parallelisierte Einzelberechnungen gezielt auf unterschiedliche Bereiche des Chips verteilen kann. Nach Aussagen von Muhammad Shafique vom Institut für Computer Engineering an der TU Wien „bremst dieses neue Management-Verfahren die Alterung der Grafikkarten in über 95 Prozent der Fälle“.

Kleine Abweichungen bei der Fertigung führen zu großen Problemen

Gewöhnliche Desktop- oder Laptop-Computer, wie man sie zu Hause stehen hat, haben in der Regel nur wenige Prozessorkerne, typischerweise zwei bis acht. Eine Grafikkarte ist hingegen auf massiv-parallele Datenverarbeitung ausgelegt und hat daher eine komplett andere Architektur: „Sie arbeitet typischerweise mit hunderten oder tausenden von Prozessorkernen“, sagt Shafique. Daher könne man „Grafikkarten sehr gut für Berechnungen einsetzen, die parallelisierbar sind, bei denen also eine Aufgabe in viele unabhängige Teilschritte zerlegt werden kann, die gleichzeitig von unterschiedlichen Prozessorkernen durchgeführt werden.“

Allerdings sind die Prozessorkerne niemals völlig identisch. „Die Strukturen sind sehr klein, produktionsbedingt kommt es immer zu gewissen Abweichungen“, sagt Shafique. Daher wirkt sich auch die Alterung des Chips unterschiedlich auf die verschiedenen Prozessorkerne aus. Unter hoher Belastung liefern die einzelnen Kerne irgendwann unterschiedliche Leistung. Das ist ein Problem für die Qualität der Parallelisierung: Wenn man eine Aufgabe auf viele Prozessorkerne verteilt und für den nächsten Schritt warten muss, bis alle fertiggerechnet haben, dann bestimmt der langsamste Prozessorkern zwangsläufig, wie schnell es weitergeht. Dadurch ergibt sich laut Shafique bald ein spürbarer Rückgang der Gesamtperformance.

Lasten fair verteilen

Dieses Problem wollen Shafique und das Team um Prof. Mohammad Al Faruque von der University of California (Irvine) nun durch ein besseres Management lösen: „Entscheidend ist, zuerst den aktuellen Status der einzelnen Prozessorkerne zu kennen“, sagt Muhammad Shafique. „Dann kann man die Rechenaufgaben so zuweisen, dass der physische Stress möglichst gleichmäßig auf die unterschiedlichen Kerne verteilt wird.“

Die von den Forschern vorgestellte Lösung fasst Prozessorkerne mit ähnlichen Eigenschaften zu „Clustern“ zusammen, die dann nach einem speziellen Algorithmus gezielt mehr oder weniger stark belastet werden. Dadurch ließe sich der Alterungsprozess bremsen, was die Gesamtleistung des Systems verbessere. „Es gab bereits Überlegungen, die Alterung von Grafikkarten auf Compiler-Ebene einzubremsen, doch unsere Methode ist deutlich effektiver “, sagt Muhammad Shafique, „sie bringt in über 95 Prozent der Fälle einen Vorteil.“

Originalpublikation: H. Lee, M. Shafique, M. Al Faruque, Aging-aware Workload Management on Embedded GPU Under Process Variation, IEEE Transactions on Computers, PP 99 (2018).

(ID:45186957)