Infrastruktur von Lenovo und Nvidia

Schwedischer Supercomputer für die Forschung

3. Juni 2022, 8:47 Uhr | Lukas Steiglechner | Kommentar(e)
Lenovo Supercomputer, Alvis
© Henrik Sandsjö

Die Chalmers University of Technology im schwedischen Göteborg hat Lenovo und Nvidia ausgewählt, um die nationale Supercomputer-Infrastruktur Alvis auszubauen. Damit soll Forschung mittels Künstlicher Intelligenz und maschinellem Lernen vorangetrieben werden.

Lenovo hat bekanntgegeben, dass die Chalmers University of Technology in Göteborg die technische Infrastruktur von Lenovo und Nvidia zum Betrieb ihres groß angelegten Supercomputer-Projekts Alvis nutzt. Im Rahmen des Projekts wurde ein Cluster-Computing-System für die Forschung im Bereich der Künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) bereitgestellt und implementiert. Dabei handelt es sich um den größten HPC-Cluster (High Performance Computing) von Lenovo für KI und ML in der Region Europa, Naher Osten und Afrika.

Alvis (altnordisch für „allwissend”) ist eine nationale Supercomputer-Infrastruktur innerhalb der Swedish National Infrastructure for Computing (SNIC). Er wurde zunächst im Jahr 2020 in Betrieb genommen und hat seitdem eine Kapazität erreicht, mit der größere Forschungsaufgaben in breiterem Maßstab gelöst werden können. Das von der Knut- und Alice-Wallenberg-Stiftung finanzierte Computersystem wird von Lenovo bereitgestellt und befindet sich an der Chalmers University of Technology in Göteborg, wo auch die größte Forschungsinitiative der EU, das Graphene Flagship Project, beheimatet ist.

Das Kooperationsprojekt ermöglicht es jedem schwedischen Forscher, der seine mathematischen Berechnungen und Modelle verbessern muss, die Dienste von Alvis über das Anwendungssystem des SNIC zu nutzen, unabhängig vom Forschungsgebiet. Dies unterstützt sowohl Forscher, die bereits maschinelles Lernen zur Analyse komplexer Probleme nutzen als auch Forscher, die den Einsatz von maschinellem Lernen zur Problemlösung in ihrem jeweiligen Bereich untersuchen wollen. Dies kann zu bahnbrechenden akademischen Erkenntnissen in Bereichen wie Quantencomputing und datengesteuerter Forschung für das Gesundheitswesen und die Wissenschaft führen.

„Das Alvis-Projekt ist ein Paradebeispiel für die Rolle des Supercomputing bei der Lösung der größten Herausforderungen der Menschheit, und Lenovo ist stolz und begeistert, zu diesem Projekt beitragen zu können”, sagt Noam Rosen, EMEA Director, HPC & AI bei der Lenovo Infrastructure Solutions Group. „Unterstützt durch die leistungsfähige Technologie von Lenovo wird Alvis die Forschung vorantreiben und maschinelles Lernen in vielen verschiedenen Bereichen einsetzen, die einen großen Einfluss auf die gesellschaftliche Entwicklung haben, darunter die Umweltforschung und die Entwicklung von Arzneimitteln. Diese Computing-Infrastruktur ist wirklich einzigartig, da sie auf der Grundlage von Architekturen für verschiedene KI- und Machine-Learning-Workloads und auch mit Rücksicht auf Nachhaltigkeit gebaut wurde. Sie trägt durch den Einsatz unserer bahnbrechenden Warmwasserkühlungstechnologie dazu bei, Energie zu sparen und den Kohlenstoffausstoß zu reduzieren.”

„Die erste Pilot-Infrastruktur für Alvis wurde bereits von mehr als 150 Forschungsprojekten an schwedischen Universitäten genutzt. Durch die Vergrößerung und die vollständige Öffnung des Alvis-Systems für alle schwedischen Forscher spielen Chalmers und Lenovo eine wichtige Rolle bei der Bereitstellung eines nationalen HPC-Ökosystems für die künftige Forschung“, erklärt Sverker Holmgren, Direktor von Chalmers e-Infrastructure Commons, dem Betreiber des Alvis-Systems.

Energieeffiziente KI-Infrastruktur

Chalmers hat sich für die Implementierung eines skalierbaren Clusters mit einer Reihe von Lenovo „ThinkSystem“-Servern entschieden, um seinen Nutzern die richtige Mischung aus Nvidia-GPUs zu liefern, wobei Energieeinsparungen und Workload-Balance im Vordergrund stehen. Dazu gehören das Lenovo „ThinkSystem SD650-N V2“, um die Leistung für Nvidia „A100 Tensor Core“-GPUs zu liefern und das Nvidia-zertifizierte „ThinkSystem SR670 V2“ für Nvidia „A40“- und „T4“-GPUs.

„Die Arbeit, die wir mit der Universität Chalmers und ihrem nationalen Supercomputer Alvis leisten, wird den Forschern die Rechenleistung geben, die sie brauchen, um unsere Welt zu simulieren und vorherzusagen", meint Rod Evans, EMEA-Direktor für High Performance Computing bei Nvidia. „Gemeinsam geben wir der wissenschaftlichen Gemeinschaft Werkzeuge an die Hand, mit denen sie die größten Herausforderungen im Supercomputing lösen kann – von der Wettervorhersage bis zur Arzneimittelforschung.“

Die Speicherarchitektur liefert eine neue Ceph-Lösung mit 7,8 Petabyte, die in die bestehende Speicherumgebung bei Chalmers integriert werden soll. Nvidia Quantum 200 Gb/s InfiniBand sorgt bei dem System für niedrigere Latenz und hohen Datendurchsatz sowie intelligente In-Computing-Beschleunigung. Mit dieser Hochgeschwindigkeitsinfrastruktur stehen den Nutzern fast 1.000 Grafikprozessoren, hauptsächlich Nvidia „A100 Tensor Core“, mit über 260.000 Rechenkernen und über 800 TFLOPS Rechenleistung zur Verfügung.

Darüber hinaus nutzt Alvis die Flüssigkeitskühlungstechnologie „Neptune“ von Lenovo, um eine beispiellose Recheneffizienz zu erzielen. Ursprünglich war für das Projekt eine vollständige Luftkühlung vorgesehen, doch Chalmers entschied sich stattdessen für eine Warmwasserkühlung, um die langfristigen Betriebskosten zu senken und ein „grüneres“ KI-Infrastruktursystem zu schaffen. Die Universität geht davon aus, dass dank der Wasserkühlung erhebliche Energieeinsparungen möglich sein werden.

Die HPC-Lösung ist seit Februar 2022 in Produktion und wird im Sommer 2022 voll einsatzfähig sein.


Verwandte Artikel

Lenovo Deutschland, NVIDIA Corporate

Anbieterkompass