Führende Cloud-Service-Provider, Halbleiterhersteller und System-Provider gründen gemeinsam das Ultra-Ethernet-Consortium

Mit der Gründung des Ultra-Ethernet-Consortium kommen führende Unternehmen für eine branchenweite Kooperation zusammen, um eine vollständig auf Ethernet basierte Kommunikations-Stack-Architektur für Hochleistungs-Netzwerke aufzubauen. Künstliche Intelligenz (KI) und High-Performance-Computing (HPC)-Workloads entwickeln sich rasant weiter und haben höchste Anforderungen an Funktionalität, Leistung, Interoperabilität und Gesamtbetriebskosten. Gleichzeitig darf die Benutzerfreundlichkeit für Entwickler und Endanwender nicht leiden. Der Ultra-Ethernet-Solution-Stack nutzt die Allgegenwärtigkeit und Flexibilität von Ethernet, um eine Vielzahl von Workloads zu bewältigen und gleichzeitig skalierbar und kostengünstig zu sein.

Die Gründungsmitglieder des Ultra-Ethernet-Consortiums (UEC) blicken auf eine umfangreiche und tiefe Erfahrung im Umgang mit Hochleistungslösungen zurück. Jedes Mitglied leistet einen wichtigen Beitrag zum breiteren Ökosystem des High Performance Computing. Die Gründungsmitglieder sind AMD, Arista, Broadcom, Cisco, Eviden (ein Geschäftsbereich von Atos), HPE, Intel, Meta und Microsoft. Gemeinsam verfügen diese Unternehmen über jahrzehntelange Erfahrung in den Bereichen Netzwerke, KI, Cloud und High-Performance-Computing.

„Es geht hier nicht um die Neugestaltung von Ethernet”, sagt Dr. J Metz, Chair of the Ultra Ethernet Consortium. „Es geht darum, Ethernet zu optimieren, um die Effizienz für Arbeitslasten mit spezifischen Leistungsanforderungen zu verbessern. Wir untersuchen jede Schicht, von der physischen bis hin zur Softwareschicht, um den besten Weg zur Verbesserung der Effizienz und Leistung zu finden.”

Das Konsortium hat es sich zur Aufgabe gemacht, Änderungen am Kommunikations-Stack auf ein Minimum zu reduzieren und gleichzeitig die Interoperabilität von Ethernet zu erhalten und zu fördern.

Die technischen Ziele des Konsortiums sind die Entwicklung von Spezifikationen, APIs und Quellcode, welche die folgenden Bereiche definieren:

  • Protokolle, Charakteristika für das elektrische und optische Signaling, Anwendungsprogrammschnittstellen (APIs) und/oder Datenstrukturen für die Ethernet-Kommunikation.
  • Protokolle auf Verbindungsebene (Link-Level) und End-to-End-Netzwerktransportprotokolle zur Erweiterung oder zum Ersatz bestehender Verbindungs- und Transportprotokolle.
  • Überlastungs-, Telemetrie- und Signaling-Mechanismen auf Verbindungsebene und End-to-End. All diese Verfahren eignen sich für künstliche Intelligenz, maschinelles Lernen und HPC-Umgebungen.
  • Software-, Storage-, Management- und Security-Konzepte zur Erleichterung einer Vielzahl von Workloads and Betriebsumgebungen.

Das UEC verfolgt einen systematischen Ansatz mit modularen, kompatiblen, interoperablen Schichten mit enger Integration, um eine ganzheitliche Verbesserung für anspruchsvolle Workloads zu ermöglichen. Die Gründungsunternehmen unterstützen das Konsortium mit äußerst wertvollen Beiträgen in vier Arbeitsgruppen: Physical-Layer, Link-Layer, Transport-Layer und Software-Layer.

Das UEC ist ein Projekt der Joint Development Foundation, das von der Linux -Foundation getragen wird. Ab dem 4. Quartal 2023 wird das UEC Bewerbungen für neue Mitglieder entgegennehmen. Weitere Informationen finden sich dazu  unter ultraethernet.org.

Einschätzungen zur UEC von Analysten:

„Viele HPC- und KI-Nutzer haben Schwierigkeiten, die volle Leistung ihrer Systeme auszuschöpfen, weil die Interconnect-Ressourcen Schwächen aufweisen. Außerdem ist es für die Nutzer schwierig, mehrere neue oder unterschiedliche Lösungen zu integrieren und zu erlernen. Es ist spannend zu sehen, wie diese beeindruckende Gruppe führender Unternehmen zusammenarbeitet, um eine neue gemeinsame, leistungsstärkere Interconnect-Lösung zu entwickeln. Käufer in den Bereichen HPC und KI haben sehr anspruchsvolle Workloads, bei denen der Ansatz des Ultra-Ethernet-Consortium (UEC) erheblich zur Verbesserung der Interoperabilität, Leistung und Ressourcen beitragen könnte. Wir freuen uns darauf, dass in naher Zukunft eine Reihe neuer Produkte auf den Markt kommen wird”, sagt Dr. Earl Joseph, CEO von Hyperion Research

„Die geschäftlichen Anwendungsfälle von KI/ML und HPC nehmen weiter zu, und immer mehr Unternehmen wollen skalierbare Rechenleistung zu ihrem Wettbewerbsvorteil nutzen, sei es in ihren eigenen Rechenzentren oder in der Cloud. Derzeit gibt es keine standardmäßigen, herstellerneutralen Netzwerklösungen für Rechenzentren, die sich auf die skalierbare Leistung für parallele Anwendungen konzentrieren. Da die meisten Rechenzentren Ethernet-basiert sind, werden erweiterbare, von UEC angetriebene Lösungen die Skalierbarkeit einfacher und zugänglicher machen. Die an UEC beteiligten Unternehmen sind in der Lage, konsistente Ethernet-Lösungen zu entwickeln, die von Einzelverbindungen bis hin zu den größten Supercomputern und Hyperscale-Rechenzentren skalierbar sind”, sagt Addison Snell, CEO von  Intersect360 Research

„Es gibt eine anhaltende Diskussion – ich würde fast sagen, einen Kampf – über die beste Netzwerklösung für Infrastruktur, die das Training und die Inferenz von großen Sprachmodellen für generative KI unterstützt. Einige Unternehmen sind auf Ethernet-basierte Netzwerke umgestiegen, weil sie deren einfache Installation und Nutzung bevorzugen. Die UEC-Initiative wird eine willkommene Ergänzung für die KI-Gemeinschaft sein”, sagt Karl Freund, Founder and Principal Analyst bei Cambrian-AI Research.