IRF, TRILL und SPB

Netz-Infrastruktur im RZ – traditioneller Ansatz und moderne Alternativen

26.10.2015
Von 
 Chief Technologist bei HP Networking

Das Spanning-Tree-Protokoll und seine Nachteile

Um Ausfallsicherheit zu gewährleisten, sind im Netzwerk in der Regel alle Verbindungen redundant ausgelegt. Das Spanning Tree Protocol (STP) - oder seine moderneren Varianten Rapid Spanning Tree Protocol (RSTP) und Multiple Spanning Tree Protocol (MSTP) sorgen klassischerweise dafür, dass immer nur ein Pfad zwischen zwei Switches aktiv ist, damit es nicht zu Endlosschleifen oder Broadcast-Stürmen kommt. Fällt der aktive Pfad aus, wählt das Protokoll automatisch eine Alternativverbindung und aktiviert diese. STP ist weit verbreitet und erfüllt die Aufgabe in der Regel sehr gut, ein Netzwerk ausfallsicher zu machen. In modernen, agilen Hochgeschwindigkeitsnetzen hat es jedoch einige gravierende Nachteile:

  • Lange Umschaltzeiten: Fällt ein Pfad oder Switch aus, kann es Sekunden dauern, bis STP einen alternativen Weg findet und aktiviert. Dies ist für viele Anwendungsfälle inakzeptabel. So hat das Marktforschungsunternehmen Aberdeen Group berechnet, dass für eine E-Commerce-Webseite, die 100.000 Euro am Tag umsetzt, bei einer täglichen Verzögerung von nur einer Sekunde jährliche Ertragseinbußen von 2,5 Millionen Euro zu erwarten sind. In einer Umfrage von Equation Research unter 400 Online-Einkäufern gaben 22 Prozent an, bei Komplikationen in einem Webshop sofort zur Konkurrenz zu wechseln. Noch gravierender können die Folgen für Finanztransaktionen sein, in denen oft Millisekunden über Milliardenbeträge entscheiden.

  • Komplexe Verwaltung: Auch wenn mit MSTP und RSTP die Umschaltzeiten wesentlich kürzer sind, haben alle drei Protokollvarianten gemein, dass sie besonders in großen Netzwerken sehr aufwendig zu managen sind. Jeder Switch muss einzeln verwaltet werden, auf jedem muss der Administrator die STP-Instanz für jeden Port oder sogar für jeden virtuellen Port aufsetzen und dafür sorgen, dass die Parameter benachbarter Switches zueinander passen. Die Fehlersuche in einem Spanning Tree ist ausgesprochen langwierig und schwierig, da die eigentliche Fehlerquelle häufig nur schwer zu finden ist.

  • Ineffizienz: Da STP immer nur einen Pfad zwischen zwei Punkten aktiviert, können bei einer redundanten Verkabelung maximal 50 Prozent der vorhandenen Bandbreite genutzt werden.

  • Zu viele Kompromisse: Die Wahl zwischen STP, MSTP und RSTP ist schwierig und stellt immer nur einen Kompromiss dar. So ist MSTP zwar wesentlich effizienter als die anderen beiden Varianten, dafür aber auch deutlich schwieriger zu managen. Die leichtere Verwaltung erkauft man sich bei STP und RSTP wiederum durch geringere Effizienz.

Vereinfachung der Netzwerktopologie

In einem ersten Schritt gilt es, die Topologie im Netzwerk auf zwei Stufen zu reduzieren, um zu einer "Spine-Leaf"-Architektur zu gelangen. Dazu integriert man Edge- und Aggregations-Layer und setzt im Core mehrere kleine Systeme statt wenige große ein, die man zu einem virtuellen Device zusammenfasst. Dies lässt sich beispielsweise mit dem "Intelligent Resilient Framework" (IRF) erreichen. Flache Netze lassen sich auch mit anderen Fabric-Technologien erreichen, etwa durch TRILL (Transparent Interconnection of Lots of Links) oder Shortest Path Bridging (SPB). TRILL-Switches, auch Routing Bridges (RBridges) genannt, kommunizieren über das Link-State-Protokoll IS-IS (Intermediate System to Intermediate System). IS-IS erlaubt ein reines Layer-2-Netzwerk ohne Konfiguration oder IP-Adressen.

Jeder Switch hat genügend Informationen über alle anderen Switches und die Verbindungen zwischen ihnen, um entweder den besten Pfad oder zumindest einen Verteilungsalgorithmus für den Datenverkehr zu erzeugen. Das geschieht etwa wenn das Ziel unbekannt ist oder es sich um einen Multi- beziehungsweise Broadcast handelt. Um die Effekte von Schleifenbildung abzumildern, senden TRILL-Switches im Header einen Hop Count und führen einen Reverse-Path-Check durch. SPB, auch als IEEE 802.1aq bekannt, blockiert im Unterschied zu STP keine Pfade.

Wie bei TRILL sorgt das Link-State-Protokoll IS-IS für die Kommunikation zwischen den Bridges. Es dient dazu, die Netzwerktopologie zwischen den kommunizierenden Geräten zu definieren und auszutauschen und die kürzesten Wege (Shortest Path Trees, SPT) zu berechnen. Beide Technologien lassen sich auch sehr effektiv in Kombination mit IRF einsetzen. Die Komplexität gegenüber herkömmlichen hierarchischen Topologien sinkt dadurch um den Faktor 20.

Die höchste Form der Vereinfachung ist die Aggregation des Netzwerkverkehrs im Server und die direkte Anbindung an den Core. Dies ist aber nur mit Blade Enclosures und Virtual-Connect-Modulen möglich. Diese Einschubmodule liefern N mal 10 GbE-Ports, die als virtuelle Ports von virtuellen NICs präsentiert werden. Anders als bei einem Switch stellen die Ports im Virtual-Connect-Modul keinen zusätzlichen Hop dar. Im Blade Enclosure gibt es dann keine Switch-Instanz mehr, sondern nur noch eine Abstraktion der Netzwerkadapter. Eine entsprechende Port-Dichte vorausgesetzt, kann der Netzwerkverkehr direkt auf den Core geleitet werden, sodass zwischen zwei Blade-Servern in unterschiedlichen Enclosures nur noch ein Hop nötig ist.