Voice over IP/SIP ist der VoIP-Standard der Zukunft

Ein neuer Stern am Normenhimmel

26.04.2002
Das Session Initiation Protocol ist auf dem Weg, sich zum bevorzugten Standard für die multimediale Kommunikation zu entwickeln. Im Folgenden ein Überblick, worin sich SIP von dem momentan gängigen H.323-Protokoll unterscheidet. Von Stefan Neumann*

Das Session Initiation Protocol (SIP) ist noch relativ neu: Erst 1999 hat es die Internet Engineering Task Force (IETF) genormt, die einzelnen Spezifikationen wurden im Internet als Request for Comments (RFC) veröffentlicht. Ausgeklügelt wurde und wird SIP in offenen Foren, an denen jeder unter Einhaltung gewisser Vorschriften teilnehmen kann. SIP nutzt das Real Time Transport Protocol (RTP) und definiert eine interaktive Kommunikation zwischen zwei oder mehr Teilnehmern über ein IP-Netz - vom Aufbau über das Routen bis zum Beenden der Verbindung.

Realisiert werden dabei nicht nur einfache Telefongespräche, sondern auch Video- und Telefonkonferenzen, E-Mail-Verkehr, sprachgesteuerte E-Commerce-Services oder Instant Messaging. Von vornherein konzipiert als ein Internet-Protokoll, ähnelt es in diesem Bereich vorhandenen Protokollen wie Hypertext Transfer Protocol (HTTP) und Simple Mail Transfer Protocol (SMTP) und verwendet die Struktur der URL-Adresse (Uniform Ressource Locator). Im Unterschied zu H.323 identifiziert SIP also den Anwender und nicht das Gerät. Auf diese Weise erreicht man eine so genannte Präsenzerkennungs- oder Anwesenheitsfunktion. Das bedeutet: Der Adressat kann an jedem Ort zu jeder Zeit auf dem Gerät seiner Wahl erreicht werden.

Im Unterschied zu den komplexen Signalisierungscodes von H.323 stützt sich SIP auf eine wesentlich geringere Auswahl von Nachrichten- und Antwortsequenzen. Daher sind weit weniger Ressourcen notwendig - ein Aspekt, der das neue Protokoll auch attraktiv für kleine mobile Endgeräte macht. SIP-Anfragen können außerdem unabhängig von der Form der Übertragungsart auf verschiedensten Netzwerken, wie Ethernet, Frame Relay, ATM oder SONET laufen.

Vom Prinzip her ist SIP ein Client-Server-Protokoll, das sich aus vier Komponenten zusammensetzt. Der "User Agent Client" (UAC) ist eine Software, die eine SIP-Anfrage initiiert, während der "User Agent Server" (UAS) dafür zuständig ist, die Verbindung zu einem Adressaten aufzubauen beziehungsweise auf Anfragen des Initiators zu antworten. Ein SIP-Proxy-Server übermittelt die Anfragen.

Personifizierte AdressenÜber spezielle Redirect-Server erhält der Client Informationen darüber, zu welchem Medium eine Anfrage weitergeleitet werden kann. Der Registrar-Server schließlich erhält alle wesentlichen Registrierungsdaten eines Users und reagiert auf entsprechende Anfragen von UASs und UACs. Als Client-Server-Protokoll weist SIP Ähnlichkeiten zu HTTP auf. Anfragen und Antworten sind textbasierend, aufwändige Codegeneratoren (zum Beispiel ASN.1 unter H.225.0), wie sie bei H.323 notwendig sind, entfallen.

Einen entscheidenden Fortschritt bei SIP stellt die Identifizierung des Kommunikationsteilnehmers dar. Die URL-basierende Adressierung ermöglicht eine personifizierte Adresse, die beispielsweise aus Vor- und Nachnamen plus Domänen- oder Hostnamen, aber auch aus User- plus IP-Adresse bestehen kann. Es ist also nicht mehr nötig, die einzelnen Netzkomponenten mit einer so genannten MAC-Adresse zu identifizieren, sondern es bedarf nur noch einer User-Kennung, um eine ganz bestimmte Person zu erreichen.

Schneller VerbindungsaufbauDabei spielt es keine Rolle, über welches Medium oder Endgerät wie etwa IP-Telefon, Handy, E-Mail/Internet oder analogem Festnetzanschluss sie gerade zu erreichen ist. Alle Zugangsdaten der SIP-Teilnehmer werden zentral auf einem Server gespeichert, sodass jederzeit ermittelt werden kann, wie ein Gesprächspartner bei einem Anruf über SIP zu erreichen ist. Außerdem unterstützt SIP die Fähigkeit, mehrere Adressen gleichzeitig zu rufen, zum Beispiel in einer Zentrale, im Heimbüro sowie am Mobiltelefon.

Ein weiterer, erheblicher Vorteil von SIP ist der schnelle Verbindungsaufbau. Auch hier wird der Fortschritt durch einen Vergleich mit H.323 evident, das bei diesem Prozess die Protokolle H.225.0, Q.931 und H.245 benötigt. Dabei wird zunächst eine Verbindung zwischen den beiden Stationen aufgebaut, erst danach werden die gewünschten Dienste über die Unterprotokolle vereinbart. H.323 benötigt also eine höhere Anzahl von so genannten Round-Trips beziehungsweise Hand-Shakes zwischen den an der Kommunikation teilnehmenden Stationen, was zu entsprechenden Verzögerung führt.

Leichtere InteroperabilitätSIP hingegen arbeitet mit Anfragen, die schon alle notwendigen Daten und Informationen enthalten. Dadurch entfallen auch aufwändige Implementierungen in die Endgeräte, die bei H.323 durch die Hersteller getätigt werden müssen. Auch die Zusammenarbeit mit Verzeichnisdiensten klappt bei SIP besser als bei H.323. SIP findet die Adresse des gerufenen Clients über Domain Name Service (DNS), Lightweight Directory Access Protocol (LDAP) oder über programmierbare Verzeichnisdienste. Das macht das Protokoll auch für die Integration in unternehmensweite Datennetze interessant.

Ein weiterer Pluspunkt und wesentlicher Unterschied zur vertikalen Struktur von H.323 ist der modulare Aufbau von SIP. Verzeichniszugriffe, inhaltliche Beschreibungen von Sitzungen und Konferenzkontrolle sowie das Thema Dienstgüte werden in zusätzlichen Protokollen festgelegt. Diese offene Struktur erlaubt die komplette Interoperabilität mit zahlreichen Protokollen - wie etwa H.323, ISDN und analogen Leitungen sowie mit SIP-Anwenderagenten verschiedener Anbieter.

Leider weist SIP noch nicht die Fülle an Dienstmerkmalen auf wie ISDN. Es erreicht auch noch nicht die Zuverlässigkeit, Sicherheit und Benutzerfreundlichkeit "klassischer" Telefonsysteme. Jedoch hängt die Leistungsfähigkeit des Client-Server-basierenden SIP in starkem Maße von der Leistungsfähigkeit des Servers und weniger von der des Protokolls ab.

Aktuell bieten SIP-fähige Kommunikationslösungen folgende Applikationen: Über die erwähnte Präsenz-Erkennungs-Funktion kann bestimmt werden, wie bei An- oder Abwesenheit eines Teilnehmers zu verfahren ist. Anrufe lassen sich beispielsweise auf andere Geräte oder auf die Sprachmailbox umleiten. Da SIP eine standortunabhängige Adresse nutzt, stellt der PC lediglich einen der möglichen Endpunkte dar, an dem der Benutzer erreichbar ist. Mit der Anwesenheitsfunktion werden auch Konferenzschaltung "on demand" ermöglicht. Personen können lokalisiert, kontaktiert und sofort einer multimodalen Konferenz zugeschaltet werden.

Dies ermöglicht den Teilnehmern, mit unterschiedlichen Geräten/Medien über unterschiedlichste Netzwerke zu kommunizieren. Auch das Rerouting eines Anrufes ist mit SIP möglich. Telefonate können über das Setzen von Präferenzen über das kostengünstigste Land geführt werden.

Gute PerspektivenAuf lange Sicht wird SIP H.323 wohl als wichtigstes Protokoll für Voice over IP ablösen. Die bestehende SIP-Unterstützung innerhalb von Windows XP, der relativ unkomplizierte Aufbau des Signalisierungsprotokolls und seine Anlehnung an das Internet vergrößern die Chance, dass sich SIP wesentlich schneller verbreiten wird als das H.323-Protokoll, das ursprünglich nur dazu gedacht war, multimediale Kommunikationen über lokale Netze zu ermöglichen. Gefragt sind damit Lösungen, die sowohl eine Zusammenarbeit der beiden Protokolle als auch eine sanfte Migration herkömmlicher Telefonanlagen in die SIP-Welt erlauben - Lösungen also, bei denen SIP als Fundament für ein reines SIP-Netzwerk dienen kann, die aber auch Applikationen bieten, eine existierende Infrastruktur zu nutzen.

Unternehmensnetze können so in der gewünschten Geschwindigkeit wachsen und die Anwendungen existierender Systeme beibehalten, gleichzeitig aber auch die Vorteile SIP-fähiger Applikationen nutzen, ohne die gewohnte Anwendungsumgebung ernsthaft zu verändern. (ave)

*Stefan Neumann ist Convergence Solutions Architect bei Avaya Deutschland GmbH in Frankfurt/Main.

Abb: SIP-Architektur

Hauptbestandteile innerhalb der SIP-Architektur sind der User-Agent, ein Redirect- und ein Proxy-Server sowie der Registrar. Quelle: Cisco Systems