CW-Subnets     |     Executive Briefings     |     Blogs & Forum     |     CW-TV     |     Newsletter     |     RSS
Schließen
Dock ein-/ausblenden
Data Center & Server

Wayback Machine

Das Internet Archive wandert in einen Sun-Container

Drucken |  Empfehlen |  PDF |  Merken
von Thomas Cloer
Seit 1997 archiviert Brewster Kahle das Internet, genauer das WWW. Die gigantische Datenbank ist jetzt in ein "Modular Datacenter" von Sun Microsystems umgezogen.

Brewster Kahle hat frühzeitig die Notwendigkeit erkannt, das sich ständig dynamisch verändernde World Wide Web in Form regelmäßiger Snapshots von Web-Seiten zu archivieren und damit für die Nachwelt zu erhalten. Aber auch heute schon ist seine web-historische Suchmaschine "Wayback Machine" ein Vergnügen und unverzichtbares Hilfsmittel.

Die vielleicht größte Datenbank der Welt passt in einen Container voller 'Thumper'...
Die vielleicht größte Datenbank der Welt passt in einen Container voller 'Thumper'...
Die vielleicht größte Datenbank der Welt passt in einen Container voller 'Thumper'...

Bislang waren die gesammelten Daten des Internet Archive auf 800 günstigen Linux-Rechnern mit jeweils vier Festplatten im Presidio-Stadtteil von San Francisco untergebracht. Nun ist das System in einen einzigen Container auf dem Campus von Sun Microsystems in Santa Clara umgezogen.

In dem Sun MD stehen 63 geclusterte Server vom Typ "Sun Fire x4500" mit Dual- und Quad-Core-x86 Prozessoren unter Solaris 10 mit ZFS. An jeder Maschine hängt außerdem ein Array von 48 1-Terabyte-Festplatten ("Thumper").

...und so sieht der von innen aus. (Fotos: Sun)
...und so sieht der von innen aus. (Fotos: Sun)
...und so sieht der von innen aus. (Fotos: Sun)

Das Internet Archive sammelt jeden Monat rund 100 TB neue Daten. Bisher wurde ein typischer Web-Crawl von zehn bis 20 der alten Linux-Maschinen erledigt. Bei dem neuen Sun-System verhalten sich alle 63 Maschinen wie eine einzige.

Neben Web-Seiten archiviert das Internet Archive inzwischen übrigens auch Software, Filme und Audio. Die Organisation arbeitet außerdem mit rund 100 traditionellen Bibliotheken zusammen, deren Kuratoren bei der Konzeption von Deep Links behilflich sind. Gespiegelt wird die gigantische Datenbank zu Disaster-Recovery-Zwecken außerdem zur neuen Bibliotheca Alexandrina in Alexandria, Ägypten.

(0 Beiträge), 
Kommentieren

Beitrag schreiben

Noch kein Forums-Mitglied?
Dann gleich hier anmelden.

DATA CENTER: CW-REDAKTEURE EMPFEHLEN
6 Tools für das Server-Management (Foto: Fotolia / Spectral Design) 6 Tools für das Server-Management Neben den Suiten etablierter Hersteller wie IBM, CA oder HP gibt es viele gute Open-Source- oder Freeware-Tools zur Server-Verwaltung.
weiter
Die 10 größten IT-Herausforderungen (Foto: Fotolia.com/ArtmannWitte) Die 10 größten IT-Herausforderungen Gartner-Analyst Rakesh Kumar erläutert die zehn wichtigsten Trends in der IT-Infrastruktur.
weiter
Modular, effizient und Cloud-fähig (Foto: (c) zentilia_Fotolia) Modular, effizient und Cloud-fähig Der Trend zu modular aufgebauten und energieeffizienten Rechenzentren wird sich 2012 fortsetzen. Auch die Private Cloud wird ein Thema sein.
weiter
Wie Pioniere das RZ kühlen (Foto: Green Revolution Cooling) Wie Pioniere das RZ kühlen Das Data Center der Zukunft darf keine Energie mehr für Kühlung und Klimatisierung verschwenden. Pioniere testen neue Konzepte und Techniken.
weiter
Die Top-Trends im Data Center (Foto: Fotolia / Andres Rodriguez) Die Top-Trends im Data Center Servicemodelle wie Cloud Computing und der Druck, IT-Ressourcen effizienter zu nutzen, verändern das RZ grundlegend.
weiter
MEHR ZUM THEMA DATA CENTER & SERVER
  • Whitepaper
  • Top geklickt
Jobangebote
FEATURED LINKS

KOSTENLOSE NEWSLETTER VON COMPUTERWOCHE
Nachrichten morgens
Whitepaper
Nachrichten mittags
CW-Mittelstand
Highlights der Woche
Hardware
SAP-Newsletter
Software
Job + Karriere
Open-Source
Stellenmarkt
Produkte + Techn.
Freiberufler
Security
Server + Storage
Netzwerke
Mobile & Apps