CloudSearch

Amazon Web Services macht Google Konkurrenz

12.04.2012
Von 
Thomas Cloer war Redakteur der Computerwoche.
Mit "Amazon CloudSearch" startet Amazon Web Services einen vollständig verwalteten Such-Service (Indexierung und Retrieval) in der Cloud.

Mit dem neuen Angebot, das zunächst wie üblich als Beta und nur in der Availability Zone US East verfügbar ist, macht Amazon unter anderem Google und dessen Custom Searches und insbesondere lokal betriebenen Google Search Appliances (GSAs) Konkurrenz.

Die Einrichtung der CloudSearch ist einem AWS-Blogpost zufolge relativ einfach - man legt eine Search Domain an und konfiguriert sie und lädt anschließend - via JSON oder XML - die zu indexierende Dokumente hoch (auf Wunsch auch SSL-verschlüsselt), anschließend kann man bereits mit Suchen beginnen.

Amazon CloudSearch hält den Suchindex im RAM und erlaubt damit kurze Antwortzeiten. Wie bei AWS üblich, läuft die Suche auf sogenannten Instanzen mit festgelegter CPU-Leistung und virtueller Arbeitsspeicherbestückung. Je mehr Daten zu durchsuchen sind, desto mehr oder leistungsfähigere Instanzen schaltet CloudSearch automatisch zu (das Limit liegt aktuell bei 50).

Von der Anzahl der genutzten Instanzen hängt auch der Preis der CloudSearch ab. Es gibt aktuell drei Größen (Small, Large und Extra Large), die in der Region US East zwischen 12 und 68 US-Cent pro Stunde kosten. Für jeden Upload-Batch fallen weitere "geringe" Kosten an, außerdem werden im Fall eine Neuindexierung 98 Cent pro Gigabyte Datenvolumen in der Search Domain fällig. Der Inbound-Datentransfer ist ansonsten kostenlos, Transfer Out wird zu den üblichen AWS-Kosten berechnet und die Datenübertragung zwischen EC2-Instanzen innerhalb eine Region ist kostenlos.

Die CloudSearch bietet auf Wunsch etliche "fortgeschrittene" Features wie Faceted Search, Freitextsuche, Boolean Search, angepasstes Relevanz-Ranking, Feld-basierende Sortierung und Suche sowie Textverarbeitungs-Optionen wie Stopwords, Synonyme und Stemming (Berücksichtigung von Wortableitungen).

Einige Pilotkunden haben Amazon CloudSearch bereits im Einsatz. So hat zum Beispiel Search Technologies damit die Wikipedia indexiert (Demo), ex.fm betreibt damit seine Social Music Discovery und SmugMug realisiert damit die Suche über mehr als eine Milliarde Fotos auf seiner Webseite.