Cloud-Migration bei Evernote

Drei Petabyte in die Google-Wolke

22.02.2017 von Florian Maier
70 Tage, fünf Milliarden Notes, 12 Milliarden Files - klingt nach jeder Menge Arbeit für den Softwareanbieter Evernote? War es auch.

Im vergangenen Jahr hat sich der Software-Hersteller Evernote dazu entschlossen, seine selbst betriebenen Datacenter abzustoßen. Stattdessen wollte man künftig für den Betrieb des populären Notizen-Services auf die Cloud setzen - die Public Cloud genauer gesagt. Inzwischen ist das Mega-Projekt Cloud-Migration so gut wie abgeschlossen.

Ein Blick in ein Google Data Center in den USA.
Foto: Google / Connie Zhou

Warum in die Cloud?

Evernote hat sich dabei für Google als Cloud-Provider entschieden. Angesichts des nicht alltäglichen Projektumfangs schickte der Internet-Gigant kurzerhand ein ganzes Team von Spezialisten (mit Donuts im Gepäck), um den Migrationsprozess zu begleiten und um sicherzustellen, dass das Vorhaben ein Erfolg wird. Der Umstieg erforderte zwar jede Menge Arbeitsaufwand und Anpassungen - laut Evernote stand Google dabei aber stets mit Rat und Tat zur Seite.

Die Entscheidung der Evernote-Verantwortlichen passt in den allgemeinen Trend: Viele Unternehmen hieven ihre Workloads inzwischen vom hauseigenen Datacenter in diePublic Cloud. Dort will Evernote die Vorteile der Cloud nutzen - insbesondere in Sachen Machine Learning, einem Gebiet auf dem das Unternehmen zuletzt selbst geforscht und entwickelt hat. Natürlich wollte man durch die Migration in die Google-Cloud auch die Flexibilität auf ein neues Level hieven - maßgeblich dadurch, dass man kein eigenes Datacenter mehr am Laufen halten muss.

Einige der Gründe für den Wechsel von Evernote in die Public Cloud dürften durchaus bekannt vorkommen. Die eigenen Mitarbeiter mussten in der alten Welt zum Beispiel viel Zeit für die Pflege der Datacenter aufwenden, etwa für das Wechseln von Festplatten, Verkabelungen oder die Prüfung neuer Infrastruktur-Optionen. Diese Maßnahmen hielten zwar das Datacenter - und damit auch den Betrieb beiEvernote - am Laufen, boten aber für die Kunden keinerlei Mehrwert, wie Ben McCormack, Vice President of Operations preisgibt: "Wir waren einfach nur realistisch: Mit einem Operations-Team in dieser Größe konnten wir mit den Cloud-Providern nicht mithalten - egal ob es dabei um Beschaffung oder das Management der Systeme ging. Wir wären stets auf Aufholjagd gewesen - in vielerlei Hinsicht keine besonders schöne Situation."

Public-Cloud-Plattformen im Vergleich
Amazon Web Services
Forrester attestiert AWS ein marktführendes Portfolio an Cloud-Services. Hybrid-Cloud-Szenarien aber deckten die Konkurrenten zum Teil besser ab.
Microsoft Azure
Im Azure-Portfolio loben die Forrester-Experten besonders die Services für Softwareentwickler.
IBM Bluemix
IBM kann die Vorteile seines Cloud-Angebots vor allem in Unternehmen mit etablierten IT-Strukturen ausspielen.
Google Cloud
Googles Cloud-Portfolio punktet vor allem mit Machine-Learning- und Data-Services.
Oracle Cloud
Die Oracle-Cloud ist in erster Linie für Bestandskunden des IT-Konzerns interessant, urteilt Forrester.
Interoute Virtual Data Center
Der britische Anbieter Interoute profitiert im Forrester-Vergleich von seiner starken lokalen Präsenz in Europa.
Salesforce App Cloud
Vor allem die Entwickler-Services der App Cloud von Salesforce finden das Lob der Forrester-Analysten.
CenturyLink
Die Stärken des Cloud-Portfolios von CenturyLink liegen in den ausgefeilten Konfigurations- und Automation-Features.
CloudSigma
Cloud-Services aus der Schweiz offeriert CloudSigma. Kunden profitieren von besonders flexiblen und feingranularen Konifgurationsoptionen, kommentiert Forrester.

Eigenes Datacenter - Zukunft ungewiss

Als sich die Evernote-Mitarbeiter Gedanken um einen Refresh für das Datacenter machten, ist ihnen besonders ein Punkt aufgefallen: Sie wussten nicht, wofür das eigeneRechenzentrum in fünf Jahren stehen sollte. Also machte sich der Software-Hersteller auf die Suche nach einem geeigneten Public-Cloud-Provider. Dabei schaute man sich auch Angebote von Amazon Web Services und Microsoft an. Bei der Entscheidung für Google hat laut McCormack letztlich den Ausschlag gegeben, dass der aktuelle Fokus von Evernote sich mit den Expertise-Feldern von Google überschneidet. Schließlich hält Evernote riesige Mengen unstrukturierter Daten vor und möchte sein Angebot an Softwareservices künftig vor allem durch maschinelles Lernen aufrüsten.

"Google ist auf diesen Gebieten derzeit der unangefochtene Marktführer. Im Endeffekt haben wir eine strategische Entscheidung getroffen und eine strategische Wette darauf abgeschlossen, dass die Focus Points von Evernote auch diejenigen sind, in denen die Zukunft liegt und in denen zeitgleich auch Google wachsen will".

Machine Learning FAQ
Facebook-Gesichter
Computer können lernen, menschliche Gesichter zu unterscheiden. Facebook nutzt das für die automatische Gesichtserkennung.
Machine Learning
Anders als das Bild suggeriert ist Machine Learning ein Teilgebiet von Artificial Intelligence – allerdings ein sehr wichtiges.
AlphaGo
Maschine schlägt Mensch: 2016 besiegte Googles Machine Learning System AlphaGo den Weltmeister im Spiel Go.
Grafikprozessoren GPU Nvidia
Die führenden Companies im Machine Learning nutzen für die parallele Verarbeitung der Daten Grafikprozessoren (GPUs) - etwa von Nvidia.
Deep Learning
Deep Learning Verfahren lernen erst Low-Level Elemente wie Helligkeitswerte, dann Elemente auf mittlerer Ebene und schließlich High-Level Elemente wie ganze Gesichter.
IBM Watson
IBM Watson integriert mehrere Artificial Intelligence Methoden: Neben maschinellem Lernen sind das Algorithmen der natürlichen Sprachverarbeitung und des Information Retrieval, der Wissensrepräsentation und der automatischen Inferenz.

Für Anirban Kundu, CTO von Evernote, ist Machine Learning eines der Highlights der Google-Plattform. Darüber hinaus seien aber auch einige der ‚high-level services‘, die Google anbietet, eine Bereicherung für aktuelle und künftige Evernote-Features. Ganz konkret etwa hilft dem Unternehmen die Cloud Machine Learning API von Google - schließlich plant man selbst mit neuen Möglichkeiten auf Basis maschinellen Lernens.

Obwohl in aller Regel der Kostenfaktor als Vorteil der Public Cloud angeführt wird, spielte dieser laut McCormack bei der Entscheidung zur Migration in die Google Cloud keine Rolle. Die Entscheidung für Google und gegen die Wettbewerber wie AWS oder Microsoft, wurde vom Technologie-Team von Evernote maßgeblich beeinflusst. Erst nachdem die Entscheidung gefallen war, wurde Evernote-CEO Chris O’Neill hinzugezogen. Dieser war vor seiner Zeit bei Evernote circa zehn Jahre lang bei Google angestellt und half bei der Verhandlungsführung.

So lief der Migrations-Prozess ab

Nachdem der Vertrag mit Google im Oktober 2016 in trockenen Tüchern war, tickte die Uhr: Laut McCormack sollte die Migration noch vor dem Neujahrstag 2017 abgeschlossen sein. In Zahlen ausgedrückt: fünf Milliarden Notes und fünf Milliarden Dateianhänge mussten migriert werden. Wegen der Metadaten - etwa Thumbnails bei den Dateianhängen - stieg die Zahl laut McCormack schlussendlich auf 12 Milliarden Anhänge. Dazu kam für das Team aber noch die Herausforderung, dabei keinerlei Daten verlieren zu dürfen. Ach ja - der Evernote-Service musste natürlich über die gesamte Zeit weiterlaufen.

Laut McCormack überlegte man sich zunächst, welche Teile der Applikation in Gänze in die Google-Cloud übertragen werden können, und welche angepasst werden müssen. Ein Teil der Transformation bestand dabei auch darin, die Art und Weise des Netzwerkbetriebs bei Evernote neu aufzusetzen. Zuvor kam UDP Multicast zum Einsatz, um Teile des Bilderkennungs-Workflows zu handeln. Das funktionierte im hauseigenen Datacenter, wo man die Kontrolle über die Netzwerk-Router innehatte - allerdings war diese Technologie in der Google Cloud nicht verfügbar. Deswegen, so CTO Kundu, sei es nötig gewesen, die Applikation auf ein queue-basiertes Verfahren umzustellen.

Evernote konnte bei diesem Projekt jedoch nicht einfach all seine User-Daten migrieren und dann einen Knopf drücken, um den Traffic von den On-premise Servern auf die Google Cloud umzuleiten. Stattdessen mussten die Backend-Applikationen von Evernote neu konstruiert werden, um eine schrittweise Migration zu ermöglichen. Die gute Nachricht dabei: Die Umstellung erforderte keine Änderungen am Client selbst. Das war nach Ansicht von Technikchef Kundu der Schlüssel für den Erfolg der Migration, da nicht alle Evernote-Kunden zeitnah ihre Software upgraden würden.

McCormack war hingegen positiv überrascht von der Zusammenarbeit mit den Google-Mitarbeitern. Insbesondere vom kollaborativen Spirit der Google-Mannschaft zeigte er sich beeindruckt: "Das Team hat - sowohl remote, als auch vor Ort - rund um die Uhr bei Fragen und Problemen zur Verfügung gestanden. Google wollte, dass wir erfolgreich sind."

Ab der Vertragsunterzeichnung dauerte es letztendlich ungefähr 70 Tage, um die komplette Migration der Daten in die Cloud abzuschließen. Dabei sei der wesentliche Teil der Migration im Dezember in nur zehn Tagen über die Bühne gegangen, wie McCormack verriet.

Die Lehren des Cloud-Projekts

Laut Kundu und McCormack sei die wesentliche Erkenntnis aus diesem Projekt, dass selbst der durchdachteste Plan ein Team braucht, das willens und in der Lage ist, sich ständig neu auszurichten und auf veränderte Umgebungen und Rahmenbedingungen einzustellen. So sei auch die Cloud-Migration bei Evernote nach dem Muster abgelaufen, einen Schritt zu machen, das Geschehene zu analysieren und anschließend wenn nötig die Herangehensweise an die jeweilige Situation anzupassen - trotz exzessivem Testing und ausgiebigen Simulationen.

Darüber hinaus, so das Evernote-Duo, sei die Migration nicht damit abgeschlossen, dass zum Schluss alle Bytes in der Cloud liegen: Im laufenden Betrieb und der täglichen Arbeit mit dem Google-Ökosystem zeigten sich neue, spezifische Beschränkungen und Probleme. So nutzte Google beispielsweise Technologien zur Live-Migration, um virtuelle Maschinen von einem Host zum anderen zu schieben und so Patches zu installieren oder Hardware-Probleme zu umgehen. Das geschehe zwar unglaublich schnell, konstatierten die Projektverantwortlichen, allerdings habe der Evernote-Service unter Volllast mit dieser Vorgehensweise einige Probleme gehabt, die Optimierungen erforderten.

Tipps auf dem Weg in die Cloud
Erarbeitung einer umfassenden Cloud-Strategie
Der Weg in die Cloud ist nicht ausschließlich ein Technologiethema. Die Unternehmensberatung Accenture empfiehlt daher allen Unternehmen, die sich auf den Weg in die Wolke begeben, zuallererst eine übergreifende Cloud-Strategie zu entwickeln. Neben der sorgfältigen Auswahl des Cloud-Providers und der benötigten Cloud-Services sollten auch Fragen der institutionellen Rahmenbedingungen (Governance), der zugrundeliegenden Prozesse, des Cloud-Operating-Modells unter anderem in eine Gesamtstrategie einbezogen werden. <br /><br />Arne Bleyer, Accenture-Spezialist für Cloud-Infrastruktur: "Mit dem Weg in die ‚Wolke‘ werden sich auch die konkreten Arbeitsweisen ändern. Deshalb sind Unternehmen gut beraten, im Vorfeld ihre lang- und mittelfristige Servicestrategie und das Serviceportfolio zu klären."
Ist-Erfassung bei Mittelstand und Enterprise-Unternehmen
Es erweist sich als ratsam, der Migration in die Cloud eine umfassende Assessment- und Planungsphase vorzuzuschalten. Über ein Applikations-Cluster gilt es, eine geeignete Transformationsstrategie festzulegen. Bleyer: „Das kann in der Praxis auch zu einer Konsolidierung der bestehenden IT-Landschaft bis hin zu deren Ablösung führen.“ Hintergrund: Sowohl Mittelstand als auch große Konzerne verfügen bei ihren Erstüberlegungen, in die Cloud zu gehen, oftmals nur über unzureichende Informationen über ihre aktuelle IT-Anwendungslandschaft.
Externe Partner für die Transformation auswählen
Nur die wenigsten internen IT-Abteilungen sind für alle notwendigen Schritte auf dem Weg in die Cloud gerüstet. Somit stelle sich letztendlich die Frage, welche externen Partner für welchen Bereich der Transformation ins Haus geholt werden müssen...

Auch ein vorangegangener Live-Test der Migration habe hier nicht ausgereicht, wie Evernote-CTO Kundu sagt: "Wenn eine Applikation in Produktion geht, können sich User-Verhalten und Arbeitslast von den Test-Konditionen deutlich unterscheiden. Deswegen sollte man sich auf Problemfälle einstellen und sich immer wieder klar machen, dass die Arbeit mit dem formellen Abschluss der Migration nicht beendet ist. Ein Problem kann auch erst nach einem Monat auftreten oder entdeckt werden."

Nach Meinung von McCormack lautet eine weitere Lektion, dass Cloud-Umgebungen in der Lage sind, jede Art von Workload zu bewältigen: "Die Cloud hat inzwischen genug Reife und bietet eine ausreichende Zahl an Features, um zu gewährleisten, dass jeder diese Umgebungen nutzen kann."

Was allerdings nicht bedeutet, dass eine Cloud-Migration keinen Aufwand verursachen würde: Auch wenn die Google Cloud für Evernote einige Vorteile bringt - das Unternehmen musste die Kontrolle über ihr Ökosystem abgeben und sich auch von einigen Telemetrie-Daten, die das ehemalige Datacenter lieferte, verabschieden.

Unmittelbare Cloud-Vorteile

Wesentliche Vorteile, die sich für Evernote aus der Migration in die Wolke ergeben, sind reduzierte Latenzzeiten und verbesserte Konnektivität für die internationalen Kunden. An dieser Stelle zahlen sich Googles weltweite Investitionen in Infrastruktur aus.

"Wir konnten die Ladezeiten unserer Seiten in bestimmten Bereichen signifikant reduzieren", erklärt McCormack. "Ich würde nicht sagen in allen Bereichen, aber wir können schon jetzt erste Vorteile sehen, die uns die Verfügbarkeit und Reichweite von Google in Sachen Traffic bescheren."

Noch müssen einige letzte User-Daten migriert werden, aber wenn es soweit ist, kann Evernote seinen Kunden auch mitteilen, dass ihre Daten ab sofort verschlüsselt gespeichert werden - der Google Cloud sei Dank.

Aus der Sicht von Evernote besitzen die Software-Ingenieure des Unternehmens in der Cloud nun auch mehr Freiheiten bei der Erledigung ihrer Arbeit. Denn statt sich mit der Schaffung physischer Infrastrukturen befassen zu müssen, um neue Features zu etablieren, stünde den Technikern nun ein komplettes Optionsmenü für diese Zwecke zur Verfügung, mit dem auch nach Belieben experimentiert werden könne.

Darüber hinaus stattet die Google-Cloud Evernote auch mit zusätzlicher Flexibilität aus, insbesondere wenn es um Backups und Ausfallzeiten geht.

Was kommt als nächstes?

In Zukunft möchte man bei Evernote von den existierenden und künftigen Google-Services weiter profitieren. Zum Beispiel testet man derzeit Googles "Cloud Functions", die es Entwicklern erlauben, Code-Snippets zu schreiben. Auch an einem Alpha-Test innerhalb der Google Cloud beteiligt sich das Unternehmen - zu Details wollte sich CTO Kundu allerdings genauso wenig äußern, wie zu den kommenden Features von Evernote. Lediglich die Aussage, dass "etliche" neue Funktionalitäten durch die Cloud-Migration zur Verfügung stehen werden, war dem Manager zu entlocken.

Dieser Artikel basiert auf einem Beitrag unserer US-Schwesterpublikation pcworld.com.

Cloud-Prognosen für 2017 von Forrester
Prognose 1: Regionale Player ergänzen das Angebot der Cloud-Giganten
Auch AWS, Microsoft oder Google können nicht jede Kundenanforderung abdecken. Für kleinere regionale Cloud-Provider ergeben sich dadurch Chancen. Cloud-Nutzer sollten sie bei der Auswahl berücksichtigen.
Prognose 2: CIOs bringen Cloud-Kosten unter Kontrolle
2017 werden CIOs das Kosten-Management ihrer Cloud-Services besser in den Griff bekommen. Dabei helfen einschlägige Tools, etwa von AWS, Cloudability oder Cloudyn.
Prognose 3: Apps werden für den Cloud-Betrieb angepasst
Unternehmen sollten ihre Applikationen nicht einfach unverändert in die Wolke schieben, sondern sie für den Betrieb in der Public Cloud anpassen, empfiehlt Forrester.
Prognose 4: Hyperconverged Systems erleichtern Private-Cloud-Installationen
Forrester empfiehlt den Einsatz von Hyperconverged Systems für Private-Cloud-Szenarien insbesondere für neue Workloads, die eine rasche und automatisierte Skalierung der Infrastruktur erforderten.
Prognose 5: Container-Techniken drängen in die Cloud
Linux-Container werden 2017 Bestandteil jeder großen Public- oder Private-Cloud-Plattform sein, erwarten die Analysten.
Prognose 6: Enterprise-Anwendungen wandern in die Public Cloud
"Die Cloud ist der beste Ort, um aus Enterprise-Daten schnell Erkenntnisse zu gewinnen“, sagt Forrester-Analyst Dave Bartoletti. Schon jetzt hosten etliche Unternehmen auch Enterprise-Anwendungen in der Public Cloud. Dieser Trend werde sich 2017 verstärken.