Ein Fall für Big Data

Wie Obama die Wahl gewann

Karin Quack arbeitet als freie Autorin und Editorial Consultant vor allem zu IT-strategische und Innovations-Themen. Zuvor war sie viele Jahre lang in leitender redaktioneller Position bei der COMPUTERWOCHE tätig.
Nicht die meisten, sondern die richtigen Stimmen wollte das Wahlkampfteam um Barack Obama bei der Präsidentschaftswahl 2012 gewinnen - und das mit geringstmöglichem Mitteleinsatz sowie höchster Erfolgswahrscheinlichkeit. Für dieses Ziel werteten 45 Datenanalytiker mehr als ein Jahr lang eine ständige wachsende Anzahl von sehr unterschiedlichen Daten aus.
Wie Obama die Wahl gewann - ein Fall für Big Data.
Wie Obama die Wahl gewann - ein Fall für Big Data.
Foto: spirit of america, Thomas Pajot/Shutterstock

Fußball und Wahlkampf haben eines gemeinsam: Es gewinnt nicht der, der schöner spielt, sondern der, der den Ball häufiger regelgerecht über die gegnerische Torlinie bringt. Und am Ende triumphieren oft die, die ihre Kräfte 90 Minuten lang geschont und am Ende das entscheidende Tor erzielt haben.

Etwas Ähnliches dürfte das Team "Obama for America" (OfA) im Kopf gehabt haben, als es daran ging, den Wahlkampf für den alten und neuen US-Präsidenten Barack Obama zu planen. Mit Hilfe moderner Datenanalysetechnik versuchte es, nicht den Ballbesitz zu maximieren, sondern die entscheidenden Pässe zu spielen.

Das Wahlmännersystem

Nach dem US-Wahlrecht geht jeder Staat komplett an einen der Kandidaten. Das heißt, die drei bis 55 "Wahlmänner" des jeweiligen Bundesstaates -die Zahl verhält sich in etwa proportional zur Bevölkerung - stimmen geschlossen für denjenigen Bewerber, der die breiteste Zustimmung erhalten hat.

Es ist also verlorene Liebesmüh, in einem Staat mehr als 51 Prozent erreichen zu wollen. Außerdem gilt es, vor allem die bevölkerungsreichen Bundesstaaten mit einer großen Anzahl von Wahlmännerstimmen für sich zu gewinnen.

Dabei gibt es Staaten, die traditionell in eine politische Richtung tendieren und sehr schwer umzustimmen sind. So gehen beispielsweise New York und Kalifornien immer an die Demokraten, Texas an die Republikaner. Und dann ist da noch eine Handvoll "Swing States", beispielsweise Ohio, bei denen der Unterschied zwischen den beiden Kandidaten häufig nur wenige Prozentpunkte ausmacht.

Rayid Ghani, Obamas "Geheimwaffe": "Die Erfolgswahrscheinlichkeit lag ohne Datenanalyse bei 60 Prozent, mit ihr bei 80 Prozent."
Rayid Ghani, Obamas "Geheimwaffe": "Die Erfolgswahrscheinlichkeit lag ohne Datenanalyse bei 60 Prozent, mit ihr bei 80 Prozent."
Foto: Teradata

Hier können wenige Wählerstimmen einen gewaltigen Unterschied bedeuten. So hatte Al Gore bei der Präsidentschaftswahl 2000 über das gesamte Land gerechnet eine halbe Milliarde mehr Stimmen als George Bush der Este. Aufgrund knapper Mehrheiten in einigen Swing States (und einem extrem umstrittenen Ergebnis in Florida) musste sich Bill Clintons einstiger Vizepräsident jedoch seinem Widersacher geschlagen geben.

Will man also eine erfolgreiche und effektive Kampagne fahren, muss man sich auf die Staaten und Personen konzentrieren, die sich tatsächlich durch Argumente und Überredungskunst gewinnen lassen. Und das am besten noch mit vertretbarem Aufwand. Denn eine Wählerstimme zu gewinnen ist je nach Bundesstaat unterschiedlich teuer, erläutert Rayid Ghani, Chief Scientist der OfA-Kampagne: "In Colorado kostet es uns sechs bis sieben Dollar, in Kalifornien nur einen Cent."

Das Problem: Resource Allocation

Daraus ergeben sich zwei Fragen, so Ghani, der häufig als "Obamas Geheimwaffe" oder "das Gehirn hinter dem Obama-Wahlkampf" bezeichnet wurde. Diese Fragen lauten:

  • Wo lassen sich überhaupt Wähler überzeugen?

  • Was kostet es, sie zu überzeugen?

  • Wo also investiere ich sinnvollerweise den zur Verfügung stehenden Betrag?

Mit diesen Fragen im Hinterkopf ging "Obama for USA" schon 2010 daran, Daten über die US-Wählerschaft zu sammeln. "Wir hatten gegenüber den Republikaner einen Vorteil", räumt Ghani ein: "Unser Präsidentschaftskandidat stand schon lange vor der Wahl fest." Die Gegner mussten sich hingegen erst noch auf einen auf einen Herausforderer einigen, konnten ihren Wahlkampf also spät auf Mitt Romney zuschneiden - und damit auch einen Teil der Spendenvolumina erst kurz vor der Wahl aktivieren.

OfA machte viel aus diesem Vorsprung. So gelang es dem Team rechtzeitig, die Wählerstimmung in den Swing States nicht nur zu eruieren, sondern auch zu beeinflussen. Die unentschlossenen, aber aufgeschlossenen Wähler wurden herausgesiebt, gewichtet und nach einem ausgeklügelten Plan auf unterschiedlichen Kanälen angesprochen.

Datenmaterial zunächst dürftig

Nicht nur Geld und Personal, auch das Datenmaterial war zunächst dürftig, sagt Ghani. In den USA gibt es kein zentrales Einwohnermeldeamt, an das man sich mit Anfragen wenden könnte. Wer wählen möchte, muss sich allerdings in - mindestens - eine der pro Bundesland geführten und öffentlich zugänglichen Wählerlisten eintragen. Das war einer der Startpunkte für die Datenanalysten im Team. Allerdings galt es, diese Informationen vor Gebrauch sorgfältig zu "reinigen", denn es kam durchaus vor, dass ein und dieselbe Person in drei verschiedenen Staaten geführt wurde.

Auch die Wahllisten der vorangegangenen Präsidentschaftswahl lieferten halbwegs brauchbare Informationen. Hinzu kamen die Datenbank der freiwilligen Helfer und der Spender. Diese Menschen bildeten den Nukleus eines wachsenden Netzwerks. Sie wurden darauf angesetzt, ihre Kontakte anzusprechen, die -falls sie sich als willig herausstellen - wieder in ihrer Nachbarschaft tätig werden sollten. "Am leichtesten lassen sich ja die Leute überreden, die einem selbst ähnlich sind", erläutert Ghani.

So gab es bald überall "Neighbourhood Teams", die sich erheblich leichter taten, die potenziellen Wähler zu selektieren und in der richtigen Form anzusprechen, als ein anonymes Walkampfteam. Es ging darum, die jeweiligen politischen Ansichten und die persönliche "Wahlhistorie" kennenzulernen sowie herauszufinden, inwieweit die Person offen für Argumente und Überredungsversuche wäre, ohne dass sie sich dadurch belästigt fühlen würde. "In den USA reden die Leute offener über ihre Wahlvorlieben als in Europa", stellt Ghani klar.

Das DataWarehouse kommt ins Spiel

Mit den existierenden Datenbanken und neu gewonnenen Informationen wurde ein DataWarehouse gefüttert, das die Basis für Datenmodelle und -analysen bildete. Welche DataWarehouse- und Analysesoftware das Team nutzte, will Ghani nicht verraten. "Wir haben mit den Systemen unterschiedlicher Anbieter gearbeitet, viele Open-Source-Software genutzt und Einiges selbst gebaut", lautet seine lapidare Antwort auf allzu neugieriges Bohren: "Wir hatten ja vor allem am Anfang nur begrenzt Geld für die Infrastruktur zur Verfügung."

Eines hatte das Team allerdings sehr wohl: ein Team von 40 bis 50 Datenalytikern, die laut Ghani etwa ein Zehntel des gesamten OfA-Teams bildeten. Und obwohl sie nach Aussagen des Chefanalytikers schwer zu finden waren, brachten sie erstaunlich viel Knowhow mit - beispielsweise hinsichtlich des Open-Source-Dateisystems Hadoop. Mit ihm lassen sich schnell und preiswert rohe, aber durchaus funktionsfähige Datenmodelle zimmern. Allerdings erzeugt es einen gewissen Overhead, weshalb es als schwer zu handhaben gilt: "Doch wir hatten die Leute, die wussten, wie man damit umgeht", sagt Ghani.

Etwa zehn unterschiedliche Datenquellen aus Systemen unterschiedlicher Anbieter wurden über eine eigens dafür gebaute Middleware miteinander verbunden, aber nicht integriert: "Wir wollten kein System von Interfaces", stellt Ghani klar, "alles was wir wollten, war: die Daten nehmen, verarbeiten und wieder in die Ursprungsdatenbank zurückschieben, wo die Leute mit den Resultaten arbeiten konnten." Die gesamte Struktur war ja auf eine zeitlich begrenzte Nutzung angelegt: "Wenn wir ein bleibendes Unternehmen wären, hätten wir das sicher anders geregelt."

Dreifache Gewichtung der Wähler

Mit der "Hand am Arm" und in repräsentativen Umfragen ("Polls") wurde die Stimmung in dem beobachteten Teil der Wählerschaft kontinuierlich abgefragt und mit den vorhandenen Daten abgeglichen. 120 Millionen Telefonkontakte gab es im Verlauf der Kampagne, fünf Milliarden eMails wurden verschickt. Hinzu kamen unzählige Hausbesuche. Auf diese Weise wurden die Informationen immer mehr verfeinert und validiert. "Experimente" mit kontrollierten Verhaltensänderungen (mehr eMails, weniger eMails, neue Informationskanäle etc.) halfen dem Team, seine Taktik zu perfektionieren.

Am Ende hatte man weniger eine Liste als eine Matrix von Wählerprofilen. Diese Matrix ermöglichte eine jeweils abgestimmte Taktik der Ansprache, denn sie war in drei Dimensionen gewichtet:

  • zum einen nach dem Grad der Unterstützung für Obama,

  • zum zweiten nach der Chance, sie zu für eine Meinungsänderung zu gewinnen,

  • zum dritten nach der Bereitschaft zu wählen.

Der letztgenannte Aspekt spielt in den USA, wo die Wahlbeteiligung meist um die 60 Prozent liegt, eine große Rolle. Denn was nützt ein Wähler, der mit viel Mühe von der Politik des Präsidenten überzeugt wurde, aber zu träge ist, sich in Wählerverzeichnis einzutragen und sich auch noch am Stichtag ins Wahllokal zu bemühen?

Die weiter als lohnend eingestuften Kontakte wurden nach einem sorgfältig errechneten Schema angesprochen - je nach "Rang" in der Matrix, Wichtigkeit des Staates und Kosten der Kontaktaufnahme. Mit Hilfe von Polls vor und nach den Aktionen kontrollierte das Team den Erfolg seiner Argumente und Überredungskünste.

Auf allen Kanälen

Auf der Basis des DataWarehouse baute das Team diverse Tools. Eines steuerte beispielsweise den E-Mail-Versand , wobei es die Adressen in Einklang mit dem jeweils gültigen Wähler-Ranking auswählte: Auf Knopfdruck ließen sich bestimmte Mails bestimmte nur an die erfolgversprechendsten zehn oder 20 Prozent der Profile versenden.

Ein anderes Tool war dazu bestimmte, das Soziale Netzwerk Facebook für die OfA-Zwecke zu nutzen: Wenn ein Sympathisant Inhalte der Kampagne mit seinen "Freunden" teilte und diese dem Link folgten, glich das Softwarewerkzeug deren Facebook-Profile mit den vorhandenen Datenbankinhalten ab. So ließen sich weitere interessante Kontakte herausfiltern.

Die Entscheidung, welcher Kanal für welche potenziellen Wähler der erfolgversprechendste sei, wurde auch mit Hilfe der Datenanalyse gefällt. Sogar die Wahl der Themen, auf die der jeweilige Mensch positiv reagieren würde, ließ sich aufgrund der im DataWarehouse gesammelten Informationen treffen. "Doch was immer wir mit den Online-Tools machten, wir mussten die Leute dazu bringen, offline zu agieren", erinnert Ghani daran, dass es sich keineswegs nur um statistische Spielereien handelte.

Am Ende ging die Rechnung jedoch auf: Obama siegte gegenüber Mitt Romney mit einem Vorsprung von zwei Staaten, aber er gewann 332 gegenüber 206 Wahlmännerstimmen. Ob die Datenanalyse den Ausschlag dafür gegeben hat? "Wir hätten vielleicht dieselben Stimmen gewonnen, aber es hätte mehr Geld gekostet", sagt Ghani. Die Informationstechnik erhöhe einfach die Erfolgswahrscheinlichkeit: "Ohne uns lag sie bei 60 Prozent, mit uns bei 80 Prozent." Und das sollen die politischen Gegner nicht gewusst haben? "Doch sicher, die Republikaner hatten bestimmt auch ein solches System, sie konnten aber erst später anfangen, es zu nutzen."

Fund Raising und Finanzplanung

Neben dem Gewinnen von Wählerstimmen erfüllte die Datenanalyse im OfA-Team zwei weitere Aufgaben. Mit ihrer Hilfe ließen sich zum einen auch die Personen ermitteln, die empfänglich für die Bitte um Spenden waren. Und selbstverständlich gab es auch in dieser Beziehung eine abgestufte Taktik: "Jemanden, der gerade 10.000 Dollar gespendet hat, darf man nicht mit einem Massen-Mailing belästigen, in dem um einen kleinen Beitrag von fünf Dollar geben wird, sonst riskiert man, ihn sauer zu fahren", führt Ghani aus.

Insgesamt haben die Fundraising-Aktivitäten eine Milliarde Dollar eingebracht. Etwa 60 Prozent davon seien durch eMails gewonnen worden, berichtet der Chefanalytiker: "Bieten Sie den Leuten einen Link an, auf den sie klicken können. Viele werden es tun und ihre Kreditkarteninformationen weitergeben."

Das zweite Einsatzfeld der Datenanalyse war die interne Finanzplanung, die sich von der in einem Unternehmen üblichen doch unterschied: "Eine Infrastruktur braucht man am Anfang, nicht am Ende des Wahlkampfs, wenn die Gelder besonders üppig sprudeln", erläutert der Chefanalyst, "deshalb mussten wir am Anfang Geld ausgeben, das wir noch gar nicht hatten." Mit Hilfe von Vorhersagemodellen ließ sich aber das Risiko im Rahmen halten, sprich: Ausgaben und erwartete Einnahmen in ein gesundes Verhältnis bringen.

Beim nächsten Mal ist alles anders

Die OfA-Truppe hatte nicht viel, worauf es sein Analysesystem aufbauen konnte. Auch das nächste Wahlkampfteam der Demokraten wird quasi bei null anfangen müssen. Zwar behält die Partei die Infrastruktur, aber innerhalb von vier Jahren wird die IT-Welt eine völlig andere sein. Zudem brach das Team nach Obamas Sieg auseinander. Ghani erläutert, warum: "Geld fließt nur vor der Wahl, also lässt sich eine solche Struktur zwischen den Wahlen nicht aufrecht erhalten."

Die gesammelten Daten existieren allerdings noch. Gemeinsam mit einem Teil des Teams wurden sie von einer privaten Initiative übernommen. Sie nennt sich ebenfalls OfA, was aber heute "Organizing for Action" bedeutet. Die Initiative hat es sich zur Aufgabe gemacht, Obamas Politik zu propagieren, derzeit vor allem die Änderung der Immigrationsgesetze. Dazu nutzt sie vor allem die zahlreichen E-Mail-Adressen aus der Wahlkampagne.

Ghani selbst hat sich einem neuen Projekt an der University of Chicago verschrieben. Es versucht, die in der OfA-Kampagne entwickelten Modelle auf andere Einsatzgebiete wie Gesundheitswesen und Erziehung zu übertragen. Beispielsweise könnten solche Vorhersagemodelle dazu dienen, potenzielle Schulabbrecher zu identifizeren und zum Bleiben zu überreden, erzählt Ghani mit leuchtenden Augen. (mhr)

»

Best in Big Data

Best in Big Data
Die COMPUTERWOCHE kürt gemeinsam mit einer fachkundigen Experten-Jury bereits zum dritten Mal die besten Big-Data-Projekte, -Lösungen und – neu in diesem Jahr – die besten Services rund um Big Data. Das Finale findet auf dem COMPUTERWOCHE-Kongress Best in Big Data am 18. September in Wiesbaden statt.