Electronic-Publishing bei Meinungsumfragen:

Codes erleichtern Auswertung von Fragebögen

07.07.1989

Rationelle Erstellung sowie schnelle und sichere Auswertung einer großen Anzahl von Fragebögen war die Zielvorgabe für den Einsatz eines Electronic-Publishing-Systems bei der Gesellschaft für Konsum-, Markt- und Absatzforschung (GfK), Nürnberg. Gefordert wurden die Positionierung von Markierungsfeldern, codierte Auswertungshinweise für den Markierungsleser und die Identifizierung jedes Fragebogens per Strichcodierung.

Fragebögen für Meinungsumfrage rationeller erstellen sowie schneller und sicherer auswerten. Das war die Zielvorgabe für den Einsatz eines Electronic-Publishing-Systems von Rank Xerox bei der GfK-Marktforschung. Durch die exakte Positionierung von Markierungsfeldern und codierte Auswertungshinweise für den Markierungsleser kann ein erheblicher Teil der Antworten von Fragebogenaktionen vollautomatisch maschinell ausgewertet werden.

Per Strichcodierung ist zudem jeder Fragebogen (und jede einzelne Seite) individuell identifizierbar. Allein die Zeitersparnis durch den teilweisen Wegfall der manuellen Antwortcodierung liegt bei rund drei Tagen pro Studie. Ein angenehmer Nebeneffekt sind typografisch einheitlich gestaltete Fragebögen.

Die GfK-Gruppe führt primär- und sekundärstatistische sowie qualitativ und quantitativ orientierte Marktanalysen in Form von Exklusiv-, Mehrthemen- oder Panel-Untersuchungen durch.

Fragebögen sind das Hauptinstrumentarium bei der Personenbefragung. Die Zahl der für ein Marktforschungsprojekt erforderlichen Fragebögen schwankt zwischen etwa 100 und 4000. In Einzelfällen werden auch Auflagen bis zu 100 000 Exemplaren benötigt.

Die Fragebögen enthalten in der Regel geschlossene und offene Fragen. Bei geschlossenen Fragen sind alternative Antworten bereits vorgegeben. Der Interviewer hat jeweils nur ein Kästchen (oder auch mehrere) zu markieren. Die Antworten können daher maschinell gelesen und ausgewertet werden. Bei offenen Fragen dagegen sind freiformulierte Antworten zu geben. Hier ist bei der Auswertung das Umsetzen in Codierungslisten erforderlich. Durchschnittlich 70 Prozent der Fragen sind geschlossener Natur.

Fragebogen per Electronic-Publishing

Die GfK Marktforschung nutzt für ihre Aufgaben eine umfangreiche EDV-Ausstattung. Die Softwarebibliothek besteht aus mehr als 1200 überwiegend selbstentwickelten Programmen für Datenanalysen jeder Art. Als Hauptrechner sind eine IBM 4381 mit 32 Megabyte Hauptspeicher und eine Comparex 7/90-3 mit 128 Megabygte Hauptspeicher installiert. Die Platzspeicherkapazitäten betragen rund 135 Gigabyte. Für den Ausdruck der per Electronic-Publishing generierten Fragebögen sind drei grafikfähige Laserdrucker von Rank Xerox nutzbar.

Vor Einsatz des Electronic-Publishing-Systems wurden die Fragebögen entweder kopiert oder (bei größeren Auflagen) außer Haus gedruckt. Der Entwurf und die Gestaltung der Fragebögen erfolgte zunächst auf Schreibsystemen und später unter Einsatz von Textverarbeitungssoftware auf Personal Computern. Die konventionell erstellten Fragebögen waren nicht maschinell lesbar. Die Antworten (auch der geschlossenen Fragen) mußten zunächst in maschinell lesbare Belege übertragen werden. Dieses Verfahren war kosten- und zeitaufwendig.

Als die ersten Electronic-Publishing-Systeme auf den Markt kamen, erkannte die GfK in ihnen (in Verbindung mit grafikfähigen Laserdruckern) ein geeignetes Instrumentarium für die Reorganisation der Fragebogenerstellung und -auswertung. Uwe Domke, Abteilungsleiter Systemanalyse der GfK GmbH: "Die auf dem Einsatz von Barcode basierenden Anforderungen waren klar definiert: Für die exakte EDV-Auswertung sind die auf einzelnen Seiten gelesenen Daten eindeutig dem jeweils durchgeführten Interview zuzuordnen. Dies ist nur möglich, wenn jede Seite einer Gesamtauflage zu 100 Prozent identifizierbar ist. Das gilt auch für vom Belegleser ausgesteuerte Fragebogenseiten. Weitere Bedingung war die komplette Produktion der Fragebögen im Hause der GfK."

Von der ersten Idee bis zum Praxiseinsatz vergingen rund zwei Jahre. Im Oktober 1987 wurde ein EIectronic-Publishing-System XPS 701 von Rank Xerox bei der GfK in Nürnberg probeweise installiert. Es sollte nicht nur das System beurteilt, sondern generell die Möglichkeiten des Electronic-Publishing bewachtet werden. Deshalb wurde bereits in der Vorphase ein festdefiniertes Layout für die Fragebögen festgelegt. Nachdem auf der Anlage erste Teststudien mit zufriedenstellenden Ergebnissen erstellt worden waren, entschied sich das Unternehmen für ein XPS-Electronic-Publishing-System.

Im Frühsommer 1988 wurde folgende Geräteausstatung installiert: Electronic-Publishing-System Xerox XPS 701 mit zwei Arbeitsstationen Xerox 6085 und einem Laserdrucker Xerox 4045 (siehe Abbildung auf Seite 20).

Die eigentliche Produktion erfolgt auf den an die Hauptrechner angeschlossenen Hochleistungs-Laserdruckern Xerox 4050 beziehungsweise Xerox 4090.

Der Filetransfer zwischen der XPS 701 und dem Hostsystem wird über einen mit beiden Systemen verbundenen PC abgewickelt. Dabei werden auch die notwendigen Datenkonvertierungen durchgeführt. Für das maschinelle Erfassen der Antworten geschlossener fragen sind zwei Kaiser-Belegleser mit Spaltenlogik eingesetzt.

Bei der Xerox XPS 701 handelt es um ein System für den vollständigen Umbruch und die Druckaufbereitung, das mit einem 32-Bit-Mikroprozessor, bis zu neun Megabyte Hauptspeicher, einem Ethernet-Controller sowie bis zu 1,5 Gigabyte Plattenspeicher ausgestattet ist.

Zugriff auf alle Funktionen enthält der Benutzer über einen hochauflösenden 19-Zoll-Bitmap-Bildschirm (1088 x 864 Punkte) mit Tastatur und Maus. Auf dem Monitor wird die zubearbeitende Seite mit allen Text-, Strich- und Raster-Elementen wiedergegeben. Große Auflagen (Fragebögen ab etwa 50 Seiten Umfang und 2500 Exemplaren) werden von der GfK auf einem der Hostrechner erstellt. Sie nutzt hierzu das Xerox Integrated Compusition System. Es handelt sich dabei um eine Electronic-Publishing-Software (XICS) mit dem Funktionsumfang von Satzprogrammen, die den Umbruch der Textdaten und die Laserdruckerausgabe unterstützt.

Die Anforderungen der GfK bezüglich der automatischen maschinellen Erfassung der Antworten von geschlossenen Fragen und die gewünschte Identifizierung jeder einzelnen Seite erforderten teilweise spezielle Anpassungen der Electronic-Publishing-Software und der Software des Beleglesers.

Auf jedem Fragebogen ist am linken Rand ein Barcode angebracht. In sind die Projektnummer, die Fragebogennummer und die Seitennummer verschlüsselt. So sind jeder einzelne Fragebogen und jede seiner Seiten absolut sicher von der EDV identifizierbar. Die fortlaufende Numerierung ist in der Druckdatei enthalten. Das Verfahren ist rechen und speicherintensiv und kann nur bei elektronischen Druckern (mit eigener Intelligenz) praktiziert werden.

Durch am rechten Rand einer jeden Fragebogenseite angebrachte Taktmarken werden die Räume definiert, innerhalb derer Markierungen gelesen werden sollen. Neben den Lesespalten als vertikale Koordinate liefern die Taktmarken die erforderlichen horizontalen Koordinaten für das richtige Lesen und das logische Zuordnen der gelesenen Informationen. Das Verfahren ist eigens für die GfK entwickelt worden. Der Hersteller des Beleglesers hat seine Software entsprechend angepaßt und ein Programm für inhaltliche Plausibilitätsprüfungen erstellt. Das Anbringen der Taktmarken erfolgt mit Hilfe eines XPS-Makrobefehls. Wird während der Fragebogengenerierung eine Klammer (für die Markierung einer Antwort) definiert, so erzeugt das Electronic-Publishing-System automatisch ein Taktmarkenpaar (Leseoptik ein oder aus). Durch den Einsatz eines (Laser-)Seitendruckers ist sichergestellt, daß sowohl die Klammer als auch das Taktmarkenpaar Á-genau auf der Seite positioniert werden.

Zunächst werden für eine neue Marktstudie vom Projektleiter die Inhalte der Fragebögen festgelegt. Den typografischen Entwurf übernimmt dann die Fragebogenredaktion. Die dort arbeitenden drei Damen wurden intensiv mit den Möglichkeiten des Electronic-Publishing-Systems vertraut gemacht. Beim Fragebogen-Layout nutzen sie die GfK-Standards aus der Styledatei. Auf einem der Xerox-Laserdrucker wird dann die gesamte Auflage produziert. Die GfK-Interviewer markieren dann durch waagerechte Bleistiftstriche die Antworten auf geschlossene Fragen. Nach einer gewissen Eingewöhnungszeit haben sie keine Probleme mehr mit dem neuen Verfahren.

Nachdem alle Fragebögen zurück sind, werden die Bögen ohne weitere manuelle Bearbeitung maschinell gelesen. Rund 97 Prozent der Seiten werden richtig gelesen. Die übrigen enthalten logische Fehler bei den Antworten. Beispielsweise kann der Befragte nur in einem Bundesland wohnen. Sind zwei markiert worden, so steuert der Belegleser die Seite aus.

Die offenen Fragen müssen vorerst weiterhin in codierter Form in maschinenlesbare Listen übertragen werden. Sobald auch sie erfaßt sind werden die Antworten auf offene und geschlossene Fragen zusammengeführt. Der GfK-Rechner kann nun die Gesamtauswertung vornehmen. Die Projektbasisdaten (Fragen und Antworten) werden vom XPS-System online an den Hostcomputer überspielt und sind dort für die zu erstellende Marktforschungsstudie integriert weiterverarbeitbar.

Der Einsatz von Electronic-Publishing für die Gestaltung und Aufbereitung von Fragebögen hat für die GfK wirtschaftliche und funktionale Vorteile. Das Erstellen ist schneller und effektiver möglich. Zudem ist der manuelle Aufwand für Änderungen wesentlich geringer als bei der seitherigen Arbeitsmethode. Werden zusätzliche Fragen eingeschoben, so numeriert das System die Fragen automatisch neu.

Da geschlossene Fragen für die Auswertung nicht mehr eigens zu codieren sind, werden hier (neben dem Wegfall von Fehlerquellen) im Schnitt drei Arbeitstage eingespart. Daher sind Vorabauswertungen möglich geworden, die von vielen GfK-Kunden als sehr nützlich eingestuft werden. Mit den typografischen Gestaltungsmöglichkeiten des Electronic-Publishing können die Fragebögen nicht nur einheitlich und ansprechender, sondern auch übersichtlicher gestaltet werden. Das führt zu einer höheren Akzeptanz bei den Auftraggebern, den Interviewern und den Befragten.

Das XPS-System ist komplett in die bei der GfK bestehenden Abläufe integriert. Derzeit werden im monatlichen Durchschnitt bereits die Fragebögen von 25 Marktforschungsstudien mit zwischen 600 000 und 700 000 einzelnen (individuell codierten) Seiten auf dem System erstellt.