Kybernetik contra Konstanten (Teil 2)

Mit Simulationen lassen sich neue Märkte erkennen

12.01.1990

Für die Analyse des Absatzmarktes wird eine fortlaufende, möglichst lückenlose Aufzahlung der Kundenaufträge über einen längeren Zeitraum benötigt. Daraus können dann Schlüsse gezogen werden über die Verteilung der einzelnen Zufallsvariablen, über mögliche Korrelationen zwischen ihnen und über eine mögliche Saisonabhängigkeit.

Als Rohmaterial für den Absatzmarkt standen lückenlose Auftragseingangslisten eines mittelständischen Serienfertigers nur für den Zeitraum von April 1985 bis Mai 1986 zur Verfügung. Diese Listen wurden monatlich erstellt und enthalten alle Kundenaufträge, die jeweils bis Monatsende bei dem Unternehmen entweder telefonisch oder schriftlich eingegangen waren.

Nach der Reduzierung der Daten auf ausgewählte Warengruppen und auf die zur Analyse notwendigen Inhalte (die Kundennummer und die Auftragsnummer wurden beispielsweise gelöscht, da der Simulator die Bestellungen kundenanonym und ohne Auftragsstruktur erzeugen soll) besteht jede Zeile des verbleibenden Datensatzes folgendermaßen aus den Elementen "Bestellungen", "Artikelnummer", Bestellmenge" und "gewünschte Lieferzeit", die zur Beschreibung des Absatzmarktes notwendig sind.

Der endgültige Datensatz besteht aus 3701 Beobachtungen, die den Zeitraum von April 1985 bis Mai 1986, also insgesamt 14 Monate, abdecken. Im Baustein "Beschaffungsmarkt" soll nur die Lieferzeit betrachtet werden, da die lieferbare Menge je Beschaffungsauftrag für viele Unternehmen als in bestimmten Mengen variabel angenommen werden kann. Der Preis wird als konstant betrachtet.

Ermittlung der Lieferzeit

Für die Analyse des Beschaffungsmarktes werden also lediglich die Lieferzeiten der einzelnen Rohmaterialbestellungen, ebenfalls möglichst lückenlos über einen längeren Zeitraum benötigt. Anhand dieser Daten soll die Verteilung der Lieferzeit ermittelt werden.

Für eine zusätzliche Untersuchung auf Saisonabhängigkeit und Korrelationen werden das Bestelldatum und die Bestellmenge ebenfalls erhoben. Als Rohmaterial für den Beschaffungsmarkt standen Lieferkarten zur Verfügung, in die sämtliche

Rohmaterialbestellungen und -lieferungen eingetragen worden waren.

Nach der Reduktion und Aggregation des Datenmaterials bleiben 303 Beobachtungen der Form "Bestelldatum", "Rohmaterialnummer", "Bestellnummer", "Bestellmenge" und "Lieferzeit". Die im Vergleich zum Absatzmarkt relativ geringe Anzahl der Beobachtungen ist darin begründet, daß aus einer geringen Anzahl von Rohmaterialsorten durch eine hohe Fertigungstiefe viele unterschiedliche Artikel erzeugt werden.

Die Untersuchung des Beschaffungsmarktes beschränkt sich auf die drei Jahre 1985 bis 1987, das heißt es wurden alle Rohmaterialaufträge erhoben, die in diesem Zeitraum bestellt und ausgeliefert wurden.

Da die erste Form des Simulationsmodells nur eine stark vereinfachte und möglichst leicht zu realisierende sein sollte, wurden die Korrelationen zwischen den einzelnen Elementen einer Bestellung, etwa die Abhängigkeit der Lieferzeit von der Bestellmenge und der Artikelnummer, nur teilweise berücksichtigt.

Die Tatsache, daß die Daten aus einem Unternehmen stammen, das Produkte für den Freizeitbereich herstellt, legt es nahe, in den ankommenden Aufträgen einen Saisoneinfluß zu vermuten.

Bestelltermin als Poisson-Prozeß

Diese Annahme wird überprüft, indem die Anzahl der eingegangenen Bestellungen, die mittlere Bestellmenge, die Gesamtbestellmenge und die mittlere Lieferzeit pro Kalenderwoche als Zeitreihen dargestellt werden. Da die Grafiken allerdings keinen Saisoneinfluß erkennen lassen, werden die Daten als saisonunabhängig angenommen. Es bleibt also die Analyse der Datensätze für den Bestelltermin, die Artikelnummer, die Bestellmenge und die gewünschte Lieferzeit.

Der Bestelltermin läßt sich angemessen als Poisson-Prozeß modellieren, das heißt die Zwischenankunftszeiten werden als exponentialverteilt mit Ankunftsrate angenommen

mit /Lambda= /mittlere Zwischenankunfts-Zeit als Schätzwert für Lambda.

Hier ergibt sich mit einer mittleren Zwischenankunftszeit von 38,91 Minuten Lambda als 0,0257.

Die Artikelnummer ist ein nominales Merkmal, das heißt die Artikelnummern unterliegen keiner Rangfolge und sind nicht miteinander vergleichbar, auch wenn sie hier durch natürliche Zahlen dargestellt werden. Die Verteilung über die Artikelnummer ist endlich und die Dichte ordnet jeder der 18 verschiedenen Nummern eine Auftrittswahrscheinlichkeit zu, die durch ihre relative Häufigkeit einfach geschätzt werden kann.

Wegen der teilweise sehr unterschiedlichen durchschnittlichen Bestellmenge zwischen den einzelnen Artikelgruppen wurde diese Häufigkeitsverteilung mit einer Gewichtung nach den mittleren Bestellmengen leicht modifiziert. Da die Verteilung beziehungsweise Erzeugung der Bestellmengen für alle Artikelgruppen gleich sein soll, werden damit zwar nicht die durchschnittlichen Bestellmengen der Artikelgruppen berücksichtigt, jedoch treten Gruppen mit überdurchschnittlich großer beziehungsweise kleiner Bestellmenge entsprechend häufiger beziehungsweise weniger häufig auf. Die Abhängigkeit zwischen Artikelnummer und Menge läßt sich in diesem Fall unter der Voraussetzung, daß die Verteilung der Bestellmenge für alle Artikel gleich ist, relativ einfach bei der Generierung der Bestellungen berücksichtigen. Die Möglichkeit, für jede Artikelgruppe eine eigene Mengenverteilung festzulegen, soll hier nicht weiter verfolgt werden, weil dadurch die Auftragserzeugung zu komplex würde.

Die Verteilung der Bestellmenge besitzt eine komplizierte Struktur, da ihre Werte eine große Spannweite (1 bis 161600) besitzen, sich aber vorwiegend im unteren Mengenbereich und insgesamt auf wenige Merkmalsausprägungen konzentrieren. Beispielsweise liegen mindestens 90 Prozent aller Werte im Intervall 1,600. In den größten Teil der Menge der möglichen Realisierungen fallen gar keine Beobachtungen; insgesamt werden nur 258 von 161000 möglichen Werten angenommen, was einem Anteil von 0,16 Prozent entspricht. Die Häufungspunkte sind, wie man sofort intuitiv richtig vermutet natürlich die "glatten" Zahlen.

Es scheint also ausgeschlossen, die Bestellmenge angemessen durch eine bekannte diskrete Verteilung zu modellieren. Deshalb sollen nur eine endliche Menge verschiedener Realisierungen zugelassen und deren Auftrittswahrscheinlichkeiten durch empirische Auftrittshäufigkeiten geschätzt werden.

Hemmschwelle bei der Bestellung

Um die zwischen Bestellmenge und Lieferzeit bestehende positive Korrelation berücksichtigen zu können, werden die Gesamtdaten in die "Mengenklassen" MK1 bis MK4 eingeteilt, welche die Intervalle [1,99,] [100,999], [1000,9999,] [10 000,99999] repräsentieren und für welche die Lieferzeit dann nach verschiedenen Verteilungen erzeugt werden kann. Die Wahl der Grenzen ist zurückzuführen auf die Tatsache daß der Kunde eine gewisse psychologische Hemmschwelle überschreitet, wenn er die nächste höherstellige glatte Anzahl bestellt.

Als Vorschlag für die Generierung der Bestellmengen ergibt sich: Es werden nur die glatten Zahlen 10, 20, . . ., 90, 100, 200, . . ., 900, 1000, 2000, . . . 9000, 10000, 20000,

. . ., 90000 als mögliche Werte zugelassen und als Schätzer für ihre Auftrittshäufigkeiten dienen die

relativen Häufigkeiten der Klassen, in denen diese Werte die Mittelpunkte darstellen.

Das Verfahren soll zweistufig sein: Zuerst wird die Mengenklasse gewählt und dann ein Wert innerhalb dieser Klasse und eine entsprechende Lieferzeit.

Test zur Feststellung angemessener Beschreibung

Die Lieferzeiten werden separat in jeder der oben eingeführten Klassen untersucht. Die vier Histogramme (beispielhaft für MK2 siehe Bild 2) lassen ein ähnliches Verteilungsmuster erkennen und weisen darauf hin, daß die Lieferzeiten einer bekannten diskreten Verteilung genügen, die mit Hilfe grafischer Verfahren genauer analysiert wird.

Grafische Verteilungstests dienen im allgemeinen dazu, schnell festzustellen, ob ein Datensatz durch eine bekannte diskrete Verteilung angemessen beschrieben werden kann.

Seien X1,..., Xn eine beobachtete Stichprobe einer diskreten Zufallsvariablen X, nk die absolute und Pk= nk/k die relative Auftrittshäufigkeit der Ausprägung k. Mit f(k) sei die diskrete Dichte an der Stelle k der Verteilungsklasse bezeichnet, für die ein Test durchgeführt werden soll. + (wird fortgesetzt)