Web

ZIP erkennt den Komponisten

11.04.2003

MÜNCHEN (COMPUTERWOCHE) - Musikstücke unbekannter Herkunft lassen sich mit Hilfe des Kompressionsverfahrens ZIP Komponisten zuordnen, fanden Rudi Cilibrasi, Paul VitŸnyi und Ronald de Wolf, Forscher am Dutch National Research Institute in Amsterdam heraus. Um gute Ergebnisse zu erzielen, müssen zunächst alle musikfremden Daten wie zum Beispiel digitale Wasserzeichen aus den Audio-Dateien gefiltert werden. Danach werden die Dateien gepackt, wozu die Wissenschaftler das ZIP-Format "Bzip2" wählten, das sehr hohe Kompressionsraten erzielt. Im Anschluss werden einzelne Passagen aus den Archiven extrahiert und mit Kontrolldaten bekannter Komponisten verglichen.

Getestet haben die Forscher mit jeweils zwölf Stücken von Beethoven, Miles Davis und Jimi Hendrix, wobei sie zehn der Jazz-Kompositionen, neun der Rock-Songs und alle Klassik-Passagen eindeutig zuordnen konnten. Neben der Identifizierung unbekannter Stücke könnte das Verfahren dazu dienen, um Audio-Dateien in Online-Musikangeboten automatisch einzelnen Genres zuzuordnen, sagten die Forscher.

Das ZIP-Verfahren basiert auf der Zusammenfassung gleichartiger Informationen. Zum Beispiel wird eine Textdatei gepackt, indem die Anzahl gleicher Buchstaben und ihre Position mittels Algorithmus kodiert wird. So lassen sich etwa mehrere tausend gleiche Zeichen auf wenigen Bytes unterbringen. Besteht nun ein Text aus relativ vielen Vokalen, wie zum Beispiel im Deutschen, unterscheiden sich die Algorithmen von denen gepackter slawischer Texte, die mehr Konsonanten enthalten. Die Algorithmen gleichsprachiger Texte sind zueinander jedoch ähnlich. Dieses Verfahren haben die Wissenschaftler auf die Musik-Daten übertragen, die neben Tönen auch Kennzeichen wie Taktlängen oder Rhythmen enthalten. (lex)