Zeig mir wo die Bäume stehn!

Beim Wühlen in grossen Korpora sieht man manchmal den Wald vor lauter Bäumen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus.

Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der Linguistik haben sich hier interessante Lösungen ergeben, die sich die einfache Verfügbarkeit von Daten jeglicher Art übers Web zu Nutze machen. Schon länger online, aber nach wie vor interessant, die „Newsmap“. Sie stellt die von Google (maschinell) zusammengestellten Nachrichten grafisch dar:

Auf einen Blick ist ersichtlich, welche Nachrichten aktuell besonders häufig zitiert sind (und damit anscheinend als wichtig angesehen werden). Die Karte lässt sich nach Ländern und Ressorts getrennt zeichnen und erlaubt damit den Vergleich der Nachrichtenstrukturen.

Ähnlich funktioniert das „Themenbarometer“ bei Weblog-Portalen, beispielsweise bei Technorati.com. Weil Blog-Einträge hochgradig strukturiert sind (RSS-Feeds), lassen sie sich sehr einfach maschinell auslesen. So z.B. die sog. „Tags“, die Themenstichwörter, die die AutorInnen den Einträgen zufügen. In einer „Typografik“ werden diese Tags nach ihrer aktuellen Frequenz gewichtet dargestellt:

Aus korpuslinguistischer Sicht ist das alles sehr nett – aber der Spass könnte hier erst beginnen! Statt Inhaltswörter zu beachten (Blog-Tags) oder Schlagzeilen (Newsmap, Google News) könnte man auch andere sprachliche Strukturen visualisieren. Z.B. die aktuellen signifikanten Kookkurrenzen von Nachrichtentexten? Oder die Veränderungen derselben im Vergleich zum Vormonat? Bestimmte Begriffsfelder im Verlauf der Dekaden in einem historischen Korpus? Syntaktisch-stilistische Merkmale in Web-Texten zur Textsortenspezifizierung? Der Ideen gäbe es noch viele!

Herr Sprechtakel visualisierte bereits das semantische Feld von Atom- und Kernkraftwerken oder verwendete bestehende Visualisierungswerkzeuge, um der Vogelgrippe auf die Schliche zu kommen. Oder er suchte die Bundeskanzlerin in der Bärenhöhle und fragte nach der Swissness. Alles erst ein Anfang.

Dieser Beitrag wurde unter Korpuslinguistik, Korpustools veröffentlicht. Setze ein Lesezeichen auf den Permalink.