Übung Korpuslinguistik: Visualisierung

Die Möglichkeiten der Visualisierung

Sprachdaten können auf unterschiedlichste Arten visualisiert werden. Je nach Visualisierung werden andere Aspekte dargestellt und betont. Zum Beispiel kann die generelle Struktur eines Sprachausschnitts gezeigt werden:


Die Grafik zeigt die häufigsten Adjektiv-Nomen-Kombinationen, die man in der NZZ in den Ausland-Artikeln vom Januar bis März 1995 findet. Ein Knoten steht für ein Wort, die sog. Kanten zeigen die Verbindungen zwischen den Wörtern an.

Auch wann man die einzelnen Wörter gar nicht lesen kann, ist die Struktur typisch für die ausgesuchte Kombination von Wortarten. Das wird augenfällig, wenn man das gleiche Korpus auf Verb-Nomen-Kombinationen durchsucht und diese darstellt:


Was sagt uns die grundsätzliche Struktur? Bei Verb-Nomen-Kombinationen scheint es so zu sein, dass viele Nomen zu relativ wenigen, immer gleich lautenden, Verben in Bezug stehen. Anders bei der ersten Darstellung: Adjektiv-Nomen-Kombinationen sind vielfältiger. Es gibt sowohl mehr unterschiedliche Adjektive als auch Nomen im Korpus. Das hat eine grosse Auswirkung auf die dargestellte Struktur.

Einen anderen Informationswert hat aber folgende Grafik:



Sie zeigt statistisch signifikante Kookkurrenzpartner zu "Notbremsung" im IDS-Korpus. (Weitere Erklärungen dazu finden sich auch in einem der nächsten Unterkapitel.) Hier wird das Kookkurrenzprofil des Suchwortes auf den ersten Blick ersichtlich, ohne dass man sich durch lange Wortlisten kämpfen muss.

Anstatt mit Graphen wie oben ganze Wortnetze zu visualisieren, kann man sich auch mit einer einfacheren Darstellung behelfen:



Diese Grafik zeigt, wie oft welche Wörter vor oder nach "Terror" genannt werden. Je näher die Wörter der Mittelachse sind, desto häufiger sind sie Vor- oder Nachläufer von "Terror". Der häufigste linke Partner von "Terror" ist demnach der bestimmte Artikel (mit "d" abgekürzt).

Die obige Grafik zeigt die wichtigsten Partner von "Terror" in NZZ-Artikeln des Jahres 2000. Interessant wird die Gegenüberstellung mit Daten aus den Jahren 2001 (Herbst) und 2004. Die entsprechenden Grafiken:


NZZ-Artikel zu "Terror" Herbst 2001


NZZ-Artikel zu "Terror" Herbst 2004

Möchte man in einer solchen diachroner Perspektive einen Wandel aufzeigen, kann man versuchen, dies ebenfalls zu visualisieren. Ein Beispiel:


(Grafik von Andres Wanner, FHNW)

Diese Grafik zeigt (fingierte) Sprachdaten zweier Jahre (orange und schwarz): es werden auffällige Wortgruppen der beiden Zeitabschnitte aufeinandergelegt, so dass sichtbar wird, was sich diesbezüglich verändert hat.