Die Arbeit mit der IMS Open Corpus Workbench am Beispiel des Text+Berg-Korpus

Die IMS Open Corpus Workbench (CWB) ist eine Konkordanz- und Korpusanalyse-Software, mit der eigene Korpora, die mit linguistischen Annotationen versehen sind, bearbeitet werden können. Die CWB und die Abfragesprache CQP (Corpus Query Processor) verarbeiten Korpora bis zu einer Größe von 2 Milliarden Tokens.

Inzwischen gibt es von der CWB Versionen für Unix-Systeme, Mac OS X und Windows. Die CWB selber verfügt über keine grafische Benutzeroberfläche und die Bedienung ist deshalb etwas gewöhnungsbedürftig. Es gibt jedoch CQPweb, die webbasierte grafische Benutzeroberfläche für die CWB, mit der die Bedienung kinderleicht wird.

Es gibt eine Reihe von Korpora, die über CQPweb verfügbar sind. So z.B. das Text+Berg-Korpus, ein Korpus alpinistischer Literatur des Schweizer Alpenclubs SAC, das etwa 35 Mio. laufende Wortformen und alle Ausgaben des "Jahrbuchs" und der Zeitschrift "Alpen" von 1864 bis heute umfasst. Dieses Kapitel erklärt: