Abfragesysteme für Textkorpora

Wenn schliesslich das Korpus in aufbereiteter Form vorliegt, ist ein Abfragesystem nötig, mit dem man das Korpus bequem nach bestimmten Kriterien durchsuchen, sowie statistische Analysen der Resultate vornehmen kann.

Konkordanzsuche

Konkordanzwerkzeuge erlauben es, schnell nach einer bestimmten Wortform zu suchen, wobei die Resultate meistens in der sog. KWIC-Ansicht (key word in context) dargestellt werden. Dabei befindet sich in der Mitte der Zeile das gesuchte Wort, links und rechts davon jeweils eine Anzahl kontextuelle Wörter.


KWIC-Ansicht von Treffern des Wortes "Korpus" in COSMAS II (IDS Mannheim)

Musterbasierte Suche

Um nicht nur nach konkreten Wörtern suchen zu können, erlauben die Abfragesysteme oft eine eigene Abfragesprache, mit der auch nach den getaggten Metainformationen gesucht werden kann. Wenn man sich beispielsweise Beispiele für einfache Nominalphrasen anzeigen lassen will, möchte man das vielleicht so definieren:

"Finde alle Kombinationen von Token, bei denen es mindestens ein Nomen gibt, wobei davor eventuell ein Artikel steht, gefolgt von eventuell einer oder mehreren Gruppen, die vielleicht aus einem Adverb, sicher aber einem Adjektiv bestehen."

Diese Anfrage versteht das Abfragesystem natürlich nicht. Hingegen versteht es sie in folgender formalisierter Form:

(DET)? ((ADV)? ADJ)* NN

Versuche nun die Bedeutung dieser Formel zu ergründen!