Verwendung der annotierten DeReKo-Korpora in COSMAS II
Ein kleinerer Teil des DeReKo, ist mit Wortarten
annotiert, also getagged. Damit werden Suchabfragen möglich, die in den anderen Korpora nicht möglich sind.
Das Archiv "TAGGED - Archiv der morphosyntaktisch annotierten Korpora" enthält diese Korpora. Darauf kann sowohl von der WWW-Version als auch vom PC-Client von COSMAS II aus zugegriffen werden. Der einzige Unterschied besteht darin, dass in der WWW-Version keine grafische Suchabfrage formuliert werden kann.
Wähle also in COSMAS (WWW- oder PC-Client-Version) das Archiv TAGGED. Anschliessend stehen zwei virtuelle Korpora zur Verfügung. Das virtuelle Korpus "annot-TAG - morphosyntaktisch annotierte Korpora" enthält alle öffentlich zugänglichen annotierten Korpora.
Spezielle Suchsyntax
Um auf die Wortarteninformationen zugreifen zu können, ist eine spezielle Suchsyntax erforderlich. Grundsätzlich ist der Operator "MORPH()" dafür zuständig. Der hier verwendeten Annotation liegt das sog.
MECOLB-Minimal-Tagset zugrunde. Das
Tagset legt fest, welche Wortartklassen mit welchen Merkmalen verwendet werden. Eine ausführliche
Tabelle mit den Codes zu den morphologischen Merkmalen findet sich hier.
In der PC-Client-Version gibt es einen
Annotationsassistenten, der bei der Verwendung dieses Operators hilft. Auf den Hilfe-Seiten von COSMAS II ist
die Verwendung gut beschrieben.
Ohne Assistenten muss der Operator selber mit Argumenten (die in den Klammern stehen) gefüllt werden. Das funktioniert so:
Zuerst wird festgelegt, wonach gesucht werden soll. Man möchte z.B. nach "der" suchen, allerdings nur, wenn es sich dabei um ein Relativpronomen im Dativ handelt.
Gemäss Tagset wird "Relativpronomen im Dativ" so umschrieben:
PRN REL DAT
Dieser Ausdruck ist das Argument, das in die Klammern des Operators MORPH gehört:
Lässt man nur danach suchen, erhält man einfach Relativpronomen im Dativ. Nun möchten wir das aber nur auf "der" anwenden. Wir müssen den Operator MORPH() also mit "der" verbinden. Das geschieht, indem wir den
Wortabstandsoperator benutzen, und zwar mit dem Abstand 0. Also:
der /+w0:0 MORPH(PRN REL DAT)
|
Das bedeutet also: Gesucht wird nach "der", das allerdings zusätzlich ein Relativpronomen im Dativ sein muss.
Aufgabe 1
|
|---|
Verwende diese Suchanfrage in COSMAS und analysiere die Ergebnisse. Funktioniert es? Stimmen die Resultate?
|
Natürlich kann man einfach nach Wörtern suchen, die einer bestimmten Wortklasse angehören, ohne ein konkretes Lemma dazu anzugeben. Beispielsweise:
MORPH(NOU DAT) /+w3 MORPH(PRN REL DAT)
|
Gesucht wird damit nach einem Substantiv im Dativ (MORPH(NOU DAT)), dem in einem maximalen Abstand von 3 Wörtern ein Relativpronomen im Dativ (MORPH(PRN REL DAT)) folgt.
Aufgabe 2
|
|---|
Versuche nun folgende Suchanfragen zu formulieren oder finde eigene Fragestellungen, nach denen du suchen kannst!
- Suche Superlative! Anschliessend kannst du noch eine Kookkurrenzanalyse dazu machen.
- Suche Konstruktionen, bei denen nach einem Superlativ ein Verb folgt!
- Suche Adverb-Verb-Konstruktionen!
- Suche Belege für "schön" in adverbialer Funktion!
|
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine
Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006-2010): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.