Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge

Von Noah Bubenhofer, semtracks/Institut für Deusche Sprache (IDS), Mannheim

Seit knapp vier Jahren ist die Einführung in die Korpuslinguistik online! Und sie wird rege benutzt, so z.B. in Veranstaltungen an den Universitäten Heidelberg (Ekkehard Felder), Jena (Peter Gallmann), Zürich (Christa Dürscheid), Kiel (Ulrike Mosel), Leipzig (Uwe Quasthoff), Duisburg-Essen (Ulrike Haß), Berlin (DGfS-Tutorium), am Institut für Computerlinguistik in Zürich (Simon Clematide), Hamburg, Mainz, Winterthur, Wien; die Website von COSMAS II des IDS, das Korpus Südtirol, die LinseLinks, der Gateway to Corpus Linguistics und die Wikipedia verweisen darauf. Und hin und wieder treffen ermutigende E-Mails ein:

Das freut mich und ermutigt mich darin, den Kurs weiter auszubauen. Bitte beachten Sie das Impressum!

Der Kurs bietet folgende Themen:

  1. Einführung in die Korpuslinguistik: Korpustypen, Erstellung, Annotationen, Anfragesysteme
  2. Web als Korpus: Wo liegen die Chancen und Risiken der Nutzung des Internets als linguistisches Korpus?
  3. Überarbeitet: DeReKo/COSMAS II: Das Deutsche Referenzkorpus DeReKo des Instituts für Deutsche Sprache (IDS) ist eines der wichtigsten Korpora deutscher Sprache. Einführung in die Bedienung mit COSMAS II.
  4. Weitere Korpora: Kurze Einführungen in weitere wichtige deutschsprachige Korpora.
  5. Eigenes Korpus: Hilfe und Tipps zur Erstellung eines eigenen Korpus.
  6. Datenbank Filemaker: Dieses Datenbankprogramm bietet sich an zur einfachen Verwaltung des eigenen Korpus.
  7. Anwendungen: Beispiele für die Arbeit mit Korpora
  8. Statistik: Statistik für die Korpusanalyse
  9. Visualisierung: Einführung in die Möglichkeiten der Visualisierung von Sprachdaten.
  10. Anhang: Informationen zu korpuslinguistischer Software, kleine Einführungen in grundlegende Unix-Befehle und in Reguläre Ausdrücke, sowie Literaturhinweise und ein Lexikon.

Ich danke meinen Studentinnen und Studenten für ihre Hinweise, Verbesserungsvorschläge und Korrekturen, die sie mir während des Kurses zukommen liessen!

Noah Bubenhofer, im Juni 2006

Aktualisierungen

In eigener Sache

ISBN 978-3-11-021584-7Bubenhofer, Noah: Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. (Sprache und Wissen 4), Berlin/New York, de Gruyter, 2009.
Google Books
PaperC, kostenlos lesen


Korpuslinguistik in Weblogs:

Bundestagswahl '09: Eine Semantische Matrixanalyse
Wie unterscheiden sich in Deutschland SPD, Linke und Grüne in ihrer Wortwahl? Wie nahe stehen sich Schwarz und Grün aus sprachlicher Sicht? semtracks liefert Antworten auf diese und weitere Fragen rund um die wichtigsten Parteien Deutschlands. Bis zur Bundestagswahl am 27. September 2009 werden in regelmäßigen Abständen semantische Analysen publiziert.

semtracks Political Tracker: U.S. Presidential Campaign '08: A Semantic Matrix Analysis.
In diesem Blog analysiert semtracks den US-Wahlkampf der beiden Kandidaten John McCain und Barack Obama aus linguistischer Sicht. Die maschinellen semantischen Analysen erlauben es, die signifikanten Unterschiede in der Rhetorik der beiden Kandidaten zu messen und damit Zeitgeist zu erfassen. Basis dieser Analysen sind statistische Verfahren der Korpuslinguistik, wie sie teilweise in den Kapiteln dieser Einführung beschrieben werden.