Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge
Von Noah Bubenhofer, Universität Zürich
Seit über zwei Jahren ist die Einführung in die Korpuslinguistik online! Und sie wird rege benutzt, so z.B. in Veranstaltungen an den Universitäten Heidelberg (Ekkehard Felder), Jena (Peter Gallmann), Zürich (Christa Dürscheid), Kiel (Ulrike Mosel), Leipzig (Uwe Quasthoff), am Institut für Computerlinguistik in Zürich (Simon Clematide); die Website von COSMAS II des IDS, das Korpus Südtirol, die LinseLinks, der Gateway to Corpus Linguistics und die Wikipedia verweisen darauf. Und hin und wieder treffen ermutigende E-Mails ein:
- "ich bin über den link auf yvonne breyer's seite auf deine gekommen - gratulation eine wirklich schöne seite!!! besonders gut gefallen hat mir deine einführung in die korpuslinguistik!"
- "vielen Dank für Ihren On-line-Kurs in Korpuslinguistik. Er ist für Lehrende und Studierende eine große Hilfe!"
- "...die fundierteste Einführung in die Korpuslinguistik im Web – bitte übernehmt aber keinesfalls die schreckliche schweizerische Schreibweise ohne Eszett!"
- "ich schlag mich mit Cosmas rum, Deine Homepage ist dazu die einzige vernüftige Quelle auf dem Netz, vielen Dank dafür."
Das freut mich und ermutigt mich darin, den Kurs weiter auszubauen. Bitte beachten Sie das Impressum!
Eintägiger Kurs zu Korpuslinguistik: Am 5. Juni 2009 findet der Kurs Quantitative Analyse von Texten. Theorie und Methoden zur Untersuchung von Sprachgebrauch in Diskursen statt, in dem ich in die Korpuslinguistik einführe.
Der Kurs bietet folgende Themen:
- Einführung in die Korpuslinguistik: Korpustypen, Erstellung, Annotationen, Anfragesysteme
- Web als Korpus: Wo liegen die Chancen und Risiken der Nutzung des Internets als linguistisches Korpus?
- Überarbeitet: COSMAS II: Eines der wichtigsten Korpora deutscher Sprache des Instituts für Deutsche Sprache (IDS) in Mannheim. Einführung in die Bedienung und die Abfragesprache.
- Erweitert: Weitere Korpora: Kurze Einführungen in weitere wichtige deutschsprachige Korpora.
- Eigenes Korpus: Hilfe und Tipps zur Erstellung eines eigenen Korpus.
- Datenbank Filemaker: Dieses Datenbankprogramm bietet sich an zur einfachen Verwaltung des eigenen Korpus.
- Anwendungen: Beispiele für die Arbeit mit Korpora
- Neu: Statistik: Statistik für die Korpusanalyse
- Visualisierung: Einführung in die Möglichkeiten der Visualisierung von Sprachdaten.
- Anhang: Informationen zu korpuslinguistischer Software, kleine Einführungen in grundlegende Unix-Befehle und in Reguläre Ausdrücke, sowie Literaturhinweise und ein Lexikon.
Ich danke meinen Studentinnen und Studenten für ihre Hinweise, Verbesserungsvorschläge und Korrekturen, die sie mir während des Kurses zukommen liessen!
Noah Bubenhofer, im Juni 2006
Aktualisierungen
- Oktober 2008: Das Kapitel COSMAS II wurde überarbeitet und inhaltlich aktualisiert. Die Informationen zum DWDS-Korpus wurden um eine Kurzanleitung ergänzt.
- August 2008: Das Kapitel Statistik ist eröffnet – und es ist kein gruseliges Kapitel, hoffe ich!
- Mai 2008: Neu ist eine kurze Anleitung zur Verwendung der Concordancing-Software AntConc verfügbar.
- August 2007: Die ersten fünf Kapitel dieses Kurses habe ich leicht aktualisiert und Fehler korrigiert. Neu hinzugekommen sind vor allem Präzisierungen zum Funktionsumfang des COSMAS II-WWW-Clients, der inzwischen fast alles auch kann, was der PC-Client kann.
Korpuslinguistik in Weblogs:
semtracks Political Tracker: U.S. Presidential Campaign '08: A Semantic Matrix Analysis.
In diesem Blog analysiert semtracks den US-Wahlkampf der beiden Kandidaten John McCain und Barack Obama aus linguistischer Sicht. Die maschinellen semantischen Analysen erlauben es, die signifikanten Unterschiede in der Rhetorik der beiden Kandidaten zu messen und damit Zeitgeist zu erfassen. Basis dieser Analysen sind statistische Verfahren der Korpuslinguistik, wie sie teilweise in den Kapiteln dieser Einführung beschrieben werden.
Blog Sprechtakel, linguistische Notizen: Im zwar mittlerweile nicht mehr aktualisierten Weblog zur Korpuslinguistik finden sich eine lose und unsystematische Sammlung an Kommentaren und Hinweisen zum Thema.
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine
Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.
Im BibTeX-Format.