Archiv der Kategorie: Korpustools

Von Schätzen und Monstern. Drei Thesen zu Visualisierungspraktiken in den Digital Humanities

Visualisierungen wissenschaftlicher Daten boomen. Sie werden eingesetzt, um riesige Datenmengen überhaupt überblicken zu können, z.B. indem Beziehungen zwischen Akteuren als Netzwerk visualisiert werden. Dann wird plötzlich sichtbar, welche Akteure besonders eng verbandelt sind und wer besonders einflussreich ist. Solche „visuellen … Weiterlesen

Veröffentlicht unter Korpustools, Visual Linguistics | Verschlagwortet mit , , , , | 2 Kommentare

Anatomie eines Textes: Bildgebendes Verfahren für Textkorpora

Was „zeigt“ sich, wenn eine Maschine einen Text „liest“, also sequenziell Wort für Wort abarbeitet? Eher für didaktische Zwecke habe ich eine kleine Spielerei versucht (und dabei mit P5.js experimentiert):

Veröffentlicht unter Korpuslinguistik, Korpustools, Visual Linguistics | Verschlagwortet mit , , | Kommentare deaktiviert für Anatomie eines Textes: Bildgebendes Verfahren für Textkorpora

Vom Download zum XML-Korpus: Gangbare Wege für die Lehre

Mein Online-Handbuch Korpuslinguistik („Einführung in die Korpuslinguistik„) enthält ein Kapitel zur Erstellung von eigenen Korpora. Es ist dabei das Ziel, einfache Wege zu beschreiben, wie man aus unterschiedlichen Quellen ein Korpus bauen kann – Wege, die auch für technisch weniger … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , , , , , , , | Kommentare deaktiviert für Vom Download zum XML-Korpus: Gangbare Wege für die Lehre

Die typische Bergtour

Als Korpuslinguist kann ich mit Hilfe des Text+Berg-Korpus der alpinistischen Periodika des Schweizer Alpenclubs von 1864 bis heute mal eine empirisch fundierte Geschichte erzählen: Die typische Bergtour. So sieht sie aus (Klick für zoombare SVG-Datei):

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools, Methoden, Sprechtakel, Visual Linguistics | Verschlagwortet mit , , , , , , | Kommentare deaktiviert für Die typische Bergtour

Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

Ich bin etwas stolz auf die folgende Grafik: Allerdings nicht, weil sie besonders schön aussehen würde oder weil der Inhalt sehr überraschend wäre, sondern weil sie methodisch elegant erstellt wurde. Nämlich in R unter direktem Zugriff auf die Corpus Workbench. … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , | Kommentare deaktiviert für Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , , | Ein Kommentar

Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)

Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger „TreeTagger“ aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , | Kommentare deaktiviert für Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)

Korpora und Wirklichkeit

Heute wieder in der Kategorie „Korpuslinguistik“ ganz fachlich/sachlich: Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools | Kommentare deaktiviert für Korpora und Wirklichkeit

Über den Wolken…

Anscheinend besuchte ich länger die Spiegel-Online-Seite nicht mehr: Erst heute fällt mir das neue Design auf. Am 6. September wurde anscheinend Version 7.0 der Nachrichtenseite veröffentlicht. Neu ist in der rechten Spalte die Darstellung „Themen des Tages“: Eine Art Wortwolke … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Kommentare deaktiviert für Über den Wolken…

Zeig mir wo die Bäume stehn!

Beim Wühlen in grossen Korpora sieht man manchmal den Wald vor lauter Bäumen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus. Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Kommentare deaktiviert für Zeig mir wo die Bäume stehn!