Archiv der Kategorie: Korpuslinguistik

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , , | 1 Kommentar

Wulff’sche Floskeln

Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert

Skandalisierung: Berichterstattung zu Wulff

Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu “Wulff”, die auf Bild.de und … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , , | Kommentare deaktiviert

Die Karte im Kopf: Über welche Orte schreiben wir?

Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , | Kommentare deaktiviert

Sprechen über Berge

Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert

Deuten Vornamen auf die Parteizugehörigkeit?

Als ich neulich ein Wochenende in der Schweiz war, erschlugen mich beinahe die vielen Wahlplakate für die kommenden National- und Ständeratswahlen. Doch beim Lesen der vielen Namen fragte ich mich, ob es eigentlich möglich ist, vom Vornamen auf die Parteizugehörigkeit … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , | Kommentare deaktiviert

Wörter, die an einer Stadt kleben: Geocollocations

Paris, Stadt der Liebe, Wuppertal, die Schwebebahn, München, das Oktoberfest: An gewissen Städten kleben Wörter, die wir damit in Verbindung bringen. Ich wollte es genauer wissen. Wie sieht es mit Berlin, Bremen oder Bonn aus? Welche Wörter kleben an den … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , , , , , | Kommentare deaktiviert

Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)

Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger “TreeTagger” aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , | Kommentare deaktiviert

Korpora und Wirklichkeit

Heute wieder in der Kategorie “Korpuslinguistik” ganz fachlich/sachlich: Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools | Kommentare deaktiviert

Intelligenz von gestern: Auch digital

Es ist völlig faszinierend: Die Stadt- und Universitätsbibliothek Bern bietet seit kurzem 31 Jahrgänge des “Intelligenzblattes für die Stadt Bern” zur kostenlosen Nutzung im Web an, wie die NZZ und auch der Bund berichteten. Das Blatt war im 19. Jahrhundert … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert