-
Letzte Artikel
Letzte Kommentare
Archive
Kategorien
Meta
Archiv der Kategorie: Korpuslinguistik
LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen
Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit AncConc, Corpus Workbench, kfnGram, Korpustool, LDA-Toolkit, R
1 Kommentar
Wulff’sche Floskeln
Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Floskeln, Politik, Skandal, Sprachgebrauchsmuster
Kommentare deaktiviert
Skandalisierung: Berichterstattung zu Wulff
Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu “Wulff”, die auf Bild.de und … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Adjektive, Deutschland, Skandal, Wahlen, Wulff
Kommentare deaktiviert
Die Karte im Kopf: Über welche Orte schreiben wir?
Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Diskurs, Geotagging, NZZ
Kommentare deaktiviert
Sprechen über Berge
Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Alpen, Bergsteigen, Schweiz, Wortwolke
Kommentare deaktiviert
Deuten Vornamen auf die Parteizugehörigkeit?
Als ich neulich ein Wochenende in der Schweiz war, erschlugen mich beinahe die vielen Wahlplakate für die kommenden National- und Ständeratswahlen. Doch beim Lesen der vielen Namen fragte ich mich, ob es eigentlich möglich ist, vom Vornamen auf die Parteizugehörigkeit … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Sprechtakel
Verschlagwortet mit Schweiz, Vornamen, Wahlen
Kommentare deaktiviert
Wörter, die an einer Stadt kleben: Geocollocations
Paris, Stadt der Liebe, Wuppertal, die Schwebebahn, München, das Oktoberfest: An gewissen Städten kleben Wörter, die wir damit in Verbindung bringen. Ich wollte es genauer wissen. Wie sieht es mit Berlin, Bremen oder Bonn aus? Welche Wörter kleben an den … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Sprechtakel
Verschlagwortet mit Berlin, Deutschland, Geocollocations, Hamburg, Kollokationen, Spiegel Online, Stuttgart, Tübingen
Kommentare deaktiviert
Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)
Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger “TreeTagger” aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit Computerlinguistik, Parser
Kommentare deaktiviert
Korpora und Wirklichkeit
Heute wieder in der Kategorie “Korpuslinguistik” ganz fachlich/sachlich: Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools
Kommentare deaktiviert
Intelligenz von gestern: Auch digital
Es ist völlig faszinierend: Die Stadt- und Universitätsbibliothek Bern bietet seit kurzem 31 Jahrgänge des “Intelligenzblattes für die Stadt Bern” zur kostenlosen Nutzung im Web an, wie die NZZ und auch der Bund berichteten. Das Blatt war im 19. Jahrhundert … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik
Kommentare deaktiviert