-
Letzte Artikel
Letzte Kommentare
Archive
Kategorien
Meta
Archiv des Autors: Herr Sprechtakel
LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen
Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit AncConc, Corpus Workbench, kfnGram, Korpustool, LDA-Toolkit, R
1 Kommentar
Wulff’sche Floskeln
Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Floskeln, Politik, Skandal, Sprachgebrauchsmuster
Kommentare deaktiviert
Skandalisierung: Berichterstattung zu Wulff
Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu “Wulff”, die auf Bild.de und … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Adjektive, Deutschland, Skandal, Wahlen, Wulff
Kommentare deaktiviert
Die Karte im Kopf: Über welche Orte schreiben wir?
Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Diskurs, Geotagging, NZZ
Kommentare deaktiviert
Sprechen über Berge
Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel
Verschlagwortet mit Alpen, Bergsteigen, Schweiz, Wortwolke
Kommentare deaktiviert
Deuten Vornamen auf die Parteizugehörigkeit?
Als ich neulich ein Wochenende in der Schweiz war, erschlugen mich beinahe die vielen Wahlplakate für die kommenden National- und Ständeratswahlen. Doch beim Lesen der vielen Namen fragte ich mich, ob es eigentlich möglich ist, vom Vornamen auf die Parteizugehörigkeit … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Sprechtakel
Verschlagwortet mit Schweiz, Vornamen, Wahlen
Kommentare deaktiviert
Wörter, die an einer Stadt kleben: Geocollocations
Paris, Stadt der Liebe, Wuppertal, die Schwebebahn, München, das Oktoberfest: An gewissen Städten kleben Wörter, die wir damit in Verbindung bringen. Ich wollte es genauer wissen. Wie sieht es mit Berlin, Bremen oder Bonn aus? Welche Wörter kleben an den … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Sprechtakel
Verschlagwortet mit Berlin, Deutschland, Geocollocations, Hamburg, Kollokationen, Spiegel Online, Stuttgart, Tübingen
Kommentare deaktiviert
Ich pluseinse dich, wenn du mich nur pluseinstest!
Google+ ist die neue schicke Location im sozialen Web und soll eine Alternative zum blauen Partylokal sein. Neulich beim Stöbern auf den Hilfeseiten von Google+ wurde ich auf folgendes Hilfethema aufmerksam: Die Orthographie in +1 Es geht bei +1 um … Weiterlesen
Veröffentlicht unter Sprechtakel
Verschlagwortet mit Apostroph, Duden, Google, Morphologie, normativ
1 Kommentar
Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)
Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger “TreeTagger” aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit Computerlinguistik, Parser
Kommentare deaktiviert
Päckli und Fränkli/Päckle und Eurole
Ein Bierhersteller wirbt momentan mit einer “Wir im Süden”-Plakatserie. Auf den Plakaten sieht man nicht nur glückliche, junge Menschen im sommerlichen Ambiente, Männer mit Dreitagebart, Frau mit blondem Haar, sondern auch eine linguistische Auffälligkeit: “Wir im Süden: Hier trägt jeder … Weiterlesen
Veröffentlicht unter Sprechtakel
Verschlagwortet mit Deutschland, Dialekt, Diminutiv, Schweiz, Standard
Kommentare deaktiviert