Archiv des Autors: Herr Sprechtakel

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , , | 1 Kommentar

Wulff’sche Floskeln

Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert

Skandalisierung: Berichterstattung zu Wulff

Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu “Wulff”, die auf Bild.de und … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , , | Kommentare deaktiviert

Die Karte im Kopf: Über welche Orte schreiben wir?

Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , | Kommentare deaktiviert

Sprechen über Berge

Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert

Deuten Vornamen auf die Parteizugehörigkeit?

Als ich neulich ein Wochenende in der Schweiz war, erschlugen mich beinahe die vielen Wahlplakate für die kommenden National- und Ständeratswahlen. Doch beim Lesen der vielen Namen fragte ich mich, ob es eigentlich möglich ist, vom Vornamen auf die Parteizugehörigkeit … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , | Kommentare deaktiviert

Wörter, die an einer Stadt kleben: Geocollocations

Paris, Stadt der Liebe, Wuppertal, die Schwebebahn, München, das Oktoberfest: An gewissen Städten kleben Wörter, die wir damit in Verbindung bringen. Ich wollte es genauer wissen. Wie sieht es mit Berlin, Bremen oder Bonn aus? Welche Wörter kleben an den … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , , , , , | Kommentare deaktiviert

Ich pluseinse dich, wenn du mich nur pluseinstest!

Google+ ist die neue schicke Location im sozialen Web und soll eine Alternative zum blauen Partylokal sein. Neulich beim Stöbern auf den Hilfeseiten von Google+ wurde ich auf folgendes Hilfethema aufmerksam: Die Orthographie in +1 Es geht bei +1 um … Weiterlesen

Veröffentlicht unter Sprechtakel | Verschlagwortet mit , , , , | 1 Kommentar

Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)

Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger “TreeTagger” aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , | Kommentare deaktiviert

Päckli und Fränkli/Päckle und Eurole

Ein Bierhersteller wirbt momentan mit einer “Wir im Süden”-Plakatserie. Auf den Plakaten sieht man nicht nur glückliche, junge Menschen im sommerlichen Ambiente, Männer mit Dreitagebart, Frau mit blondem Haar, sondern auch eine linguistische Auffälligkeit: “Wir im Süden: Hier trägt jeder … Weiterlesen

Veröffentlicht unter Sprechtakel | Verschlagwortet mit , , , , | Kommentare deaktiviert