Die Wörter und die Wahrheit: Oder wenn Ich nicht Ich ist

Betrug ist, wenn das, was versprochen, nicht gehalten wird. Das dachten sich enttäusche Leserinnen und Leser des Buches „A Million Little Pieces“ von James Frey. Der Bestseller des Jahres 2005 in den USA erzählt die Geschichte eines geläuterten Drogensüchtigen. Die Leserinnen und Leser waren nicht enttäuscht über die Geschichte; die stiess auf Anklang. Doch zeigten sie sich über den Umstand empört, dass Verlag und Autor die Geschichte als „Memoiren“ verkauften, im Nachhinein jedoch das Online-Magazin „The Smoking Gun“ aufzeigte, dass darin vieles erstunken und erlogen ist.

Betrug! Es kam zur Klage gegen Autor und Verlag. Das Gericht entschied (NZZ vom 15. 9. 2006, S. 43), dass jene, die das Buch vor dem Enthüllungdatum im Glauben gekauft hatten, es handle sich um einen Tatsachenbericht, Anspruch auf Geldrückgabe haben.

Manchmal wird Sprache doch etwas zu wörtlich genommen. Ich weiss nicht, wie es Ihnen geht, aber es war eine meiner ersten und trivialeren Lektüreerkenntnisse, dass das „Ich“ im Buch nicht immer dem „Ich“ des Autors oder der Autorin entspricht – geschweige, dass dieses Ich nur die Wahrheit und nichts als die Wahrheit sagt. Und „Erinnerungen“, „Tagebücher“ und „Memoiren“ erzählen auch selten nur von ihr – lesen Sie einfach mal wieder ihre alten Tagebücher und Sie sehen, was ich meine.

Und trotzdem ist es natürlich von Reiz, mit den passenden Worten Wirkungen zu erzeugen, die man im Nachhinein als unbeabsichtigt darstellen kann. Wie das geht, diskutierten wir ja bereits. Doch manchmal kann das auch gefährlich werden, wie die Folgen einer Papst-Rede aktuell zeigt. Es wäre eigentlich praktisch, wenn man sich in dieser Sache der gleichen Methode bedienen könnte wie im Frey-Fall: Klage, Entschuldigung, gerichtlicher Vergleich: Joseph Ratzinger schreibe doch bitte 10 Mal an die Tafel: „Es tut mir leid, den Islam beleidigt zu haben. Es war nicht meine Absicht. Ich gelobe Besserung.“ Oder so ähnlich. Doch ob das dann auch so wörtlich genommen würde?

Veröffentlicht unter Sprechtakel | Ein Kommentar

Über den Wolken…

Anscheinend besuchte ich länger die Spiegel-Online-Seite nicht mehr: Erst heute fällt mir das neue Design auf. Am 6. September wurde anscheinend Version 7.0 der Nachrichtenseite veröffentlicht.

Neu ist in der rechten Spalte die Darstellung „Themen des Tages“:

Eine Art Wortwolke visualisiert die wichtigen Themen der Stunde: Es handle sich um ein „neues Feature, das Sie so bisher auf keiner Nachrichtenseite finden“, verkündet Spiegel Online, wobei ein Leser im Forum kühl entgegnet, Spiegel sei hier den „jüngsten hypes aufgesprungen (blättern-funktion, themen des tages)“, nichts von Wert also.

Doch was als Wortwolke (engl: Tag cloud) daher kommt, scheint keine zu sein. Spiegel Online schreibt dazu:

Sämtliche Geschichten, die auf SPIEGEL ONLINE erscheinen, werden von der Dokumentationsabteilung des SPIEGEL zeitnah verschlagwortet. Auf der Homepage finden Sie die relevantesten Stichworte der jeweiligen Tageszeit, mit einem schnellen Klick sind sämtliche Geschichten abrufbar, in denen das Thema eine Rolle spielt.

Die Wortwolken jedoch basieren normalerweise auf dem Nutzungsverhalten von Nutzern der Informationen, also z.B. in Blog-Verzeichnissen wie Technorati oder Fotosharing-Diensten wie Flickr. Spiegel Online scheint aber selber festzulegen, was wichtig ist.

Doch Spiegel verspricht Erweiterungen:

Auch dieses Feature werden wir in den nächsten Wochen verbessern. Sie werden schon bald ein aktuelles Register über Personen, Firmen und Länder nutzen können, das den schnellen und zeitsparenden Zugriff auf Ihr Interessengebiet erleichtert.

Das führt im Endausbau zu einem visuell/lexikalischen Interface, das die Archivsuche erleichtern soll. Gleichzeitig ist die Wolke ein Indikator für die Themen, die die Redaktion als relevant einstuft.

Interessanter sind Ansätze, bei denen nicht RedaktorInnen mittels Schlagworten entscheiden, was relevant ist, sondern bei denen (wie oben erwähnt) Nutzerinnen und Nutzer, oder aber Algorithmen dies erledigen. Eine Möglichkeit stellt „Le Nébuloscope“ von Jean Véronis dar, der auf der Basis einer Suchmaschine die assoziierten Wörter zu einem bestimmten Suchwort visualisiert.

Das ist die Wortwolke, die am 12. September 2006 auf den Suchbegriff „9/11“ im Nebuloscope entsteht. Das Abbild eines medial ausgeschlachteten Ereignisses…

Veröffentlicht unter Korpuslinguistik, Korpustools | Kommentare deaktiviert für Über den Wolken…

Vereiteln

Der linguistische Kommentar zum 10. August 2006: Das etymologische Wörterbuch „Kluge“ meint zu vereiteln:

vereiteln swV. (< 14. Jh.). Spätmittelhochdeutsch veritelen. Zu eitel in der alten Bedeutung ‚leer, nichtig‘, also ‚zunichte machen‘.

Die Gebrüder Grimm behandeln vereiteln natürlich auch ausführlich. Und der Wortschatz der Uni Leipzig zeichnet:

Veröffentlicht unter Sprechtakel | 3 Kommentare

Der alte Knacker und die junge Tussi

Wenn der NZZ ein Thema zu unwichtig scheint, zu unernst, zu unseriös, dann verbannt sie es manchmal nicht gänzlich aus dem Blatt, sondern weist es in die Schranken der Rubrik „Nebenbei notiert“ oder „Aufgefallen“. So fühlte sich brh bemüssigt (NZZ vom 11. August, S. 51, kostenpflichtig) eine Antwort in globo auf die „in schöner Regelmässigkeit“ hereinflatternden Leserbriefe zu geben, die alle auf eine Kurzmeldung

„Mehr Betten für Alte in Wetzikon“

vom 7. August Bezug nehmen.

Anscheinend fühlten sich eine grössere Zahl von älteren Mitbürgerinnen und Mitbürger durch das „Alte“ in diesem Titel beleidigt. Man möge sie „Seniorinnen“ und „Senioren“ nennen, nicht „Alte“. Das lässt die NZZ natürlich nicht auf sich sitzen und schreitet zum Gegenschlag:

Die Frage stellt sich nun: Was ist denn, inhaltlich gedacht, der Unterschied zwischen Senioren und Alten?

Da sträuben sich mir natürlich die Nackenhaare: „Inhaltlich gedacht“! Wenn Sprache so einfach wäre. Was, bitteschön, ist denn „inhaltlich gedacht“ der Unterschied zwischen „Polizist“ und „Bulle“? Zwischen „Moneten“ und „Geld“? Zwischen „Tussi“ und „junge Frau“? Eigentlich gibt’s da ja auch keinen Unterschied, oder? Probieren Sie das mal aus, wenn sie das nächste Mal mit Ihrer Bank telefonieren: „Guten Tag. Ich hätte gerne eine Auskunft zu meinem Konto: Die Tussi am Bankschalter sagte mir kürzlich, ich könne meine Moneten besser anlegen, als ich es momentan mache. Was schlagen Sie mir vor?“. Wenn Sie das häufig machen, holen Sie mal noch die Bullen wegen Ehrverletzung!

Die Bedeutung der Wörter – um Wittgenstein zu zitieren – liegt in ihrem Gebrauch. Vielleicht kommen einmal Zeiten, in denen „Tussi“ ohne negative Konnotationen im Sinne von „junge Frau“ verwendet werden kann. Das sind normale Prozesse des Sprachwandels. Die Bedeutung der Wörter ist nicht ein für alle mal fest – und selten logisch. Doch auch davon geht der Artikel aus:

Und wenn das Wort alt verpönt sein sollte, muss dann konsequenterweise auch jung aus dem Vokabular gestrichen werden? Weil jung möglicherweise ebenfalls für „Liebloses“, „Unanständiges“ stehen könnte (faul, frech, konsumsüchtig, laut usw.)?

Tja, so einfach ist es nicht: In den meisten Kontexten ist „jung“ eher positiv konnotiert, „alt“ eher negativ („Der ist halt schon alt…“ vs. „Eine junge, sympathische Frau!“). Doch nicht immer: „Diese Party ist wirklich scheisse; all dieses junge Volk…“

Aber die NZZ gibt sich unbeirrt:

Alt ist unbestrittenermassen das Gegenteil von jung, es gibt Alte und Junge, Junge werden alt, die Alten waren früher einmal jung. So ist der Lauf des menschlichen Lebens. Soll man künftig nur noch von Junioren schreiben dürfen, die eine Lehrstelle suchen?

Nein, „alt“ ist nicht unbestrittenermassen das Gegenteil von „jung“! Manchmal schon, aber nicht immer: junger Anfänger/erfahrener Arbeiter, alter Käse/frischer Käse. Und wenn, dann nur bezüglich des Gemeinten (des Denotats), nicht aber bezüglich der Konnotation: „Die Jungen sind unsere Hoffnung!“ vs. „Die Alten sollen jetzt endlich abtreten!“.

Der Sprachgebrauch richtet sich selten nach den Wörterbüchern und unseren logischen Ableitungen davon. Und so konnte die NZZ vielleicht früher durchaus von den „Alten“ schreiben – heute ist das offensichtlich problematisch. Doch die NZZ, diese alte Tante, ist halt auch nicht immer auf der Höhe der Zeit!

Veröffentlicht unter Sprechtakel | 4 Kommentare

Googles dreizehn Millionen N-Gramme

An der letzten Tagung des Instituts für Deutsche Sprache (IDS) berichtete Thorsten Brants (Google, Mountain View, USA) vom Google’schen Zugang zu Problemen der maschinellen Übersetzung. Um Ambiguitäten, die bei maschineller Übersetzung zwangsweise auftreten, statistisch entscheiden zu können, berechneten sie kurzerhand die statistisch signifikanten 2- bis 5-Gramme (also 2- bis 5-Wortketten) im Sprachgebrauch. Als Korpus diente eine Teilmenge der bei Google für die Websuche indizierten Seiten: 1’011’582’453’213 Wörter! (In Worten: 1.01 Billionen Wörter.)

Schon an der IDS-Tagung versprach Brants, dass diese N-Gramme für wissenschaftliche Zwecke zur Verfügung gestellt würden. Kürzlich haben nun Alex Franz und Thorsten Brants offiziell verlautbart, die 5-Gramme (13’653’070, die häufiger als 200 mal im Korpus erscheinen) im Rahmen des Linguistic Data Consortiums zu veröffentlichen.

Uns ist aktuell noch nicht bekannt, in welcher Form (ausser: auf 6 DVDs) und mit welchen Informationen versehen diese 5-Gramme publiziert werden. Auch bezüglich Sprache(n) herrscht noch Unklarheit; wahrscheinlich handelt es sich beim verwendeten Korpus nur um englischsprachige Texte.

Jedenfalls wird es spannend, diese Datenbasis nicht nur für die (klassischen) Bereiche Maschinelle Übersetzung, Sprach- und Fehlererkennung etc. zu nutzen, sondern z.B. auch für diskursanalytische Fragestellungen.

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Googles dreizehn Millionen N-Gramme

Wilhelm Tell, das Rütli und die Bratwurst in der Pfanne

Während heuer zwar anlässlich des 1.-August-Nationalfeiertags das Rütli, diese mythische Wiese in der Innerschweiz, auf der der Legende nach vor 715 Jahren die Eidgenossenschaft er- und beschworen wurde, vor Rechtsradikalen verschont blieb (NZZ Online: „Schweiz feiert 715. Geburtstag weitgehend ungestört“), kam es jedoch zu einer anderen Katastrophe, auf die mich BH in einer E-Mail aufmerksam machen musste:

Der Monarch im linguistischen Wortreich verweist zwar auf die oberflächlich positive Konnotation des Sachverhalts:

Das «Feuerverbot» inklusive Raketen-Moratorium, welches in diesen Tagen die Frontseiten der Zürcher Presse ziert, tönt vorerst nach einem Schönen Wort. Man denke bloss an den Nahen Osten.

Doch wenn, wie der Blick titelt, bereits „erste Zürcher […] in den Aargau“ fliehen, muss tatsächlich Feuer im Schweizer Dachstock wüten. Yoda weiss nämlich:

In grossen Teilen der Bevölkerung wurde das Verbot nicht verstanden. Inwieweit man sich daran gehalten hat, ist mir nicht bekannt. Beamtentum pur ist das für mich.

Auch parkavenuegirl findet es „dämlich“, wegen grillens von der „Wurstpolizei“ (Blick) angezeigt zu werden.

Es regnete dann aber am 1. August, was Rockhound hämisch kommentieren lässt:

Macht sicherlich Freude auf dem Gurten im Regen zu hocken, eine Bratwurst zu mampfen, die kalt ist, und irgendeinem Schlips beim Lügen zuzuhören. Die Schlipse finden es nämlich cool, am 1. August der Bevölkerung in einer Rede das Blaue vom Himmel zu versprechen (das wir heute wohl kaum zu Gesicht bekommen werden).

(Anmerkung für Jargon-Unkundige: Der „Gurten“ ist Berns Hausberg und ein „Schlips“ die pars-pro-toto-Bezeichnung für einen Schlipsträger, sprich kleinbürgerlichen Politiker.)

Der Blick hat also schon recht: Das reinste „Chaos nach GRILL-Verbot“. Und es gibt Stimmen, die bereits zum Sturm auf die Bastille auf die zu vollmächtige Verwaltung blasen:

Auf welche gesetzliche Bestimmung sich das Verbot stützt, wird in der Medienmitteilung natürlich nicht mitgeteilt – und von den dafür zuständigen Medien auch nicht hinterfragt. Der grillierende Bürger und die grillierende Bürgerin haben das Verbot zu schlucken. Punkt. Das Gesetz über die Feuerpolizei und das Feuerwehrwesen […] gibt darüber auch keine Auskunft. Trotzdem ist zu vermuten, dass es irgendwo eine Generalvollmacht an dieses Organ gibt. Genau diese Art von Vollmacht lässt einen diskretionären Spielraum entstehen, innerhalb dessen die Verwaltung machen kann, was ihr gerade passt. […] Es ist zu hoffen, dass ordnungspolitische Kantonsräte Informationen einfordern und versuchen, den Spielraum der Verwaltung zu verkleinern. (Ordnungspolitischer Blog)

Und damit wären wir wieder beim Enstehungsmythos der Schweiz: „Wann wird der Retter kommen diesem Lande?“ lässt Schiller in „Wilhelm Tell“ die von den Österreichern verjagten Bauern klagen. „Wir wollen sein ein einzig Volk von Brüdern, / In keiner Not uns trennen und Gefahr“ war die Antwort damals. Anscheinend auch wieder heute: Greift zu den Würsten, ihr tapferen Mannen!

Veröffentlicht unter Sprechtakel | 3 Kommentare

Mittelalterliche Handschriften: Digital

Historische elektronische Korpora sind Mangelware. Erfreulich, dass nun 100 mittelalterliche Handschriften der Stiftsbibliothek St. Gallen digital und für wissenschaftliche Zwecke frei verfügbar sind.

(Cod. Sang. 658, Teil 1, 11: Robertus Monachus: Geschichte des 1. Kreuzzugs, bebildert)

Im Rahmen des Projekts Codices Electronici Sangallenses (CESG) wurden die Handschriften professionell fotografiert und stehen nun in einer virtuellen Bibliothek zur Verfügung. Die Digitalisierung beschränkte sich verständlicherweise auf das Erfassen der Handschriften als Bilder – eine Suche im Inhalt oder die maschinelle Auswertung desselben sind deshalb nicht möglich. (Via Recherchen-Blog)

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Mittelalterliche Handschriften: Digital

Die Post bringt und bringt und bringt und bringt und bringt. Oder: Die Umkehrung kommunikativer Rollen im beginnenden 21. Jahrhundert

Nachdem ich mich bei hochgradigen Temperaturen durch die Stadt gekämpft hatte und schweisselnd, müde, aber froh zuhause eintraf und den Briefkasten leerte, fand sich darin das:

Wer immer mir das wünschte: Es ist in Erfüllung gegangen, wie mein in diesen Tagen eben verheilte Sonnenbrand am Nacken zeigte. Also, wer ist da so freundlich? PostMail… Weiterlesen

Veröffentlicht unter Sprechtakel | Ein Kommentar

Die Hitze: Die Bilder!

Der Unterschied zwischen der NZZ und dem Blick liegt eigentlich darin, dass letzteren auch bei den hinterletzten Sommerlochthemen die Bilder nicht ausgehen, während erstere zwar die Gefahr des Unbebilderten Artikels sehen, jedoch keine Lösung finden:

Im Vergleich:

Ich will ein NZZ-Thermometer!

Nachtrag: Die Schöne von Hägendorf auf dem Blick-Titelbild („Jetzt fehlt mir nur noch der richtige Mann“) verhalf der Zeitung heute (24. Juli 2006, nur Print) zu zwei weiteren Seiten der Berichterstattung: Die Redaktion erhielt natürlich ‚zig SMS und E-Mails von Jungs, die finden, ihr richtiger Mann sein zu können… Das ist die hohe Kunst der Mehrfachverwertung von Content!

Veröffentlicht unter Sprechtakel | Ein Kommentar

Zeig mir wo die Bäume stehn!

Beim Wühlen in grossen Korpora sieht man manchmal den Wald vor lauter Bäumen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus.

Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der Linguistik haben sich hier interessante Lösungen ergeben, die sich die einfache Verfügbarkeit von Daten jeglicher Art übers Web zu Nutze machen. Schon länger online, aber nach wie vor interessant, die „Newsmap“. Sie stellt die von Google (maschinell) zusammengestellten Nachrichten grafisch dar:

Auf einen Blick ist ersichtlich, welche Nachrichten aktuell besonders häufig zitiert sind (und damit anscheinend als wichtig angesehen werden). Die Karte lässt sich nach Ländern und Ressorts getrennt zeichnen und erlaubt damit den Vergleich der Nachrichtenstrukturen.

Ähnlich funktioniert das „Themenbarometer“ bei Weblog-Portalen, beispielsweise bei Technorati.com. Weil Blog-Einträge hochgradig strukturiert sind (RSS-Feeds), lassen sie sich sehr einfach maschinell auslesen. So z.B. die sog. „Tags“, die Themenstichwörter, die die AutorInnen den Einträgen zufügen. In einer „Typografik“ werden diese Tags nach ihrer aktuellen Frequenz gewichtet dargestellt:

Aus korpuslinguistischer Sicht ist das alles sehr nett – aber der Spass könnte hier erst beginnen! Statt Inhaltswörter zu beachten (Blog-Tags) oder Schlagzeilen (Newsmap, Google News) könnte man auch andere sprachliche Strukturen visualisieren. Z.B. die aktuellen signifikanten Kookkurrenzen von Nachrichtentexten? Oder die Veränderungen derselben im Vergleich zum Vormonat? Bestimmte Begriffsfelder im Verlauf der Dekaden in einem historischen Korpus? Syntaktisch-stilistische Merkmale in Web-Texten zur Textsortenspezifizierung? Der Ideen gäbe es noch viele!

Herr Sprechtakel visualisierte bereits das semantische Feld von Atom- und Kernkraftwerken oder verwendete bestehende Visualisierungswerkzeuge, um der Vogelgrippe auf die Schliche zu kommen. Oder er suchte die Bundeskanzlerin in der Bärenhöhle und fragte nach der Swissness. Alles erst ein Anfang.

Veröffentlicht unter Korpuslinguistik, Korpustools | Kommentare deaktiviert für Zeig mir wo die Bäume stehn!