{"id":47,"date":"2006-07-20T20:04:38","date_gmt":"2006-07-20T20:04:38","guid":{"rendered":"http:\/\/bubenhofer.com\/sprechtakel\/?p=47"},"modified":"2006-07-20T20:04:38","modified_gmt":"2006-07-20T20:04:38","slug":"zeig-mir-wo-die-ba%c2%a4ume-stehn","status":"publish","type":"post","link":"https:\/\/www.bubenhofer.com\/sprechtakel\/2006\/07\/20\/zeig-mir-wo-die-ba%c2%a4ume-stehn\/","title":{"rendered":"Zeig mir wo die B\u00e4ume stehn!"},"content":{"rendered":"<p>Beim W\u00fchlen in grossen Korpora sieht man manchmal den Wald vor lauter B\u00e4umen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus.<\/p>\n<p>Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der Linguistik haben sich hier interessante L\u00f6sungen ergeben, die sich die einfache Verf\u00fcgbarkeit von Daten jeglicher Art \u00fcbers Web zu Nutze machen. Schon l\u00e4nger online, aber nach wie vor interessant, die <a href=\"http:\/\/www.marumushi.com\/apps\/newsmap\/index.cfm\">&#8222;Newsmap&#8220;<\/a>. Sie stellt die von <a href=\"http:\/\/www.google.com\/news\">Google (maschinell) zusammengestellten Nachrichten<\/a> <a href=\"http:\/\/www.marumushi.com\/apps\/newsmap\/newsmap.cfm\">grafisch dar<\/a>:<\/p>\n<p><img decoding=\"async\" width='450' height='290' style=\"border: 0px; padding-left: 5px; padding-right: 5px;\" src=\"\/sprechtakel\/uploads\/newsmap_screenshot.png\" alt=\"\" \/><\/p>\n<p>Auf einen Blick ist ersichtlich, welche Nachrichten aktuell besonders h\u00e4ufig zitiert sind (und damit anscheinend als wichtig angesehen werden). Die Karte l\u00e4sst sich nach L\u00e4ndern und Ressorts getrennt zeichnen und erlaubt damit den Vergleich der Nachrichtenstrukturen.<\/p>\n<p>\u00c4hnlich funktioniert das &#8222;Themenbarometer&#8220; bei Weblog-Portalen, beispielsweise bei <a href=\"http:\/\/www.technorati.com\">Technorati.com<\/a>. Weil Blog-Eintr\u00e4ge hochgradig strukturiert sind (RSS-Feeds), lassen sie sich sehr einfach maschinell auslesen. So z.B. die sog. &#8222;Tags&#8220;, die Themenstichw\u00f6rter, die die AutorInnen den Eintr\u00e4gen zuf\u00fcgen. In einer <a href=\"http:\/\/www.technorati.com\/tags\/\">&#8222;Typografik&#8220;<\/a> werden diese Tags nach ihrer aktuellen Frequenz gewichtet dargestellt:<\/p>\n<p><img decoding=\"async\" width='450' height='135' style=\"border: 0px; padding-left: 5px; padding-right: 5px;\" src=\"\/sprechtakel\/uploads\/technorati_tags.png\" alt=\"\" \/><\/p>\n<p>Aus korpuslinguistischer Sicht ist das alles sehr nett \u2013 aber der Spass k\u00f6nnte hier erst beginnen! Statt Inhaltsw\u00f6rter zu beachten (Blog-Tags) oder Schlagzeilen (Newsmap, Google News) k\u00f6nnte man auch andere sprachliche Strukturen visualisieren. Z.B. die aktuellen signifikanten Kookkurrenzen von Nachrichtentexten? Oder die Ver\u00e4nderungen derselben im Vergleich zum Vormonat? Bestimmte Begriffsfelder im Verlauf der Dekaden in einem historischen Korpus? Syntaktisch-stilistische Merkmale in Web-Texten zur Textsortenspezifizierung? Der Ideen g\u00e4be es noch viele!<\/p>\n<p>Herr Sprechtakel visualisierte bereits das semantische Feld von <a href=\"http:\/\/www.bubenhofer.com\/sprechtakel\/wrapper.php?\/archives\/36-Von-Kernen-und-Atomen.html\">Atom- und Kernkraftwerken<\/a> oder verwendete bestehende Visualisierungswerkzeuge, um der <a href=\"http:\/\/www.bubenhofer.com\/sprechtakel\/wrapper.php?\/archives\/26-Ein-mysterioeses-Hongkonger-Virus.html\">Vogelgrippe auf die Schliche zu kommen<\/a>. Oder er suchte die <a href=\"http:\/\/www.bubenhofer.com\/sprechtakel\/wrapper.php?\/archives\/14-Bundeskanzlerin-in-der-Baerenhoehle.html\">Bundeskanzlerin in der B\u00e4renh\u00f6hle<\/a> und fragte nach der <a href=\"http:\/\/www.bubenhofer.com\/sprechtakel\/wrapper.php?\/archives\/7-Swissness.html\">Swissness<\/a>. Alles erst ein Anfang.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Beim W\u00fchlen in grossen Korpora sieht man manchmal den Wald vor lauter B\u00e4umen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus. Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der &hellip; <a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/2006\/07\/20\/zeig-mir-wo-die-ba%c2%a4ume-stehn\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4,7],"tags":[],"class_list":["post-47","post","type-post","status-publish","format-standard","hentry","category-4-korpuslinguistik","category-6-korpustools"],"_links":{"self":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts\/47","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/comments?post=47"}],"version-history":[{"count":0,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts\/47\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/media?parent=47"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/categories?post=47"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/tags?post=47"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}