Korpora und Wirklichkeit

Heute wieder in der Kategorie „Korpuslinguistik“ ganz fachlich/sachlich:

  • Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer Infobroker Beatrice Krauser und Andreas Litscher. Interessant ist auch der Rest des Linksverzeichnisses.
  • Von der Fachzeitschrift Linguistik Online ist eine neue Ausgabe zur Korpuslinguistik erschienen: „Korpuslinguistik im Zeitalter der Textdatenbanken“ heisst die Ausgabe, die vom Neuchâteler Linguisten Anton Näf herausgegeben wurde. Duffner und Näf bringen eine nützliche Übersicht (linguistischer) digitaler Textdatenbanken, Teubert fragt nach dem Verhältnis von Wirklichkeit und Korpus, Berthele widerspricht Teuberts Aussagen und Bickel lotet die Möglichkeiten des Internets als Korpus aus. Dies nur vier der neun Artikel zum Thema.
  • Die Initiative „TextGrid“ hat ihren ersten Newsletter verschickt. TextGrid bemüht sich darum, eine Plattform für philologische digitale Texteditionen zu schaffen. Dabei sollen Standards und gemeinsame Schnittstellen erarbeitet werden, um es der wissenschaftlichen Gemeinschaft zu ermöglichen, einfach mit mehreren Textquellen (oder Korpora) zu arbeiten.
  • Das Wortschatz-Projekt der Universität Leipzig hat einen neuen grafischen Auftritt und erlaubt (neuerdings?) den Download der Korpora. Es handelt sich um im Web öffentlich publizierte Texte (also z.B. Nachrichtentexte), bei denen die Satzordnung jedoch nicht mehr intakt ist (dies um Copyright-Problemen aus dem Weg zu gehen). Dafür sind Informationen zu den Kookkurrenzen der einzelnen Token integriert.
  • Und zu guter Letzt der Hinweis auf die 2007er Ausgabe der International Conference on Weblogs and Social Media in Boulder, Colorado, USA. Die Organisatoren stellen den Forscherinnen und Forscher zudem ein Korpus von 14 Mio. Weblog-Beiträgen zur Verfügung, in Englisch, Chinesisch, Japanisch, Russisch, Spanisch, Französisch und Italienisch – leider nicht Deutsch…
Dieser Beitrag wurde unter Korpora, Korpuslinguistik, Korpustools veröffentlicht. Setze ein Lesezeichen auf den Permalink.