Archiv der Kategorie: Korpora

Korpora und Wirklichkeit

Heute wieder in der Kategorie „Korpuslinguistik“ ganz fachlich/sachlich: Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools | Kommentare deaktiviert für Korpora und Wirklichkeit

Intelligenz von gestern: Auch digital

Es ist völlig faszinierend: Die Stadt- und Universitätsbibliothek Bern bietet seit kurzem 31 Jahrgänge des „Intelligenzblattes für die Stadt Bern“ zur kostenlosen Nutzung im Web an, wie die NZZ und auch der Bund berichteten. Das Blatt war im 19. Jahrhundert … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Intelligenz von gestern: Auch digital

Googles dreizehn Millionen N-Gramme

An der letzten Tagung des Instituts für Deutsche Sprache (IDS) berichtete Thorsten Brants (Google, Mountain View, USA) vom Google’schen Zugang zu Problemen der maschinellen Übersetzung. Um Ambiguitäten, die bei maschineller Übersetzung zwangsweise auftreten, statistisch entscheiden zu können, berechneten sie kurzerhand … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Googles dreizehn Millionen N-Gramme

Mittelalterliche Handschriften: Digital

Historische elektronische Korpora sind Mangelware. Erfreulich, dass nun 100 mittelalterliche Handschriften der Stiftsbibliothek St. Gallen digital und für wissenschaftliche Zwecke frei verfügbar sind. (Cod. Sang. 658, Teil 1, 11: Robertus Monachus: Geschichte des 1. Kreuzzugs, bebildert) Im Rahmen des Projekts … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Mittelalterliche Handschriften: Digital

Tübinger Baumbank aktualisiert

Die 470’000 Wörter aus der taz (die tageszeitung) umfassende Tübinger Baumbank des Deutschen/Schriftsprache ist in Release 3 erweitert worden. Es ist bereits morphosyntaktsich annotiert. Neu finden sich darin auch Annotationen von Anaphern- und Koreferenzrelationen. Die Baumbank kann in verschiedenen Formaten … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik | Kommentare deaktiviert für Tübinger Baumbank aktualisiert