Noah Bubenhofer: Einführung in die Korpuslinguistik (Word Embeddings)

Korpora erstellen	Corpus Workbench
Topic Modeling

Word Embeddings mit Python

Die Distributionelle Semantik ist eine schon ältere Theorie, die in neuerer Zeit mit dem Berechnen von sog. "Word Embeddings" mit Methoden des neuronalen Machine Learnings einen enormen Auftrieb erhalten hat. Es ist damit möglich, semantische Räume zu berechnen und darin semantische Ähnlichkeiten zu entdecken, sowie auch andere semantische Relationen.

Im folgenden Screencast erkläre ich die Idee der Word Embeddings in groben Zügen:

Auf unserer KoDuP-Germanistik-Plattform bieten wir Beispielscripte an, um mit Python Word Embeddings zu berechnen und zu visualsieren: https://gitlab.uzh.ch/noah.bubenhofer/kodup-germanistik/-/tree/master/4._Korpusanalyse.

Topic Modeling
Korpora erstellen	Corpus Workbench

Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über eine Mitteilung. Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden: Bubenhofer, Noah (2006-2024): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.