Word Embeddings mit Python

Die Distributionelle Semantik ist eine schon ältere Theorie, die in neuerer Zeit mit dem Berechnen von sog. "Word Embeddings" mit Methoden des neuronalen Machine Learnings einen enormen Auftrieb erhalten hat. Es ist damit möglich, semantische Räume zu berechnen und darin semantische Ähnlichkeiten zu entdecken, sowie auch andere semantische Relationen.

Im folgenden Screencast erkläre ich die Idee der Word Embeddings in groben Zügen:

Auf unserer KoDuP-Germanistik-Plattform bieten wir Beispielscripte an, um mit Python Word Embeddings zu berechnen und zu visualsieren: https://gitlab.uzh.ch/noah.bubenhofer/kodup-germanistik/-/tree/master/4._Korpusanalyse.