Topic Modeling mit Python

Topic Modeling ist eine sehr verbreitete Methode, um Texte aufgrund ihrer Wortdistribution zu gruppieren: Das Clusteringverfahren findet so Gruppen von ähnlichen Texten, denen man z.B. Themen zuordnen kann.

Die "Programming Historians" bieten eine schöne Erklärung für dieses Clusteringverfahren an: https://programminghistorian.org/en/lessons/topic-modeling-and-mallet. Auf unserer KoDuP-Germanistik-Plattform bieten wir Beispielscripte an, um mit Python Topic Models zu berechnen: https://gitlab.uzh.ch/noah.bubenhofer/kodup-germanistik/-/tree/master/4._Korpusanalyse.