{"id":684,"date":"2022-12-08T12:59:32","date_gmt":"2022-12-08T11:59:32","guid":{"rendered":"https:\/\/www.bubenhofer.com\/sprechtakel\/?p=684"},"modified":"2023-02-27T22:57:47","modified_gmt":"2023-02-27T21:57:47","slug":"wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-1","status":"publish","type":"post","link":"https:\/\/www.bubenhofer.com\/sprechtakel\/2022\/12\/08\/wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-1\/","title":{"rendered":"Wie wir in Zukunft wissenschaftliche Texte schreiben (k\u00f6nnten) \u2013 Teil 1"},"content":{"rendered":"\n<p>Radikale Ver\u00e4nderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. K\u00fcnstliche Intelligenz kann automatisch Texte verfassen, \u00fcbersetzen und redigieren. Trotzdem plagen wir uns noch immer mit Textverarbeitungsprogrammen, die zwischen Schreibmaschine und Code-Editor stecken geblieben sind. Und in den Wissenschaften wird noch immer dar\u00fcber gestritten, was die richtige Publikationssprache ist, wie zitiert werden soll und wie Plagiate entdeckt werden k\u00f6nnen. In naher Zukunft k\u00f6nnte sich das Schreiben von wissenschaftlichen Texten so stark ver\u00e4ndert haben, dass diese Fragen obsolet geworden sind. Dies ist Teil 1 einer Serie.<\/p>\n\n\n\n<!--more-->\n\n\n\n<h2 class=\"wp-block-heading\">Thesen<\/h2>\n\n\n\n<p>Wenn es um das Schreiben von wissenschaftlichen Texten geht, zu dem ich auch die Recherche z\u00e4hle, dann k\u00f6nnte es in den kommenden Jahren zu grossen Ver\u00e4nderungen kommen. Das hat etwas zu tun mit den neuen M\u00f6glichkeiten von grossen Sprachmodellen, die f\u00fcr K\u00fcnstliche Intelligenz verwendet werden, wie das z.B. bei <a href=\"https:\/\/openai.com\/blog\/chatgpt\/\">ChatGPT<\/a> gerade sichtbar ist. Aber es h\u00e4ngt auch damit zusammen, dass sich nun endlich die M\u00f6glichkeit ergibt, Schreiben mit Computern nicht mehr als besseres Schreiben mit Schreibmaschinen aufzufassen, sondern ganz neu zu denken.<\/p>\n\n\n\n<p>Hier die f\u00fcnf Thesen, \u00fcber die ich im Folgenden schreiben m\u00f6chte:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Schreib- und Rechercheunterst\u00fctzung durch KI: <\/strong>Systeme der K\u00fcnstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.<\/li>\n\n\n\n<li><strong>Die Frage nach der richtigen Publikationssprache ist obsolet:<\/strong> Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren m\u00f6chten. (<a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/2022\/12\/18\/wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-2\/\">Vgl. dazu Teil 2.<\/a>)<\/li>\n\n\n\n<li><strong>Vorgaben von Institutionen und Disziplinen zu bestimmten Bibliographieformaten sind \u00fcberfl\u00fcssig:<\/strong> Zitation kann endlich v\u00f6llig losgel\u00f6st von Formalit\u00e4ten betrachtet werden. (<a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/2023\/02\/27\/wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-3\/\">Vgl. dazu Teil 3.<\/a>)<\/li>\n\n\n\n<li><strong>Keine Plagiate mehr: <\/strong>Weil Zitation und \u00dcbernahme von Ideen sowieso technisch anders gel\u00f6st werden und Rechercheprozesse mit KI-Unterst\u00fctzung anders verlaufen, wird es auch keine Plagiate mehr im eigentlichen Sinn geben.<\/li>\n\n\n\n<li><strong>Andere Maschinen und Programme: <\/strong>Die Maschinen und Programme, mit denen wir wissenschaftliche Texte schreiben, m\u00fcssen sich radikal ver\u00e4ndern. Word &amp; Co, OpenOffice aber auch LaTeX oder kollaborative Software wie Google Docs, Onlyoffice etc. sind v\u00f6llig ungeeignete Tools. Auch die Computersysteme, mit denen wir arbeiten (Laptops, externe Bildschirme, Tastaturen, Tablets), sind ungeeignet.<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">Schreib- und Rechercheunterst\u00fctzung durch KI<\/h2>\n\n\n\n<p>Till Heilmann unterscheidet in seinem Buch &#8222;<a href=\"https:\/\/www.transcript-verlag.de\/978-3-8376-1333-9\/textverarbeitung\/\">Textverarbeitung<\/a>&#8220; drei Arten des Schreibens mit und f\u00fcr den Computer: Schreiben f\u00fcr den Computer, aber nicht mit den Computer (z.B. Programmieren mit Lochkarten), Schreiben f\u00fcr den Computer und mit dem Computer (Programmierung in einem Editor auf dem Computer) und Schreiben mit dem Computer aber nicht f\u00fcr den Computer: Klassische Textverarbeitung.<\/p>\n\n\n\n<p>Diese drei Typen des Schreiben haben historisch auch die Entwicklung von Maschinen und Programmen gepr\u00e4gt: Die mechanische Schreibmaschine wurde von der elektrischen abgel\u00f6st, die dank Speicher eine erste Entfernung von Tippen und Drucken erm\u00f6glichte: Vor der Ausgabe der Zeile auf das Papier konnte die Eingabe \u00fcberpr\u00fcft und ggf. korrigiert werden.<\/p>\n\n\n\n<p>Die ersten Computer wurden programmiert, indem Stecker gesteckt oder sp\u00e4ter Lochkarten gestanzt worden sind: Die Planung und das Verfassen des Programms geschah ausserhalb des Computers, was auf Dauer unpraktisch war: So wurden die Idee geboren, Computern ein Betriebssystem zu geben und darauf aufbauende Software, Editoren, mit denen das Programm direkt auf dem Computer erstellt und dessen Ausf\u00fchrung \u00fcberwacht und das Programm sofort korrigiert werden konnte.<\/p>\n\n\n\n<p>Erst danach entstand die Idee, solche Editoren auch f\u00fcr das Schreiben von beliebigen anderen Texten zu verwenden und somit die Vorteile der Live-Beeinflussung eines Textes, die mit dem Computer m\u00f6glich geworden ist, zu nutzen.<\/p>\n\n\n\n<p>Diese beiden Entwicklungsstr\u00e4nge \u2013 programmieren (schreiben f\u00fcr den Computer) und schreiben (f\u00fcr uns) \u2013&nbsp;f\u00fchrten zu zwei unterschiedlichen Textverarbeitungssoftware-Typen:<\/p>\n\n\n\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\" style=\"flex-basis:100%\">\n<div class=\"wp-block-columns is-layout-flex wp-container-core-columns-is-layout-9d6595d7 wp-block-columns-is-layout-flex\">\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-full is-resized\"><a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-12.27.04.png\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-12.27.04.png\" alt=\"\" class=\"wp-image-686\" width=\"302\" height=\"288\" srcset=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-12.27.04.png 739w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-12.27.04-300x286.png 300w\" sizes=\"auto, (max-width: 302px) 100vw, 302px\" \/><\/a><figcaption class=\"wp-element-caption\">Editor: Hier BBEdit f\u00fcr Mac 12.67<\/figcaption><\/figure>\n<\/div>\n\n\n\n<div class=\"wp-block-column is-layout-flow wp-block-column-is-layout-flow\">\n<figure class=\"wp-block-image size-large\"><a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"912\" src=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-1024x912.png\" alt=\"\" class=\"wp-image-689\" srcset=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-1024x912.png 1024w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-300x267.png 300w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-768x684.png 768w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-1536x1368.png 1536w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/Bildschirm\u00adfoto-2022-12-03-um-20.40.26-2048x1824.png 2048w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><\/a><figcaption class=\"wp-element-caption\">Word Processor: Hier Microsoft Word f\u00fcr Mac 16.66<\/figcaption><\/figure>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n\n\n\n<p>In beiden kann beides gemacht werden. Ein Editor zeichnet sich jedoch dadurch aus, dass sein Dateiformat ein sog. txt-Format ist, also problemlos in jedem beliebigen Editor ge\u00f6ffnet werden kann. Zudem bietet er meistens sog. &#8222;Syntax Highlighting&#8220;, zeichnet also Strukturelemente und Befehle einer Programmiersprache farbig aus und bietet verschiedene Hilfestellungen f\u00fcr das Schreiben des Programmcodes. Zudem spielt der Druck eine untergeordnete Rolle: Die L\u00e4nge des Textes orientiert sich nicht an <em>Seiten<\/em>, sondern an <em>Zeilen<\/em>. Wenn aus der Text- oder Programmstruktur eine logische Hierarchie ableitbar ist, hat diese Auswirkungen auf die verschiedenen Visualisierungen des Textes: Zeilen, die hierarchisch einer anderen Zeile untergeordnet sind, k\u00f6nnen z.B. ein- und ausgeklappt werden.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/schreibmaschinen.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1000\" height=\"750\" src=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/schreibmaschinen.png\" alt=\"\" class=\"wp-image-694\" srcset=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/schreibmaschinen.png 1000w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/schreibmaschinen-300x225.png 300w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/schreibmaschinen-768x576.png 768w\" sizes=\"auto, (max-width: 1000px) 100vw, 1000px\" \/><\/a><figcaption class=\"wp-element-caption\">Elektrische (IBM 6783) und mechanische (Hermes Media 3) Schreibmaschinen in Noahs Machines-Cultures-Lab<\/figcaption><\/figure>\n\n\n\n<p>Ganz anders die Textverarbeitung: Sie zeigt noch immer Spuren der mechanischen Schreibmaschine: Es gibt einzustellende R\u00e4nder, Tabulatoren und eine grunds\u00e4tzliche Orientierung an Seiten. Sie widerspiegeln jedoch auch die Bed\u00fcrfnisse des Satzes und Drucks: Auszeichnungen spielen eine grosse Rolle: Fettdruck, kursiv, unterstrichen. Es k\u00f6nnen Schriftarten und -gr\u00f6ssen ausgew\u00e4hlt und der Text gestaltet werden. Die meisten Textverarbeitungen folgen dem WYSIWYG-Prinzip: What you see is what you get, die Darstellung auf dem Bildschirm entspricht dem Druck. <a href=\"https:\/\/en.wikipedia.org\/wiki\/Bravo_(editor)\">Bravo<\/a>, von Xerox Parc 1974 ver\u00f6ffentlicht, gilt als erstes Textverarbeitungsprogramm mit grafischer Benutzeroberfl\u00e4che und WYSIWYG.<\/p>\n\n\n\n<p>Die Textverarbeitung bietet jedoch noch mehr: <em>Formatvorlagen<\/em>. Ein Konzept, das mit dem Editor mehr gemeinsam hat. Es handelt sich dabei um <em>logische<\/em> statt <em>grafische<\/em> Auszeichnungen: Titel 1. Ordnung, 2. Ordnung, Hervorhebung etc. werden Abs\u00e4tzen oder Zeichenketten zugewiesen. Die grafische Darstellung dieser Kategorien kann im Nachhinein beliebig ge\u00e4ndert werden und es ist ein Leichtes, aus einem so formatierten Text automatisch die Titel auszulesen und ein Inhaltsverzeichnis zu erstellen.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/computergenerationen.jpg\"><img loading=\"lazy\" decoding=\"async\" width=\"1000\" height=\"750\" src=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/computergenerationen.jpg\" alt=\"\" class=\"wp-image-695\" srcset=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/computergenerationen.jpg 1000w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/computergenerationen-300x225.jpg 300w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/computergenerationen-768x576.jpg 768w\" sizes=\"auto, (max-width: 1000px) 100vw, 1000px\" \/><\/a><figcaption class=\"wp-element-caption\">Computergenerationen und Generationen von Textverarbeitungsprogrammen: Macintosh IIci, Macintosh Plus (mit MacWrite) und Apple II (mit Apple Writer II) in Noahs Machine-Cultures-Lab<\/figcaption><\/figure>\n\n\n\n<p>Die meisten Textverarbeitungen erlauben jedoch einen wilden Mix verschiedener Prinzipien: Abs\u00e4tze k\u00f6nnen \u00fcber Formatvorlagen formatiert werden, gleichzeitig jedoch auch grafisch, so dass im schlimmsten Fall nicht sichtbar ist, ob hinter der Formatierung eine logische Information steckt oder nicht.<\/p>\n\n\n\n<p>Textverarbeitungen sind also einerseits Spr\u00f6sslinge von Editoren und enthalten bis heute bestimmte Elemente von ihnen (logische Auszeichnungen, Suchen- und Ersetzen-Funktion, Anzeige im Entwurfsmodus ohne Paginierung), andererseits sind die Simulationen von Schreibmaschinen und Satz- und Layoutsystemen.<\/p>\n\n\n\n<p>Nach und nach sind aber Unterst\u00fctzungen hinzugekommen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Rechtschreib- und Grammatikkontrolle<\/li>\n\n\n\n<li>W\u00f6rterb\u00fccher und Thesauri<\/li>\n\n\n\n<li>Automatische Indexerstellung (Inhaltsverzeichnisse, Register)<\/li>\n\n\n\n<li>Bibliographiesoftware in Textverarbeitung eingebettet, um das Zitieren zu erleichtern<\/li>\n\n\n\n<li>Layouthilfen in Form von Styles, die einem Dokument verpasst und auch wieder ge\u00e4ndert werden kann<\/li>\n\n\n\n<li>Integration von Inhalten aus anderen Programmen wie z.B. eines Diagrams aus einer Tabellenkalkulation mit Live-Update<\/li>\n\n\n\n<li>etc.<\/li>\n<\/ul>\n\n\n\n<p>Nicht alle Benutzer:innen verwenden diese Unterst\u00fctzungen. Ich beobachte bei meinen Studierenden aber auch Kolleg:innen in der Germanistik beispielsweise, dass der Einsatz von einer Bibliographiesoftware wie Zotero alles andere als \u00fcblich ist. Und das h\u00e4ngt wahrscheinlich damit zusammen, dass Textverarbeitung heute noch immer auf zwei v\u00f6llig unterschiedlichen Kulturen beruht: Entweder der <em>Schreibmaschinenkultur<\/em> oder der <em>Programmierkultur<\/em>. Letztere m\u00f6chte m\u00f6glichst viele Routineaufgaben an die Maschine delegieren und nimmt daf\u00fcr in Kauf, Daten strukturiert aufzunehmen (z.B. eine Bibliographiesoftware zu benutzen). Erstere kommt gar nicht auf die Idee, dass die Maschine sehr viel an Routineaufgaben \u00fcbernehmen k\u00f6nnte und findet es zu aufw\u00e4ndig, einen Initialaufwand zu t\u00e4tigen, um dann hinterher effizienter arbeiten zu k\u00f6nnen.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/macwrite.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1000\" height=\"750\" src=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/macwrite.png\" alt=\"\" class=\"wp-image-696\" srcset=\"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/macwrite.png 1000w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/macwrite-300x225.png 300w, https:\/\/www.bubenhofer.com\/sprechtakel\/wp-content\/uploads\/2022\/12\/macwrite-768x576.png 768w\" sizes=\"auto, (max-width: 1000px) 100vw, 1000px\" \/><\/a><figcaption class=\"wp-element-caption\">MacWrite auf Macintosh Plus von 1984, eines der ersten grafischen Textverarbeitungsprogrammen<\/figcaption><\/figure>\n\n\n\n<p>Nun gibt es aber mit den M\u00f6glichkeiten moderner &#8222;K\u00fcnstlicher Intelligenz&#8220; neue M\u00f6glichkeiten. Diese Systeme beruhen auf Sprachmodellen, die anhand sehr grosser Datenmengen gelernt haben, Wissensbest\u00e4nde zu reproduzieren und auf neue Daten anzuwenden. Ein Beispiel ist das neuste <a href=\"https:\/\/openai.com\">OpenAI-Modell<\/a>, mit dem \u00fcber das Interface <a href=\"https:\/\/chat.openai.com\/chat\">ChatGPT<\/a> kommuniziert werden kann.<\/p>\n\n\n\n<p>Damit sind erstaunliche Dinge m\u00f6glich. Ich kann zum Beispiel fragen:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Frage: <\/strong>Wie ver\u00e4nderte sich das Schreiben von Texten mit der Schreibmaschine im Vergleich zu heute? Was waren die entscheidenden Erfindungen, die das Schreiben ver\u00e4ndert haben?<\/p>\n\n\n\n<p><strong>Antwort: <\/strong>Mit der Erfindung der Schreibmaschine im 19. Jahrhundert wurde das Schreiben von Texten deutlich schneller und einfacher. Durch die M\u00f6glichkeit, Buchstaben auf einem Blatt Papier mithilfe von Tasten statt m\u00fchsam mit der Hand zu schreiben, konnten Schriftst\u00fccke schneller verfasst werden. Die Schreibmaschine war auch ein wichtiger Fortschritt in Bezug auf die Lesbarkeit von Texten, da die Schrift durch die Nutzung der Maschine im Vergleich zur Handschrift klarer und deutlicher wurde.<\/p>\n\n\n\n<p>Eine weitere wichtige Erfindung in Bezug auf das Schreiben von Texten war der Computer. Durch den Einsatz von Computern und Schreibprogrammen konnten Texte noch schneller und einfacher verfasst werden. Auch die M\u00f6glichkeit, Texte zu bearbeiten und zu korrigieren wurde deutlich verbessert.<\/p>\n\n\n\n<p>Insgesamt hat sich das Schreiben von Texten durch die Nutzung von Schreibmaschinen und Computern deutlich ver\u00e4ndert und ist heute ein viel schnellerer und einfacherer Prozess als noch vor Jahrzehnten.<\/p>\n<cite>ChatGPT, Dialog vom 6. Dezember 2022<\/cite><\/blockquote>\n\n\n\n<p>Der Dialog kann fortgef\u00fchrt werden und dabei kann das System auf die vergangenen Sequenzen zugreifen.<\/p>\n\n\n\n<p>Es ist aber auch Folgendes m\u00f6glich:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Frage: <\/strong>Ich m\u00f6chte ein Script, das ein grosses Korpus als Text-Datei einliest, mit word2vec ein Modell berechnet und es dann clustert.<\/p>\n\n\n\n<p><strong>Antwort: <\/strong>Hier ist ein einfaches Beispiel f\u00fcr ein Python-Script, das ein gro\u00dfes Korpus als Textdatei einliest, mit dem Word2Vec-Modell von Gensim berechnet und anschlie\u00dfend clustert.<\/p>\n\n\n\n<pre class=\"wp-block-code\"><code>import gensim\nfrom gensim.models import Word2Vec\nfrom gensim.utils import simple_preprocess\n\n# Einlesen des Korpus als Textdatei\nwith open(\"korpus.txt\", \"r\") as f:\n    text = f.read()\n\n# Tokenisieren des Korpus (Aufteilen des Textes in einzelne W\u00f6rter oder \"Tokens\")\ntokens = simple_preprocess(text)\n\n# Berechnen des Word2Vec-Modells\nmodel = Word2Vec(tokens, size=100, window=5, min_count=5, workers=4)\n\n# Berechnen der Word2Vec-Vektoren f\u00fcr die W\u00f6rter im Korpus\nvectors = &#91;model&#91;word] for word in model.wv.vocab]\n\n# Clustern der Word2Vec-Vektoren mithilfe des K-Means-Algorithmus\nkmeans = KMeans(n_clusters=10)\nkmeans.fit(vectors)\n\n# Ausgabe der zugewiesenen Cluster f\u00fcr jedes Wort im Korpus\nclusters = kmeans.predict(vectors)\nfor i, word in enumerate(model.wv.vocab):\n    print(f\"{word}: {clusters&#91;i]}\")<\/code><\/pre>\n<\/blockquote>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Das Script berechnet das Word2Vec-Modell f\u00fcr das gegebene Korpus und clustert anschlie\u00dfend die Vektoren der W\u00f6rter mithilfe des K-Means-Algorithmus. Die zugewiesenen Cluster f\u00fcr jedes Wort werden dann ausgegeben.<\/p>\n\n\n\n<p>Bitte beachte, dass dieses Beispiel sehr einfach gehalten ist und m\u00f6glicherweise nicht f\u00fcr alle Anwendungsf\u00e4lle geeignet ist. F\u00fcr eine genauere und zuverl\u00e4ssigere Berechnung von Word2Vec-Modellen und Clustern k\u00f6nnten weitere Schritte wie die Feinabstimmung der Modellparameter oder die Verwendung anderer Clustering-Algorithmen erforderlich sein. Es w\u00e4re immer empfehlenswert, sich im Detail mit der Materie auseinanderzusetzen und gegebenenfalls professionelle Hilfe in Anspruch zu nehmen.<\/p>\n<cite>ChatGPT, Dialog vom 7. Dezember 2022<\/cite><\/blockquote>\n\n\n\n<p>Viele Experimente mit ChatGPT testen, ob das Sprachmodell inhaltlich sinnvolle und interessante Texte produzieren kann. Das geht bis zu einem gewissen Grad, ist jedoch prim\u00e4r ein recht langweiliges Paraphrasieren von bestehenden Wissensbest\u00e4nden. Viel interessanter ist es jedoch, damit die Br\u00fccke zwischen Schreibmaschinenkultur und Programmierkultur zu \u00fcberwinden. M\u00f6gliche Aufgaben, die an eine KI ausgelagert werden k\u00f6nnten sind zum Beispiel (* = bereits m\u00f6glich mit ChatGPT):<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Fasse mir bitte den Forschungsstand zum Thema XY der letzten f\u00fcnf Jahre zusammen.<\/li>\n\n\n\n<li>Erstelle ein Abstract meines Textes. *<\/li>\n\n\n\n<li>Nenne mir Definitionen von XY in der Fachliteratur. (*)<\/li>\n\n\n\n<li>Paraphrasiere bitte diese Tabelle mit den statistischen Werten in drei S\u00e4tzen. *<\/li>\n\n\n\n<li>Beschreibe, was im Fach unter XY verstanden wird. (*)<\/li>\n<\/ul>\n\n\n\n<p>Neben solchen Aufgaben, die eher inhaltlicher Natur sind, gibt es aber auch viele eher technische Aufgaben:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Ich habe hier eine Liste von Aufs\u00e4tzen in einem unstrukturierten Format: Bitte konvertiere sie in ein strukturiertes Format, so dass ich sie einfach in meine Bibliographiesoftware importieren kann. *<\/li>\n\n\n\n<li>\u00dcberpr\u00fcfe bitte die Zitate auf ihre Korrektheit und bibliographiere sie richtig.<\/li>\n\n\n\n<li>Objektsprache sollte kursiv sein, ich habe vergessen, eine entsprechende Formatvorlage zu benutzen. Bitte erstelle eine Formatvorlage &#8222;Objektsprache&#8220;, finde alle Passagen mit Objektsprache und weise diese Formatvorlage zu. Definiere die Formatvorlage mit Schriftart &#8222;kursiv&#8220;.<\/li>\n\n\n\n<li>Zeitschrift XY will in der Bibliographie immer einen Punkt nach den Autor:innennamen und das Jahr am Ende, bitte \u00e4ndere das entsprechend. (*)<\/li>\n\n\n\n<li>Erstelle mir ein Python-Script, um diese Wertetabellen in ein Diagramm zu konvertieren. *<\/li>\n<\/ul>\n\n\n\n<p>Die letzte Aufgabe k\u00f6nnte nat\u00fcrlich auch unter Verwendung einer Bibliographiesoftware leicht erf\u00fcllt werden, aber noch bequemer ist es so.<\/p>\n\n\n\n<p>Auch der Forschungs- und Rechercheprozess k\u00f6nnte durch die KI unterst\u00fctzt werden:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>\u00dcberpr\u00fcfe bitte, wie sich die Verwendung des Ausdrucks &#8222;Heimat&#8220; in den letzten f\u00fcnf Jahren in Schweizer Medien ver\u00e4ndert hat. Ich h\u00e4tte gerne nach Monaten aggregierte relative H\u00e4ufigkeiten (pro Mio. W\u00f6rter) und eine Tabelle der verwendeten Quellen.<\/li>\n\n\n\n<li>Erstelle ein Script, um diese Textdateien, die alle das Muster XY haben, in XML-Dokumente zu konvertieren, damit ich sie hinterher mit der Software Z verarbeiten kann. *<\/li>\n\n\n\n<li>Erstelle ein Script, um diese Manuskripte \u00fcber die API von Transkribus mit dem Modell XY zu bearbeiten.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Folgen<\/h2>\n\n\n\n<p>Das Schreiben wird sich unter Einsatz von KI stark ver\u00e4ndern \u2013 diese Ver\u00e4nderungen stehen aber ein einer langen Tradition der maschinellen Unterst\u00fctzung des Schreibens vom Papier zum Bildschirm und von der Feder \u00fcber die Schreibmaschine zum Computer. Endlich bietet sich nun aber die Chance, dass Schreibmaschinenkultur und Programmierkultur auf dem Computer zusammenwachsen.<\/p>\n\n\n\n<p>Allerdings mit Folgen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Welche <strong>Kompetenzen<\/strong> sind notwendig, um KI zu nutzen? Denn die Aufgabe muss sinnvoll gestellt und das Ergebnis korrekt eingesch\u00e4tzt werden k\u00f6nnen \u2013 es muss angepasst, korrigiert und erweitert werden. Wir ben\u00f6tigen deshalb <em>Data-Literacy<\/em> und <em>KI-Literarcy<\/em>.<\/li>\n\n\n\n<li>Viele T\u00e4tigkeiten wissenschaftlichen Arbeitens, die man bislang als wichtig erachtete, werden <strong>unwichtig<\/strong>: Bibliographieren und zitieren nach einem bestimmten Stil, Forschungsstand erarbeiten, viel zitierte Fachliteratur identifizieren und paraphrasieren.<\/li>\n\n\n\n<li>Daraus folgt zwangsweise, dass in der Lehre neue <strong>Bewertungskriterien<\/strong> f\u00fcr die Bewertung von Qualifikationsarbeiten und von wissenschaftlichem Arbeiten gefunden werden m\u00fcssen. Es macht keinen Sinn, darauf zu pochen, dass das Literaturverzeichnis vollst\u00e4ndig ist oder nach Schema X formatiert ist \u2013 das ist eine Aufgabe, die wir an den Computer delegieren k\u00f6nnen. Auch die Paraphrasierung eines Forschungsstandes ist eher uninteressant \u2013&nbsp;dessen Einordnung und die daraus abzuleitenden Folgerungen sind es aber nat\u00fcrlich sehr.<\/li>\n\n\n\n<li>Was jedoch dringend n\u00f6tig ist: Die F\u00f6rderung von <strong>Data-Literacy<\/strong> und <strong>KI-Literacy<\/strong>: Das Lesen und interpretieren von Daten, ein profundes Verst\u00e4ndnis von Digitalit\u00e4t und K\u00fcnstlicher Intelligenz \u2013&nbsp;deren Chancen, Grenzen und Gefahren.<\/li>\n\n\n\n<li>Und ganz besonders: KI ist extrem attraktiv, ist jedoch immer st\u00e4rker in den H\u00e4nden <strong>kommerzieller Unternehmen<\/strong>. F\u00fcr Universit\u00e4ten wird es immer schwieriger, technologisch mitzuhalten, weil daf\u00fcr einerseits viel Geld n\u00f6tig ist, andererseits sich Universit\u00e4ten eher an rechtliche und datensch\u00fctzerische Schranken halten und deshalb an viele Daten gar nicht herankommen. Kommerzielle Unternehmen haben aber das Geld, um das Risiko von rechtlichen Auseinandersetzungen problemlos tragen zu k\u00f6nnen. Es ist daher schwierig, KI-gest\u00fctzte Software als OpenSource-Software zu verbreiten.<\/li>\n<\/ul>\n\n\n\n<p>Das ist aber noch nicht alles. Im <a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/2022\/12\/18\/wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-2\/\">n\u00e4chsten Teil<\/a> gehe ich darauf ein, warum die Frage zu Publikationssprachen in der Wissenschaft eigentlich vorbei sein sollte, vorausgesetzt wir entwickeln einen besseren Umgang mit Maschineller \u00dcbersetzung. <\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kontext<\/h2>\n\n\n\n<p>Ich unterrichte momentan ein Seminar zum Thema &#8222;Stenographie, Schreibmaschine, Computer, Virtual Assistants: Die Kommunikationsgeschichte von Schreibkulturen&#8220;, in <a href=\"https:\/\/www.machine-cultures.net\">dessen Rahmen wir ebenfalls bloggen<\/a> und uns rege austauschen \u2013 Dank an die Studierenden! Dadurch besch\u00e4ftigte ich mich stark mit den medialen und kulturellen Bedingungen und Ver\u00e4nderungen des Schreibens mit Maschinen. Der Medienwissenschaftler Till Heilmann, Autor des Buches <em><a href=\"https:\/\/www.transcript-verlag.de\/978-3-8376-1333-9\/textverarbeitung\/\">Textverarbeitung: Eine Mediengeschichte des Computers als Schreibmaschine<\/a><\/em>, besuchte unser Seminar, ebenso der Linguist <a href=\"http:\/\/www.andigredig.ch\">Andi Gredig<\/a>; er verfasste das Buch <em><a href=\"https:\/\/www.frank-timme.de\/de\/programm\/produkt\/schreiben_mit_der_hand\">Schreiben mit der Hand. Begriffe \u2013 Diskurs \u2013 Praktiken<\/a><\/em>. Im regen Austausch zu medialen Bedingungen des Schreibens und zu maschineller Verarbeitung und Analyse von Text bin ich zudem mit <a href=\"https:\/\/www.scharloth.com\">Joachim Scharloth<\/a>, <a href=\"https:\/\/philippe-wampfler.ch\">Philippe Wampfler<\/a>, Maaike Kellenberger, Julia Krasselt und vielen weiteren Personen. Danke!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Radikale Ver\u00e4nderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. K\u00fcnstliche Intelligenz kann automatisch Texte verfassen, \u00fcbersetzen und redigieren. Trotzdem plagen wir uns noch immer mit Textverarbeitungsprogrammen, die zwischen Schreibmaschine und Code-Editor stecken geblieben sind. &hellip; <a href=\"https:\/\/www.bubenhofer.com\/sprechtakel\/2022\/12\/08\/wie-wir-in-zukunft-wissenschaftliche-texte-schreiben-koennten-teil-1\/\">Weiterlesen <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[143,142],"tags":[144,146,148,147,145],"class_list":["post-684","post","type-post","status-publish","format-standard","hentry","category-computer","category-textverarbeitung","tag-computer","tag-kuenstliche-intelligenz","tag-programmieren","tag-schreiben","tag-textverarbeitung"],"_links":{"self":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts\/684","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/comments?post=684"}],"version-history":[{"count":9,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts\/684\/revisions"}],"predecessor-version":[{"id":725,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/posts\/684\/revisions\/725"}],"wp:attachment":[{"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/media?parent=684"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/categories?post=684"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.bubenhofer.com\/sprechtakel\/wp-json\/wp\/v2\/tags?post=684"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}