Sprechtakel

CatGPT: Wenn sich ein Sprachmodell bewegt

Noah Bubenhofer — Wed, 04 Oct 2023 21:21:23 +0000

Ich habe gerade Freude an meiner Roboterkatze, mit der ich experimentiere: Die Katze basiert auf einem Bausatz von Petoi. Das ist eine Roboterkatze, die über 11 Servos zur Steuerung von Beinen, Kopf und Schwanz verfügt, alles gesteuert über einen Arduino-kompatiblen Mikrocomputer. Normalerweise dient eine Fernbedienung zur Steuerung der Katze.

Ich habe die Katze nun aber um einen Raspberry Pi ergänzt, so dass ich mit der Katze sprechen kann:

Für die Spracherkennung verwende ich Microsoft Azure Speech2Text. Die Spracheingabe wird dann über die API von OpenAI zu GPT3.5 gesandt, wobei folgender Prompt entsteht:

Du bist eine intelligente Katze. Antworte auf die folgende Frage mit Bewegungen. Du kannst folgende Bewegungen: kbalance (stehen), kbuttUp (Hintern hoch), krest (pausieren), ksit (sitzen), kstr (strecken), kang (dich auf den Boden werfen), kbf (Backflip), kbx (boxen), kchr (Vorderpfoten heben), kcmh (herkommen), kfiv (High Five), khg (Umarmung), khi (grüssen), khsk (Pfote schütteln), kkc (Tritt), kpee (pinkeln), krl (rollen), knd (den Kopf hoch und runter bewegen), kwh (den Kopf links und rechts bewegen), kjmp (springen), kpu (Push-Ups), kwedeln (mit dem Schwanz wedeln), kzero (Körperstellung neutralisieren), kwkF (vorwärts gehen), kwkL (nach links gehen), kwkR (nach rechts gehen), kbk (rückwärts gehen), kvtF (auf der Stelle treten). Wenn du keine Bewegung weisst, dann sage einfach ksit. Gib die Befehle (und nur die Befehle) komma-separiert zurück. Hier kommt die Frage: [Input]

GPT wird also dazu gezwungen, die eigentlich sprachliche Antwort in Bewegungen der Katze zu übersetzen. Diese Befehle werden dann an das Nervenzentrum der Katze und die Servos weitergegeben.

Interessant ist für mich als Linguisten die Frage, inwiefern in einem Sprachmodell, das auf Texten trainiert ist, Wissen über körperliche Bewegungen repräsentiert ist. Welche Bewegungen könnten für „Freude“ stehen? Welche für „Ja“ und „Nein“?

Die ersten Beobachtungen deuten jedoch darauf hin, dass im Sprachmodell durchaus Bewegungswissen repräsentiert ist: Wenn ich sie frage, was sie tut, wenn sie glücklich ist, bewegt sie sich wild und springt herum. Wenn ich aber wissen will, wie sie sich verhält, wenn sie traurig ist, legt sie sich hin und bleibt ganz ruhig.

Ich bin noch dabei, die Möglichkeiten auszutesten. Doch kann man jetzt schon sagen, dass die Katze sich durchaus katzenartig verhält: Mir zugeneigt, aber doch etwas eigenwillig…

(Credits für den Katzennamen „CatGPT“ gehen an Livia!)

Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3

Noah Bubenhofer — Mon, 27 Feb 2023 21:56:50 +0000

Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Im dritten Teil der Serie möchte ich auf meine dritte These eingehen: Vorgaben von Institutionen und Disziplinen zu bestimmten Bibliographieformaten sind überflüssig; Zitation kann endlich völlig losgelöst von Formalitäten betrachtet werden.

Eigentlich könnte es schon längst der Fall sein, dass die Formate von Bibliographien und des Zitierens eine rein individuelle Sache sind: Mögen Sie Zitationen als Fussnoten oder lieber im Text? Soll die Bibliographie alphabetisch nach Autor:innen-Name oder numerisch nach Reihenfolge der Nennung im Text angeordnet sein? Soll die Jahreszahl in Klammern stehen und was genau des Titels soll hervorgehoben sein?

Viele Publikationsorgane (Journals, Verlage) und Fächer an Universitäten bestehen nach wie vor auf bestimmten Formaten: APA, Harvard, Chicago, DIN… In Seminararbeiten wird überprüft (und bewertet), ob das Format korrekt eingehalten worden ist, der beim Journal eingereichte Artikel kommt mit formalen Korrekturen in der Bibliographie zurück.

Klug, wer schon lange das bibliographieren und zitieren nicht händisch macht, sondern Software dafür nutzt, z.B. Zotero:

Verwendung einer Literaturverwaltungs-Software wie Zotero

Praktisch jede Publikation hat eine ID, z.B. eine DOI (Digital Object Identifier, im Jahr 2000 gegründet), Bücher eine ISBN (definiert 1972) und die Bibliotheken und der Buchhandel bemühen sich seit Jahrzehnten, strukturierte Formen der Titelerfassung zu nutzen.

Eine Software wie Zotero schlägt über die Eingabe solcher Identifier die bibliographischen Daten in verschiedenen Datenbanken nach und produziert bei der Verwendung jede denkbare Formatierung des Titels. Wer konsequent mit einer solchen Software arbeitet, investiert ein bisschen Zeit in die Pflege der eigenen Titeldatenbank, erhält dafür am Ende des Textes automatisch das korrekt nach einem bestimmbaren Stil formatierte Literaturverzeichnis.

So weit, so gut. Doch:

Warum sind Zitationsstile überhaupt noch relevant? Warum liegt die Entscheidung für den gewünschten Stil nicht in der Hand der Leserin?
Warum tun sich doch immer noch viele Forschende schwer, den Umgang mit Literatur in die Hände von Software zu legen?
Und können wir dank Künstlicher Intelligenz uns vielleicht sogar von der strukturierten Literaturerfassung mit Literaturverwaltungssoftware verabschieden?

Leserin entscheidet

Bei digital präsentierten Texten müssten eigentlich der Zitationsstil und das Format der Bibliographie gar nicht von der Autorin des Textes definiert werden müssen. Es reicht ja beim Schreiben, den richtigen Identifier zu hinterlegen und erst bei der Darstellung des Textes wird entschieden, nach welchem Stil formatiert wird. Wenn die Leserin lieber Fussnoten hätte: bitteschön! Die sind die Pest? Dann halt inline. Die Bibliographie selber ist eigentlich auch nicht nötig: Die Vollanzeige des Titels kann ja z.B. beim Hovern über die Zitation direkt angezeigt werden. Aber wenn die Leserin lieber eine Liste aller zitierten Titel hätte: Auch kein Problem.

Die Hürde, so zu denken, ist das PDF-Format, das nach wie vor unheimlich beliebt aber eigentlich völlig ungeeignet ist, um digitale Texte anzuzeigen. Es folgt der Logik der Schreibmaschinenkultur des Schreibens: Ein Text wird in einer bestimmten Form gesetzt – und so bleibt er. Mit HTML (oder Markdown) stünden Formate bereit, die einen Text erst im Moment des Anzeigens setzen (rendern). Viele Verlage bieten HTML-Ansichten von Texten inzwischen an, das PDF hält sich aber hartnäckig. Zudem schreiben wir normalerweise nicht in HTML, sondern in einer Textverarbeitungssoftware, die sich nicht entscheiden kann, ob sie der Schreibmaschinenkultur oder der Programmierkultur des Schreibens folgen will.

Unwille, Software zu nutzen

Selbst wenn man nicht den Traum der rezeptionsorientierten Darstellung von Text träumt, müsste die Nutzung von Literaturverwaltungssoftware attraktiv sein. Trotzdem zögern viele Forschende, wahrscheinlich oft in den Geisteswissenschaften, sie zu nutzen: Die Software mit den Titeln zu füllen, bedeutet Arbeit, wenn man nicht schon lange konsequent damit gearbeitet hat. Wenn dieser Schritt geschafft ist, dann gilt es nur, immer konsequent zu sein: Alles, was man an Literatur so findet, muss man sofort in die Datenbank importieren – oft reicht zum Glück ein Klick im Browser.

Doch: Müsste es nicht doch viel einfacher gehen?

Künstliche Intelligenz: Zurück zum Unstrukturierten

Dieser Gedanke kam mir, als ich die Publikationsliste auf der Webseite meiner Kollegin Konstanze Marx anschaute:

2023 mit Simon Meier-Vieracker, Lars Bülow und Robert Mroczynski. Digitale Pragmatik: Einleitung. In: Meier-Vieracker, Simon/Bülow, Lars/Marx, Konstanze/Mroczynski, Robert (Hrsg.): Digitale Pragmatik. Stuttgart: Metzler, 1–12.
2022 mit Janine Luth und Christian Pentzold. Ethische und rechtliche Aspekte der Analyse von digitalen Diskursen. In: Gredel, Eva und das DFG-Netzwerk (Hrsg.): Diskurse – digital: Theorien, Methoden, Anwendungen. Berlin, Boston: de Gruyter, 99–134.
2022 Schwimmen im Strudel oder Datenerhebung im Spannungsfeld zwischen Ethik und Erkenntnisinteresse. In: Beißwenger, Michael/Lemnitzer, Lothar/Müller-Spitzer, Carolin (Hrsg.): Forschen in der Linguistik. Eine Methodeneinführung für das Germanistik-Studium. Paderborn: Brill|Fink (UTB 5711), 292–303.
https://www.konstanze-marx.de/publikationen/

Ungünstig, wenn man diese Titel in eine Literaturverwaltungssoftware importieren will. (Ich erinnerte mich daran, dass ich vor langer, langer Zeit mal einen Parser programmierte, der versuchte, solche Literaturangaben automatisch in ein strukturiertes Format zu konvertieren…) Doch ein Sprachmodell wie ChatGPT kennt sich mit Mustern prima aus, deshalb:

Prompt: Hier sind Publikationen von Konstanze Marx. Bitte formatiere sie im RIS-Format (mit ausgeschriebenen Vornamen):
[Liste der Publikationen von oben]

Antwort:
TY – BOOK
AU – Marx, Konstanze
AU – Meier-Vieracker, Simon
AU – Bülow, Lars
AU – Mroczynski, Robert
PY – 2023
TI – Digitale Pragmatik: Einleitung
T3 – Digitale Pragmatik
PB – Metzler
CY – Stuttgart
SP – 1
EP – 12

TY – CHAP
AU – Marx, Konstanze
AU – Luth, Janine
AU – Pentzold, Christian
PY – 2022
TI – Ethische und rechtliche Aspekte der Analyse von digitalen Diskursen
BT – Diskurse – digital: Theorien, Methoden, Anwendungen
ED – Gredel, Eva
ED – DFG-Netzwerk
PB – de Gruyter
CY – Berlin, Boston
SP – 99
EP – 134

[…]
ChatGPT-Dialog vom 27. Februar 2023

Das Sprachmodell ist also in der Lage, aus den unstrukturierten Daten ein strukturiertes Format zu erzeugen, das dann z.B. Zotero problemlos lesen kann.

Damit ergeben sich neue Möglichkeiten:

Die Literatur kommt unkomplizierter in eine Literaturverwaltungssoftware.
Eigentlich ist eine Literaturverwaltungssoftware gar nicht mehr nötig.

Vielleicht haben die Skeptiker:innen doch Recht: Wir wollen unser wissenschaftliches Leben ja überhaupt gar nicht mit formalem Literaturkram verbringen. Zitationsstile sollten uns sowieso egal sein, aber auch das Jonglieren mit Software ist unnötig. Wenn ich beim Schreiben etwas zitieren will, dann ziehe ich dieses Etwas (ein PDF auf meinem Rechner, ein Browserfenster mit einem geöffneten Paper, eine beliebige andere Webseite) einfach in meine Textverarbeitung und die KI kümmert sich um den Rest. Habe ich das Buch auf meinem Schreibtisch liegen, dann sollte es reichen, es vor die Kamera des Rechners zu halten und die KI weiss Bescheid. Sie prüft, ob es eine ordentliche DOI dazu gibt und die Textverarbeitung speichert diese Information. Publiziere ich meinen Text, dann entscheidet die Leserin und der Leser, welche Darstellung auf dem Device, das sie oder er in Händen hält, gerade am praktischsten ist.

Ich gebe zu: Ich war bisher ein grosser Freund von Literaturverwaltungssoftware. Aber die Zukunft ist es wohl nicht…

Bereits erschienen:

Teil 1, Schreib- und Rechercheunterstützung durch KI: Systeme der Künstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.
Teil 2, Die Frage nach der richtigen Publikationssprache ist obsolet: Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren möchten.

How we (could) write scientific texts in the future – part 2

Noah Bubenhofer — Thu, 22 Dec 2022 21:54:30 +0000

Radical changes in the interaction between machines and humans in writing texts are underway. Artificial intelligence can automatically write, translate and edit texts. In the second part of the series, I would like to address my second thesis: Soon the question of the right publication language will be obsolete in science. I will write my scientific text in the language in which I prefer to write. The readers themselves decide in which language they want to receive it.

(This is the english translation of the original article: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 2)

English has undoubtedly become the most important language of publication in the academic world. This is always the subject of controversial discussions, e.g. by a political scientist, a Romance scholar and a Germanist. It is rightly argued that linguistic diversity is also important in science – although opinions differ as to whether a predominant language of publication, English, is positive on balance because it massively increases the range of publications.

I think that with the means of machine translation, the language issue for publications in science could actually already be obsolete today. However, only under certain conditions and assumptions:

Human translations will probably still be better and for many purposes more suitable than machine translations for a very long time. Whereby it is clear that human translations also always use (and have used for a long time) machine aids.
However, machine translations could be used selectively and adapted to the specific needs of scientific publications, so that a much greater language plurality could be lived in science.
Crucially, we do not primarily need „covert“ translations in science, but „overt“ translations (House 2005). Intelligent, AI-assisted machine translation opens up entirely new possibilities here.

Juliane House compares different translation concepts that have a long tradition and distinguishes „overt“ from „covert“ processes. Put simply, covert translations aim to produce a text in the target language in which its origin and source language are, in the best case, no longer visible at all. It should not only be linguistically perfectly adapted to the target language, but also incorporate the contexts and cultural characteristics of the target language and target culture.

Open translation is different: it aims to make as transparent as possible what the cultural context of the source text is. As a result, the translation may be more difficult to understand, but it gives a clear picture of the conditions under which the text was created.

We are very familiar with this tradition of open translations, for example in the form of parallel texts, bilingual annotated editions (or glosses as translation aids in medieval Latin manuscripts). Here are examples of Piccolomini’s Euryalus and Lucretia in Latin and German, and of Aristotle’s Poetics Greek/German:

Bilingual Edition Piccolomini: Euryalus and Lucretia (Latin/German).

Bilingual edition: Aristotle: Poetics (Greek/German)

This is what we need for scientific publications – but combined with the new possibilities of AI and machine translation.

Using ChatGPT as an example of powerful AI, for example, the following is possible:

Prompt: Please translate the following text in English, but add the original after each sentence and format according to the following pattern: English sentence. German original.. Here is the text to be translated:
[German Text]

Answer: When it comes to writing scientific texts […] Wenn es um das Schreiben von wissenschaftlichen Texten geht […]
ChatGPT dialogue of 15. 12. 2022 (translated, original in German)

This is not very exciting; cleverly formatted, however, it can be used to generate a text view where the original is displayed when the mouse hovers over the sentence if required.

But it gets more interesting with the following step:

Prompt: Very good. Now mark additional words in the English text where the translation is uncertain. Mark them according to the following pattern: english expression (engl: German original). Add a span element with title attribute, in which you give an explanation why the translation is uncertain.

Output (in HTML – here view in browser):

ChatGPT dialogue of 15. 12. 2022 (translated, original in German)

This results in a new way of dealing with machine translation in science, as this process can be automated to a large extent. A journal could allow authors to submit their texts in (almost) any language. When the text is published, the reader can decide on the output language himself – or more precisely: receives an open translation in the parallel text. This form of translation allows:

The original is visible or invisible to any degree: if, for example, I as a reader understand the original language passively quite well and have only minor uncertainties, the original may be very present. If the original language is largely incomprehensible to me, then the open translation must be primarily visible.
Passages, expressions where the machine translation is uncertain (or errors typically happen, cf. Czulo et al. 2022) are marked accordingly: Here I am warned, informed about the possible uncertainties, and advised to look into the original.

Already the author of the text marks important passages in the text, e.g. terminology, definitions or the like, to which special attention must be paid during translation. Based on the structure of the text, an AI can also make suggestions during writing as to what such critical passages might be.

The other capabilities of the AI also allow for additional assistance. For example, summaries can easily be created in a language other than the original.

Of course: none of this replaces human-generated translations, whether overt or covert. However, given the large number of academic publications, this is an obvious way to increase the quality of academic work, because:

Participation is increased as language barriers fall.
Linguistic engagement with one’s own text (as the author expects possible machine translations) increases sensitivity to different cultural contexts and differences in meaning.

Probably linguistic diversity is not equally important for all scientific disciplines. But it certainly is for large parts of the humanities and social sciences

Already published:

Part 1: Writing and research support by AI: Artificial intelligence systems for generating texts will not produce meaningful scientific texts, but will be a huge help to us in writing and research.

Bibliography

Stöcklin, Stefan. Wissenschaftssprache: “Sprachliche Diversität ist fruchtbar”. Interview mit Angelia Linke, Peter Fröhlicher und Fabrizio Gilardi. UZH News. https://www.news.uzh.ch/de/articles/2017/englisch-debatte.html. (2017).

House, Juliane. 2005. Offene und verdeckte Übersetzung: Zwei Arten, in einer anderen Sprache ›das Gleiche‹ zu sagen. Zeitschrift für Literaturwissenschaft und Linguistik 35(3). 76–101. https://doi.org/10.1007/BF03379444.

Czulo, Oliver, Venema Victor, Jo Havemann, Jennifer Miller & Dasapta Irawan. Caveats of machine translation – Translate Science Blog. https://blog.translatescience.org/caveats-of-machine-translation/. (18 December, 2022).

Bubenhofer, Noah. 2020. Visuelle Linguistik: Zur Genese, Funktion und Kategorisierung von Diagrammen in der Sprachwissenschaft. De Gruyter. https://doi.org/10.1515/9783110698732.

How we (could) write scientific texts in the future – part 1

Noah Bubenhofer — Thu, 22 Dec 2022 21:34:41 +0000

Radical changes in the interaction of machine and human in writing texts are underway. Artificial intelligence can automatically compose, translate and edit texts. Yet we still plague ourselves with word processors stuck between typewriter and code editor. And in the sciences, there are still arguments about what the right language of publication is, how to cite, and how to detect plagiarism. In the near future, scientific writing may have changed so much that these questions will become obsolete. This is part 1 of a series.

(This is the english translation of the original article: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 1)

Theses

When it comes to academic writing, which I include research, there could be big changes in the coming years. This has something to do with the new possibilities of large language models being used for Artificial Intelligence, as is visible right now with ChatGPT, for example. But it also has to do with the fact that there is finally an opportunity to stop thinking of writing with computers as better writing with typewriters, and start thinking about it in a whole new way.

Here are the five theses I want to write about below:

Writing and research support by AI: Artificial intelligence systems for generating texts will not produce meaningful scientific texts, but will be a huge help to us in writing and research.
The question of the right publication language is obsolete: I write my scientific text in the language in which I prefer to write. The readers themselves decide in which language they want to read it. (Cf. Part 2.)
Institutional and disciplinary guidelines for specific bibliographic formats are superfluous: Citation can finally be considered completely detached from formalities.
No more plagiarism: Because citation and the adoption of ideas will be solved differently from a technical point of view anyway, and research processes will be different with AI support, there will be no more plagiarism in the true sense of the word.
Other machines and programs: The machines and programs we use to write scientific texts will have to change radically. Word & Co, OpenOffice but also LaTeX or collaborative software like Google Docs, Onlyoffice etc. are completely unsuitable tools. The computer systems we work with (laptops, external screens, keyboards, tablets) are also unsuitable.

Writing and research support through AI

In his book „Textverarbeitung“ (Text Processing, Till Heilmann distinguishes three types of writing with and for the computer: writing for the computer but not with the computer (e.g., programming with punch cards), writing for the computer and with the computer (programming in an editor on the computer), and writing with the computer but not for the computer: classical word processing.

These three types of writing have historically also shaped the development of machines and programs: The mechanical typewriter was replaced by the electric one, which, thanks to memory, allowed the first distance between typing and printing: before outputting the line on the paper, the input could be checked and corrected if necessary.

The first computers were programmed by plugging plugs or later punching punched cards: Planning and writing the program happened outside the computer, which was impractical in the long run: so the idea was born to give computers an operating system and software based on it, editors, with which the program could be created directly on the computer, its execution could be monitored and the program could be corrected immediately.

Only after that the idea was born to use such editors for writing any other text as well, thus taking advantage of the live manipulation of a text that became possible with the computer.

These two strands of development – programming (writing for the computer) and writing (for us) – led to two different types of word processing software:

Editor: Here BBEdit for Mac 12.67

Word Processor: Here Microsoft Word for Mac 16.66

In both, both can be done. However, an editor is characterized by the fact that its file format is a so-called txt format, so it can be opened in any editor without any problems. In addition it offers usually so-called “ syntax highlighting „, draws thus structure elements and instructions of a programming language colored and offers different assistance for the writing of the program code. In addition printing plays a subordinate role: The length of the text is not oriented to pages, but to lines. If a logical hierarchy can be derived from the text or program structure, this has an effect on the various visualizations of the text: Lines that are hierarchically subordinate to another line can, for example, be folded in and out.

Electric (IBM 6783) and mechanical (Hermes Media 3) typewriters in Noah’s Machines-Cultures-Lab

Text processing is quite different: it still shows traces of the mechanical typewriter: there are margins to be set, tabs and a basic orientation to pages. However, they also reflect the needs of typesetting and printing: markups play a big role: bold, italic, underlined. Fonts and font sizes can be selected and the text can be designed. Most word processors follow the WYSIWYG principle: what you see is what you get, the representation on the screen corresponds to the print. Bravo, released by Xerox Parc in 1974, is considered the first word processor with a graphical user interface and WYSIWYG.

However, the word processor offers even more: format templates. A concept that has more in common with the editor. These are logical rather than graphical markups: 1st order titles, 2nd order titles, emphasis, etc. are assigned to paragraphs or strings. The graphical representation of these categories can be changed at will afterwards, and it is easy to automatically extract titles and create a table of contents from a text formatted in this way.

Computer generations and generations of word processors: Macintosh IIci, Macintosh Plus (with MacWrite), and Apple II (with Apple Writer II) in Noah’s Machine Cultures lab.

Most word processors, however, allow a wild mix of different principles: Paragraphs can be formatted using style sheets, but at the same time they can be formatted graphically, so that in the worst case it is not visible whether there is logical information behind the formatting or not.

Word processors are thus on the one hand offspring of editors and contain until today certain elements of them (logical markup, search and replace function, display in draft mode without pagination), on the other hand they are simulations of typewriters and typesetting and layout systems.

Gradually, however, supports have been added:

Spelling and grammar check
Dictionaries and thesauri
Automatic index creation (tables of contents, indexes)
Bibliography software embedded in word processing to facilitate citation
Layout aids in the form of styles that can be applied to a document and also changed again
Integration of content from other programs such as a chart from a spreadsheet with live updates
etc.

Not all users use these supports. I observe among my students and colleagues in German studies, for example, that the use of bibliography software such as Zotero is anything but common. And this probably has to do with the fact that text processing today is still based on two completely different cultures: Either the typewriter culture or the programming culture. The latter wants to delegate as many routine tasks as possible to the machine and accepts to record data in a structured way (e.g. to use a bibliography software). The former does not even consider that the machine could take over a lot of routine tasks and finds it too costly to make an initial effort in order to be able to work more efficiently afterwards.

MacWrite on Macintosh Plus from 1984, one of the first graphical word processors

Now, however, there are new possibilities with the possibilities of modern „artificial intelligence“. These systems are based on language models that have learned to reproduce knowledge based on very large amounts of data and apply it to new data. One example is the latest OpenAI model, which can be used to communicate via the ChatGPT interface.

Amazing things are possible with this. For example, I can ask:

Question: How did typing change compared to today? What were the key inventions that changed writing?

Answer: With the invention of the typewriter in the 19th century, writing texts became much faster and easier. The ability to type letters on a sheet of paper using keys instead of laboriously writing by hand made it possible to compose written documents more quickly. The typewriter was also an important advance in terms of text legibility, as the use of the machine made writing clearer and more distinct compared to handwriting.

Another important invention in terms of text writing was the computer. The use of computers and writing programs made texts even faster and easier to compose. The ability to edit and correct texts was also greatly improved.

Overall, text writing has changed significantly with the use of typewriters and computers and is now a much faster and easier process than it was decades ago.
ChatGPT, December 6, 2022 dialogue (translated, original in German)

The dialog can be continued and in doing so, the system can access the past sequences.

However, the following is also possible:

Question: I want a script that reads in a large corpus as a text file, computes a model with word2vec, and then clusters it.

Answer: Here is a simple example of a Python script that reads in a large corpus as a text file, computes it using Gensim’s word2vec model, and then clusters it.
import gensim
from gensim.models import Word2Vec
from gensim.utils import simple_preprocess

# Einlesen des Korpus als Textdatei
with open("korpus.txt", "r") as f:
    text = f.read()

# Tokenisieren des Korpus (Aufteilen des Textes in einzelne Wörter oder "Tokens")
tokens = simple_preprocess(text)

# Berechnen des Word2Vec-Modells
model = Word2Vec(tokens, size=100, window=5, min_count=5, workers=4)

# Berechnen der Word2Vec-Vektoren für die Wörter im Korpus
vectors = [model[word] for word in model.wv.vocab]

# Clustern der Word2Vec-Vektoren mithilfe des K-Means-Algorithmus
kmeans = KMeans(n_clusters=10)
kmeans.fit(vectors)

# Ausgabe der zugewiesenen Cluster für jedes Wort im Korpus
clusters = kmeans.predict(vectors)
for i, word in enumerate(model.wv.vocab):
    print(f"{word}: {clusters[i]}")
The script computes the Word2Vec model for the given corpus and then clusters the vectors of the words using the K-Means algorithm. The assigned clusters for each word are then output.

Please note that this example is very simplistic and may not be suitable for all use cases. For more accurate and reliable computation of Word2Vec models and clusters, further steps such as fine-tuning the model parameters or using other clustering algorithms might be required. It would always be advisable to look into the matter in detail and seek professional help if necessary.
ChatGPT, December 7, 2022 dialogue (translated, original in German)

Many experiments with ChatGPT test whether the language model can produce text that is meaningful and interesting in terms of content. This works to a certain extent, but is primarily a rather boring paraphrasing of existing knowledge. However, it is much more interesting to use it to bridge the gap between typewriter culture and programming culture. Possible tasks that could be outsourced to an AI are for example (* = already possible with ChatGPT):

Please summarize for me the state of research on topic XY over the last five years.
Create an abstract of my text. *
Give me definitions of XY in the literature. (*)
Please paraphrase this table of statistical values in three sentences. *
Describe what in the discipline is meant by XY. (*)

In addition to such tasks, which are more content-related, there are also many more technical tasks:

I have here a list of bibliographic citations of papers in an unstructured format: please convert it to a structured format so that I can easily import it into my bibliography software. *
Please check the citations for correctness and bibliographize them properly.
Object language should be italic, I forgot to use an appropriate style sheet. Please create a style „object language“, find all passages with object language and assign this style. Define the style with font „italic“.
Journal XY always wants a period after the author names and the year at the end in the bibliography, please change this accordingly. (*)
Create a Python script to convert these value tables into a chart. *

Of course, the last task could be easily accomplished using bibliography software, but it is even more convenient this way.

The research process could also be supported by AI:

Please check how the use of the term „Heimat“ has changed in Swiss media over the last five years. I would like to have relative frequencies aggregated by month (per million words) and a table of sources used.
Create a script to convert these text files, which all have pattern XY, into XML documents, so that I can process them afterwards with software Z. *
Create a script to process these manuscripts using the API of Transkribus with the model XY.

Implications

Writing will change greatly with the use of AI – but these changes are in a long tradition of machine support for writing from paper to screen and from pen to typewriter to computer. At last, however, there is now an opportunity for typewriter culture and programming culture to converge on the computer.

However, with consequences:

What skills are needed to use AI? After all, it must be possible to set the task sensibly and assess the result correctly – it must be adapted, corrected and extended.
Many activities of scientific work that were previously considered important will become unimportant: creating the bibliography and citing according to a certain style, elaborating the state of research, identifying and paraphrasing much-cited literature.
It follows inevitably that in teaching new evaluation criteria must be found for the evaluation of qualification papers and of scientific work. It makes no sense to insist that the bibliography is complete or formatted according to scheme X – that is a task we can delegate to the computer. The paraphrasing of a research status is also rather uninteresting – but its classification and the conclusions to be drawn from it are of course very much so.
What is urgently needed, however, is the promotion of data literacy and AI literacy: the reading and interpretation of data, a profound understanding of digitality and artificial intelligence – its opportunities, limitations and dangers.
And most importantly, AI is extremely attractive, but is increasingly in the hands of commercial companies. It is becoming increasingly difficult for universities to keep up technologically because, on the one hand, a lot of money is needed to do so, and on the other hand, universities tend to adhere to legal and data protection barriers and therefore cannot even access a lot of data. Commercial companies, however, have the money to easily bear the risk of legal disputes. It is therefore difficult to distribute AI-supported software as open source software.

But that’s not all. In the next part, I will address why the question about publication languages in science should actually be over, provided we develop a better way of dealing with machine translation.

Context

I’m currently teaching a seminar on „Stenography, Typewriters, Computers, Virtual Assistants: the Communication History of Writing Cultures“, in the context of which we are also blogging and having lively exchanges – thanks to the students! Through this, I became heavily involved with the media and cultural conditions and changes of writing with machines. Media scholar Till Heilmann, author of the book „Textverarbeitung: Eine Mediengeschichte des Computers als Schreibmaschine“ (Text Processing: A Media History of the Computer as Typewriter), visited our seminar, as did linguist Andi Gredig; he authored the book „Schreiben mit der Hand. Begriffe – Diskurs – Praktiken“ (Writing by Hand. Concepts – Discourse – Practices). I am also in lively exchange on medial conditions of writing and on machine processing and analysis of text with Joachim Scharloth, Philippe Wampfler, Maaike Kellenberger, Julia Krasselt, and many others. Thank you.

Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 2

Noah Bubenhofer — Sun, 18 Dec 2022 11:03:53 +0000

Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Im zweiten Teil der Serie möchte ich auf meine zweite These eingehen: Schon bald wird in der Wissenschaft die Frage nach der richtigen Publikationssprache obsolet sein. Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren möchten.

Englisch ist zweifellos die wichtigste Publikationssprache in den Wissenschaften geworden. Das wird immer wieder kontrovers diskutiert, z.B. von einem Politikwissenschaftler, einem Romanisten und einer Germanistin. Zu recht wird argumentiert, das sprachliche Vielfalt auch in der Wissenschaft wichtig ist – wobei die Meinungen auseinander gehen, ob eine vorherrschende Publikationssprache Englisch unter dem Strich positiv ist, weil sie die Reichweite von Publikationen massiv erhöht.

Ich meine, dass mit den Mitteln der maschinellen Übersetzung eigentlich schon heute die Sprachenfrage für Publikationen in der Wissenschaft obsolet sein könnte. Allerdings nur unter bestimmten Bedingungen und Annahmen:

Menschliche Übersetzungen werden wahrscheinlich noch sehr lange besser und für viele Zwecke passender sein als maschinelle Übersetzungen. Wobei klar ist, dass auch menschliche Übersetzungen immer auch maschinelle Hilfsmittel nutzen (und auch schon lange benutzten).
Maschinelle Übersetzungen könnten aber gezielt eingesetzt und dabei an spezifische Bedürfnisse von wissenschaftlichen Publikationen angepasst werden, so dass in der Wissenschaft eine deutlich grössere Sprachpluralität gelebt werden könnte.
Entscheidend dabei: Wir brauchen in der Wissenschaft dafür nicht primär „covert“, sondern „overt“ Übersetzungen, also nicht „verdeckte“, sondern „offene“ (House 2005). Mit intelligenten, KI-unterstützter maschineller Übersetzung ergeben sich hier ganz neue Möglichkeiten.

Juliane House vergleicht verschiedene Übersetzungskonzepte, die eine lange Tradition haben, und unterscheidet „offene“ (overt) von „verdeckenden“ (covert) Verfahren. Vereinfacht gesagt: Verdeckte Übersetzungen wollen in der Zielsprache einen Text erzeugen, bei dem seine Herkunft und Ausgangssprache im besten Fall gar nicht mehr sichtbar ist. Er soll sich nicht nur sprachlich perfekt an die Zielsprache angeschmiegt haben, sondern auch die Kontexte und kulturellen Besonderheiten der Zielsprache und Zielkultur aufnehmen.

Anders die offene Übersetzung: Sie möchte möglichst transparent machen, was der kulturelle Kontext des Ausgangstextes ist. Dadurch ist die Übersetzung vielleicht schwerer verständlich, gibt jedoch ein deutliches Bild der Entstehensbedingungen des Textes.

Wir kennen diese Tradition der offenen Übersetzungen sehr gut, z.B. in Form der Paralleltexte, der zweisprachigen, kommentierten Ausgaben (oder von Glossen als Übersetzungshilfen in mittelalterlichen lateinischen Handschriften). Hier Beispiele von Piccolominis Euryalus und Lucretia auf Lateinisch und Deutsch, sowie von Aristoteles Poetik Griechisch/Deutsch:

Zweisprachige Ausgabe Piccolomini: Euryalus und Lucretia (Latein/Deutsch)

Zweisprachige Ausgabe: Aristoteles: Poetik (Griechisch/Deutsch)

Das ist es, was wir für wissenschaftliche Publikationen benötigen – kombiniert jedoch mit den neuen Möglichkeiten der KI und der maschinellen Übersetzung.

Mit der Verwendung von ChatGPT als Beispiel für eine mächtige KI ist z.B. Folgendes möglich:

Prompt: Übersetze bitte den folgenden Text auf Englisch, füge aber nach jedem Satz das Original hinzu und formatiere nach folgendem Muster: Englischer Satz. Deutsches Original.. Hier der zu übersetzende Text:
[Text]

Ausgabe: When it comes to writing scientific texts […] Wenn es um das Schreiben von wissenschaftlichen Texten geht […]
ChatGPT-Dialog vom 15. 12. 2022

Das ist nicht weiter aufregend; geschickt formatiert lässt sich daraus jedoch eine Textansicht generieren, bei der beim Überfahren des Satzes mit der Maus bei Bedarf das Original angezeigt wird.

Interessanter wird es aber mit folgendem Schritt:

Prompt: Sehr gut. Jetzt markiere im Englischen Text zusätzlich Wörter, bei denen die Übersetzung unsicher ist. Markiere sie nach dem folgenden Muster: english expression (dt: deutsches Original). Füge ein span-Element mit title-Attribut hinzu, in das du eine Erklärung gibst, warum die Übersetzung unsicher ist.

Ausgabe (in HTML – hier Ansicht im Browser):

ChatGPT-Dialog vom 15. 12. 2022

Damit ergibt sich ein neuer Umgang mit maschineller Übersetzung in der Wissenschaft, da sich dieser Prozess weitgehend automatisieren lässt. Eine Zeitschrift könnte den Autor:innen erlauben, ihre Texte in einer (fast) beliebigen Sprache einzureichen. Wenn der Text publiziert ist, kann die:der Leser:in selber über die Ausgabesprache entscheiden – bzw. genauer: erhält eine offene Übersetzung im Paralleltext. Darin ist ersichtlich:

Das Original ist beliebig stark sichtbar oder unsichtbar: Wenn ich als Leser:in die Originalsprache z.B. passiv ganz gut verstehe und nur kleinere Unsicherheiten habe, darf das Original sehr präsent sein. Wenn mir die Originalsprache weitgehend unverständlich ist, dann muss die offene Übersetzung primär sichtbar sein.
Passagen, Ausdrücke, bei der die maschinelle Übersetzung unsicher ist (oder typischerweise Fehler passieren, vgl. Czulo et al. 2022), werden entsprechend markiert: Hier werde ich gewarnt, über die möglichen Unsicherheiten aufgeklärt und mir wird ein Blick ins Original nahegelegt.
Bereits die:der Autor:in des Textes markiert im Text wichtige Passagen, z.B. Terminologie, Definitionen o.ä., denen bei der Übersetzung besondere Aufmerksamkeit geschenkt werden muss. Eine KI kann aufgrund der Textstruktur zudem beim Schreiben Vorschläge machen, was solche kritischen Stellen sein könnten.

Die weiteren Möglichkeiten der KI erlauben zudem zusätzliche Hilfestellungen. Zum Beispiel können problemlos Zusammenfassungen in einer anderen Sprache als der Originalsprache erstellt werden.

Natürlich: Das alles ersetzt keine von Menschen erstellte Übersetzungen, egal ob offene oder verdeckte. Angesichts der zahlreichen wissenschaftlichen Publikationen ist dies jedoch ein naheliegender Weg, um die Qualität wissenschaftlichen Arbeitens zu steigern, denn:

Partizipation wird erhöht, da Sprachschranken fallen.
Eine sprachliche Auseinandersetzung mit dem eigenen Text (weil die:der Autor:in mit möglichen maschinellen Übersetzungen rechnet) erhöht die Sensibilität für verschiedene kulturelle Kontexte und Bedeutungsunterschiede.

Wahrscheinlich ist sprachliche Diversität nicht für alle wissenschaftlichen Disziplinen gleich wichtig. Für weite Teile der Geistes- und Sozialwissenschaften ist sie es m.E. aber auf jeden Fall.

Bereits erschienen:

Teil 1, Schreib- und Rechercheunterstützung durch KI: Systeme der Künstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.

Literatur

Bubenhofer, Noah. 2020. Visuelle Linguistik: Zur Genese, Funktion und Kategorisierung von Diagrammen in der Sprachwissenschaft. De Gruyter. https://doi.org/10.1515/9783110698732.

Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 1

Noah Bubenhofer — Thu, 08 Dec 2022 11:59:32 +0000

Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Trotzdem plagen wir uns noch immer mit Textverarbeitungsprogrammen, die zwischen Schreibmaschine und Code-Editor stecken geblieben sind. Und in den Wissenschaften wird noch immer darüber gestritten, was die richtige Publikationssprache ist, wie zitiert werden soll und wie Plagiate entdeckt werden können. In naher Zukunft könnte sich das Schreiben von wissenschaftlichen Texten so stark verändert haben, dass diese Fragen obsolet geworden sind. Dies ist Teil 1 einer Serie.

Thesen

Wenn es um das Schreiben von wissenschaftlichen Texten geht, zu dem ich auch die Recherche zähle, dann könnte es in den kommenden Jahren zu grossen Veränderungen kommen. Das hat etwas zu tun mit den neuen Möglichkeiten von grossen Sprachmodellen, die für Künstliche Intelligenz verwendet werden, wie das z.B. bei ChatGPT gerade sichtbar ist. Aber es hängt auch damit zusammen, dass sich nun endlich die Möglichkeit ergibt, Schreiben mit Computern nicht mehr als besseres Schreiben mit Schreibmaschinen aufzufassen, sondern ganz neu zu denken.

Hier die fünf Thesen, über die ich im Folgenden schreiben möchte:

Schreib- und Rechercheunterstützung durch KI: Systeme der Künstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.
Die Frage nach der richtigen Publikationssprache ist obsolet: Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren möchten. (Vgl. dazu Teil 2.)
Vorgaben von Institutionen und Disziplinen zu bestimmten Bibliographieformaten sind überflüssig: Zitation kann endlich völlig losgelöst von Formalitäten betrachtet werden. (Vgl. dazu Teil 3.)
Keine Plagiate mehr: Weil Zitation und Übernahme von Ideen sowieso technisch anders gelöst werden und Rechercheprozesse mit KI-Unterstützung anders verlaufen, wird es auch keine Plagiate mehr im eigentlichen Sinn geben.
Andere Maschinen und Programme: Die Maschinen und Programme, mit denen wir wissenschaftliche Texte schreiben, müssen sich radikal verändern. Word & Co, OpenOffice aber auch LaTeX oder kollaborative Software wie Google Docs, Onlyoffice etc. sind völlig ungeeignete Tools. Auch die Computersysteme, mit denen wir arbeiten (Laptops, externe Bildschirme, Tastaturen, Tablets), sind ungeeignet.

Schreib- und Rechercheunterstützung durch KI

Till Heilmann unterscheidet in seinem Buch „Textverarbeitung“ drei Arten des Schreibens mit und für den Computer: Schreiben für den Computer, aber nicht mit den Computer (z.B. Programmieren mit Lochkarten), Schreiben für den Computer und mit dem Computer (Programmierung in einem Editor auf dem Computer) und Schreiben mit dem Computer aber nicht für den Computer: Klassische Textverarbeitung.

Diese drei Typen des Schreiben haben historisch auch die Entwicklung von Maschinen und Programmen geprägt: Die mechanische Schreibmaschine wurde von der elektrischen abgelöst, die dank Speicher eine erste Entfernung von Tippen und Drucken ermöglichte: Vor der Ausgabe der Zeile auf das Papier konnte die Eingabe überprüft und ggf. korrigiert werden.

Die ersten Computer wurden programmiert, indem Stecker gesteckt oder später Lochkarten gestanzt worden sind: Die Planung und das Verfassen des Programms geschah ausserhalb des Computers, was auf Dauer unpraktisch war: So wurden die Idee geboren, Computern ein Betriebssystem zu geben und darauf aufbauende Software, Editoren, mit denen das Programm direkt auf dem Computer erstellt und dessen Ausführung überwacht und das Programm sofort korrigiert werden konnte.

Erst danach entstand die Idee, solche Editoren auch für das Schreiben von beliebigen anderen Texten zu verwenden und somit die Vorteile der Live-Beeinflussung eines Textes, die mit dem Computer möglich geworden ist, zu nutzen.

Diese beiden Entwicklungsstränge – programmieren (schreiben für den Computer) und schreiben (für uns) – führten zu zwei unterschiedlichen Textverarbeitungssoftware-Typen:

Editor: Hier BBEdit für Mac 12.67

Word Processor: Hier Microsoft Word für Mac 16.66

In beiden kann beides gemacht werden. Ein Editor zeichnet sich jedoch dadurch aus, dass sein Dateiformat ein sog. txt-Format ist, also problemlos in jedem beliebigen Editor geöffnet werden kann. Zudem bietet er meistens sog. „Syntax Highlighting“, zeichnet also Strukturelemente und Befehle einer Programmiersprache farbig aus und bietet verschiedene Hilfestellungen für das Schreiben des Programmcodes. Zudem spielt der Druck eine untergeordnete Rolle: Die Länge des Textes orientiert sich nicht an Seiten, sondern an Zeilen. Wenn aus der Text- oder Programmstruktur eine logische Hierarchie ableitbar ist, hat diese Auswirkungen auf die verschiedenen Visualisierungen des Textes: Zeilen, die hierarchisch einer anderen Zeile untergeordnet sind, können z.B. ein- und ausgeklappt werden.

Elektrische (IBM 6783) und mechanische (Hermes Media 3) Schreibmaschinen in Noahs Machines-Cultures-Lab

Ganz anders die Textverarbeitung: Sie zeigt noch immer Spuren der mechanischen Schreibmaschine: Es gibt einzustellende Ränder, Tabulatoren und eine grundsätzliche Orientierung an Seiten. Sie widerspiegeln jedoch auch die Bedürfnisse des Satzes und Drucks: Auszeichnungen spielen eine grosse Rolle: Fettdruck, kursiv, unterstrichen. Es können Schriftarten und -grössen ausgewählt und der Text gestaltet werden. Die meisten Textverarbeitungen folgen dem WYSIWYG-Prinzip: What you see is what you get, die Darstellung auf dem Bildschirm entspricht dem Druck. Bravo, von Xerox Parc 1974 veröffentlicht, gilt als erstes Textverarbeitungsprogramm mit grafischer Benutzeroberfläche und WYSIWYG.

Die Textverarbeitung bietet jedoch noch mehr: Formatvorlagen. Ein Konzept, das mit dem Editor mehr gemeinsam hat. Es handelt sich dabei um logische statt grafische Auszeichnungen: Titel 1. Ordnung, 2. Ordnung, Hervorhebung etc. werden Absätzen oder Zeichenketten zugewiesen. Die grafische Darstellung dieser Kategorien kann im Nachhinein beliebig geändert werden und es ist ein Leichtes, aus einem so formatierten Text automatisch die Titel auszulesen und ein Inhaltsverzeichnis zu erstellen.

Computergenerationen und Generationen von Textverarbeitungsprogrammen: Macintosh IIci, Macintosh Plus (mit MacWrite) und Apple II (mit Apple Writer II) in Noahs Machine-Cultures-Lab

Die meisten Textverarbeitungen erlauben jedoch einen wilden Mix verschiedener Prinzipien: Absätze können über Formatvorlagen formatiert werden, gleichzeitig jedoch auch grafisch, so dass im schlimmsten Fall nicht sichtbar ist, ob hinter der Formatierung eine logische Information steckt oder nicht.

Textverarbeitungen sind also einerseits Sprösslinge von Editoren und enthalten bis heute bestimmte Elemente von ihnen (logische Auszeichnungen, Suchen- und Ersetzen-Funktion, Anzeige im Entwurfsmodus ohne Paginierung), andererseits sind die Simulationen von Schreibmaschinen und Satz- und Layoutsystemen.

Nach und nach sind aber Unterstützungen hinzugekommen:

Rechtschreib- und Grammatikkontrolle
Wörterbücher und Thesauri
Automatische Indexerstellung (Inhaltsverzeichnisse, Register)
Bibliographiesoftware in Textverarbeitung eingebettet, um das Zitieren zu erleichtern
Layouthilfen in Form von Styles, die einem Dokument verpasst und auch wieder geändert werden kann
Integration von Inhalten aus anderen Programmen wie z.B. eines Diagrams aus einer Tabellenkalkulation mit Live-Update
etc.

Nicht alle Benutzer:innen verwenden diese Unterstützungen. Ich beobachte bei meinen Studierenden aber auch Kolleg:innen in der Germanistik beispielsweise, dass der Einsatz von einer Bibliographiesoftware wie Zotero alles andere als üblich ist. Und das hängt wahrscheinlich damit zusammen, dass Textverarbeitung heute noch immer auf zwei völlig unterschiedlichen Kulturen beruht: Entweder der Schreibmaschinenkultur oder der Programmierkultur. Letztere möchte möglichst viele Routineaufgaben an die Maschine delegieren und nimmt dafür in Kauf, Daten strukturiert aufzunehmen (z.B. eine Bibliographiesoftware zu benutzen). Erstere kommt gar nicht auf die Idee, dass die Maschine sehr viel an Routineaufgaben übernehmen könnte und findet es zu aufwändig, einen Initialaufwand zu tätigen, um dann hinterher effizienter arbeiten zu können.

MacWrite auf Macintosh Plus von 1984, eines der ersten grafischen Textverarbeitungsprogrammen

Nun gibt es aber mit den Möglichkeiten moderner „Künstlicher Intelligenz“ neue Möglichkeiten. Diese Systeme beruhen auf Sprachmodellen, die anhand sehr grosser Datenmengen gelernt haben, Wissensbestände zu reproduzieren und auf neue Daten anzuwenden. Ein Beispiel ist das neuste OpenAI-Modell, mit dem über das Interface ChatGPT kommuniziert werden kann.

Damit sind erstaunliche Dinge möglich. Ich kann zum Beispiel fragen:

Frage: Wie veränderte sich das Schreiben von Texten mit der Schreibmaschine im Vergleich zu heute? Was waren die entscheidenden Erfindungen, die das Schreiben verändert haben?

Antwort: Mit der Erfindung der Schreibmaschine im 19. Jahrhundert wurde das Schreiben von Texten deutlich schneller und einfacher. Durch die Möglichkeit, Buchstaben auf einem Blatt Papier mithilfe von Tasten statt mühsam mit der Hand zu schreiben, konnten Schriftstücke schneller verfasst werden. Die Schreibmaschine war auch ein wichtiger Fortschritt in Bezug auf die Lesbarkeit von Texten, da die Schrift durch die Nutzung der Maschine im Vergleich zur Handschrift klarer und deutlicher wurde.

Eine weitere wichtige Erfindung in Bezug auf das Schreiben von Texten war der Computer. Durch den Einsatz von Computern und Schreibprogrammen konnten Texte noch schneller und einfacher verfasst werden. Auch die Möglichkeit, Texte zu bearbeiten und zu korrigieren wurde deutlich verbessert.

Insgesamt hat sich das Schreiben von Texten durch die Nutzung von Schreibmaschinen und Computern deutlich verändert und ist heute ein viel schnellerer und einfacherer Prozess als noch vor Jahrzehnten.
ChatGPT, Dialog vom 6. Dezember 2022

Der Dialog kann fortgeführt werden und dabei kann das System auf die vergangenen Sequenzen zugreifen.

Es ist aber auch Folgendes möglich:

Frage: Ich möchte ein Script, das ein grosses Korpus als Text-Datei einliest, mit word2vec ein Modell berechnet und es dann clustert.

Antwort: Hier ist ein einfaches Beispiel für ein Python-Script, das ein großes Korpus als Textdatei einliest, mit dem Word2Vec-Modell von Gensim berechnet und anschließend clustert.

import gensim
from gensim.models import Word2Vec
from gensim.utils import simple_preprocess

# Einlesen des Korpus als Textdatei
with open("korpus.txt", "r") as f:
    text = f.read()

# Tokenisieren des Korpus (Aufteilen des Textes in einzelne Wörter oder "Tokens")
tokens = simple_preprocess(text)

# Berechnen des Word2Vec-Modells
model = Word2Vec(tokens, size=100, window=5, min_count=5, workers=4)

# Berechnen der Word2Vec-Vektoren für die Wörter im Korpus
vectors = [model[word] for word in model.wv.vocab]

# Clustern der Word2Vec-Vektoren mithilfe des K-Means-Algorithmus
kmeans = KMeans(n_clusters=10)
kmeans.fit(vectors)

# Ausgabe der zugewiesenen Cluster für jedes Wort im Korpus
clusters = kmeans.predict(vectors)
for i, word in enumerate(model.wv.vocab):
    print(f"{word}: {clusters[i]}")

Das Script berechnet das Word2Vec-Modell für das gegebene Korpus und clustert anschließend die Vektoren der Wörter mithilfe des K-Means-Algorithmus. Die zugewiesenen Cluster für jedes Wort werden dann ausgegeben.

Bitte beachte, dass dieses Beispiel sehr einfach gehalten ist und möglicherweise nicht für alle Anwendungsfälle geeignet ist. Für eine genauere und zuverlässigere Berechnung von Word2Vec-Modellen und Clustern könnten weitere Schritte wie die Feinabstimmung der Modellparameter oder die Verwendung anderer Clustering-Algorithmen erforderlich sein. Es wäre immer empfehlenswert, sich im Detail mit der Materie auseinanderzusetzen und gegebenenfalls professionelle Hilfe in Anspruch zu nehmen.
ChatGPT, Dialog vom 7. Dezember 2022

Viele Experimente mit ChatGPT testen, ob das Sprachmodell inhaltlich sinnvolle und interessante Texte produzieren kann. Das geht bis zu einem gewissen Grad, ist jedoch primär ein recht langweiliges Paraphrasieren von bestehenden Wissensbeständen. Viel interessanter ist es jedoch, damit die Brücke zwischen Schreibmaschinenkultur und Programmierkultur zu überwinden. Mögliche Aufgaben, die an eine KI ausgelagert werden könnten sind zum Beispiel (* = bereits möglich mit ChatGPT):

Fasse mir bitte den Forschungsstand zum Thema XY der letzten fünf Jahre zusammen.
Erstelle ein Abstract meines Textes. *
Nenne mir Definitionen von XY in der Fachliteratur. (*)
Paraphrasiere bitte diese Tabelle mit den statistischen Werten in drei Sätzen. *
Beschreibe, was im Fach unter XY verstanden wird. (*)

Neben solchen Aufgaben, die eher inhaltlicher Natur sind, gibt es aber auch viele eher technische Aufgaben:

Ich habe hier eine Liste von Aufsätzen in einem unstrukturierten Format: Bitte konvertiere sie in ein strukturiertes Format, so dass ich sie einfach in meine Bibliographiesoftware importieren kann. *
Überprüfe bitte die Zitate auf ihre Korrektheit und bibliographiere sie richtig.
Objektsprache sollte kursiv sein, ich habe vergessen, eine entsprechende Formatvorlage zu benutzen. Bitte erstelle eine Formatvorlage „Objektsprache“, finde alle Passagen mit Objektsprache und weise diese Formatvorlage zu. Definiere die Formatvorlage mit Schriftart „kursiv“.
Zeitschrift XY will in der Bibliographie immer einen Punkt nach den Autor:innennamen und das Jahr am Ende, bitte ändere das entsprechend. (*)
Erstelle mir ein Python-Script, um diese Wertetabellen in ein Diagramm zu konvertieren. *

Die letzte Aufgabe könnte natürlich auch unter Verwendung einer Bibliographiesoftware leicht erfüllt werden, aber noch bequemer ist es so.

Auch der Forschungs- und Rechercheprozess könnte durch die KI unterstützt werden:

Überprüfe bitte, wie sich die Verwendung des Ausdrucks „Heimat“ in den letzten fünf Jahren in Schweizer Medien verändert hat. Ich hätte gerne nach Monaten aggregierte relative Häufigkeiten (pro Mio. Wörter) und eine Tabelle der verwendeten Quellen.
Erstelle ein Script, um diese Textdateien, die alle das Muster XY haben, in XML-Dokumente zu konvertieren, damit ich sie hinterher mit der Software Z verarbeiten kann. *
Erstelle ein Script, um diese Manuskripte über die API von Transkribus mit dem Modell XY zu bearbeiten.

Folgen

Das Schreiben wird sich unter Einsatz von KI stark verändern – diese Veränderungen stehen aber ein einer langen Tradition der maschinellen Unterstützung des Schreibens vom Papier zum Bildschirm und von der Feder über die Schreibmaschine zum Computer. Endlich bietet sich nun aber die Chance, dass Schreibmaschinenkultur und Programmierkultur auf dem Computer zusammenwachsen.

Allerdings mit Folgen:

Welche Kompetenzen sind notwendig, um KI zu nutzen? Denn die Aufgabe muss sinnvoll gestellt und das Ergebnis korrekt eingeschätzt werden können – es muss angepasst, korrigiert und erweitert werden. Wir benötigen deshalb Data-Literacy und KI-Literarcy.
Viele Tätigkeiten wissenschaftlichen Arbeitens, die man bislang als wichtig erachtete, werden unwichtig: Bibliographieren und zitieren nach einem bestimmten Stil, Forschungsstand erarbeiten, viel zitierte Fachliteratur identifizieren und paraphrasieren.
Daraus folgt zwangsweise, dass in der Lehre neue Bewertungskriterien für die Bewertung von Qualifikationsarbeiten und von wissenschaftlichem Arbeiten gefunden werden müssen. Es macht keinen Sinn, darauf zu pochen, dass das Literaturverzeichnis vollständig ist oder nach Schema X formatiert ist – das ist eine Aufgabe, die wir an den Computer delegieren können. Auch die Paraphrasierung eines Forschungsstandes ist eher uninteressant – dessen Einordnung und die daraus abzuleitenden Folgerungen sind es aber natürlich sehr.
Was jedoch dringend nötig ist: Die Förderung von Data-Literacy und KI-Literacy: Das Lesen und interpretieren von Daten, ein profundes Verständnis von Digitalität und Künstlicher Intelligenz – deren Chancen, Grenzen und Gefahren.
Und ganz besonders: KI ist extrem attraktiv, ist jedoch immer stärker in den Händen kommerzieller Unternehmen. Für Universitäten wird es immer schwieriger, technologisch mitzuhalten, weil dafür einerseits viel Geld nötig ist, andererseits sich Universitäten eher an rechtliche und datenschützerische Schranken halten und deshalb an viele Daten gar nicht herankommen. Kommerzielle Unternehmen haben aber das Geld, um das Risiko von rechtlichen Auseinandersetzungen problemlos tragen zu können. Es ist daher schwierig, KI-gestützte Software als OpenSource-Software zu verbreiten.

Das ist aber noch nicht alles. Im nächsten Teil gehe ich darauf ein, warum die Frage zu Publikationssprachen in der Wissenschaft eigentlich vorbei sein sollte, vorausgesetzt wir entwickeln einen besseren Umgang mit Maschineller Übersetzung.

Kontext

Ich unterrichte momentan ein Seminar zum Thema „Stenographie, Schreibmaschine, Computer, Virtual Assistants: Die Kommunikationsgeschichte von Schreibkulturen“, in dessen Rahmen wir ebenfalls bloggen und uns rege austauschen – Dank an die Studierenden! Dadurch beschäftigte ich mich stark mit den medialen und kulturellen Bedingungen und Veränderungen des Schreibens mit Maschinen. Der Medienwissenschaftler Till Heilmann, Autor des Buches Textverarbeitung: Eine Mediengeschichte des Computers als Schreibmaschine, besuchte unser Seminar, ebenso der Linguist Andi Gredig; er verfasste das Buch Schreiben mit der Hand. Begriffe – Diskurs – Praktiken. Im regen Austausch zu medialen Bedingungen des Schreibens und zu maschineller Verarbeitung und Analyse von Text bin ich zudem mit Joachim Scharloth, Philippe Wampfler, Maaike Kellenberger, Julia Krasselt und vielen weiteren Personen. Danke!

Das automatisierte Guetzli-Rezept

Noah Bubenhofer — Wed, 15 Dec 2021 16:09:27 +0000

200 g Zucker
300 g Mehl
2 EL Butter
1 TL Zucker
2 EL Zitronensaft

absolut durchschnittlich!

200 g Zucker
300 g Mehl
2 EL Butter
1 TL Zucker
2 EL Zitronensaft
mit Salz, Pfeffer und
und das Fleisch
und den Saft
in einen Topf
durch ein Sieb
gut verrühren.

mediokrer geht’s nicht!

Den Teig in
Schüssel geben und
Kartoffeln schälen und
mit den Gewürzen
in dünne Scheiben
mit dem Zucker
köcheln lassen,
abtropfen lassen und
darauf verteilen.

in Ringe schneiden
in mundgerechte Stücke
in kleine Stücke schneiden
zu einem glatten
Teig verarbeiten.
vom Herd nehmen
gut abtropfen lassen
und nach Belieben
mit Puderzucker bestäuben
beiseite stellen.

Zum Schluss die
Kartoffeln schälen,
halbieren und
ständigem Rühren
Pfanne erhitzen und
glatt streichen.

Ich habe allerdings
und muss sagen
mich sehr, dass
schmeckt sehr gut,
weil ich
Vielen Dank für die
sehr lecker.
! ! ! ! !

Dies ist das Rezept aller Rezepte:

Eine korpuslinguistische Berechnung der typischsten Phrasen von Chefkoch.de-Rezepten (98 Mio. Wörter, 321316 Rezepte) im Vergleich zu Zeitungstexten. Halbzufällige Anordnung der Anweisungen. Zumindest der Form nach back- und kochbar – keine Garantie dafür, dass es schmeckt.

Mit den besten Weihnachtswünschen: Kochcrew Noah Bubenhofer

Von tu- und anderen Wörtern: tuwort Linguistik-Podcast

Noah Bubenhofer — Fri, 19 Nov 2021 20:42:15 +0000

Ich freue mich, zusammen mit Sandra Hansen und Joachim Scharloth den tuwort-Podcast vorstellen zu können! Unsere erste Ausgabe #0 ist online: https://www.tuwort.com/

Die Themen dieser Episode:

Die Sprachwissenschaft hat herausgefunden, dass „Missgeburt“ kein gruppenbezogenes Beleidigungswort ist, „Spasti“ aber schon.
Können Häftlinge schwanger sein und können Flüchtlinge ein Kleid tragen?
Kann man Sprache berühren?

Sowie ein Blick in die Presse!

Iss den Teller leer, dann…

Noah Bubenhofer — Thu, 08 Jul 2021 17:50:45 +0000

…gibt es morgen schönes Wetter! So würden wir den Satzanfang wohl ergänzen – und die aufgeklärten Leserinnen und Leser fragen sich, was denn das Wetter mit dem leeren Teller zu tun haben soll. Natürlich nichts, wie mein kompetentes Publikum wohl weiss: Offenbar ein Übersetzungsfehler aus dem Plattdeutschen „Et dien Töller leddig, dann givt dat morgen goods wedder.“ Das plattdeutsche „wedder“ heisst nicht „Wetter“, sondern „wieder“. Iss aus, dann gibts morgen wieder was Gutes!

So einfach und so klar. Aber was lehrt uns das Beispiel über Sprachgebrauch?

Wirklich interessant an der Sache ist nämlich nicht der Übersetzungsfehler (über den Radio Zürisee heute von mir Auskunft wollte), sondern Folgendes:

Mit Sprache handeln wir: Wir erziehen mit Sprichwörtern (tja, der Ton macht die Musik, weisst du? Hopp, aus den Federn, Morgenstund hat Gold im Mund!) oder drohen (Lügen haben kurze Beine!). Wir beschwichtigen und trösten: Geld allein macht nicht glücklich, die Letzten werden die Ersten sein.
In Sprachgebrauch ist kulturelles und gesellschaftliches Wissen codiert, aber auch Überzeugungen, Ideologien und Mentalitäten. Wo die Redensart „iss den Teller leer, dann ist morgen schönes Wetter“ verwendet wird, ist es offenbar kulturell angemessen, keine Reste auf dem Teller zu lassen. Das ist nicht überall so – ich erinnere mich an meinen Fauxpas in Osteuropa, als Gast schön brav auszutrinken und auszuessen – um zuzusehen, wie der Teller und das Glas wieder aufgefüllt wurden, obwohl ich genug hatte.
Die Diskurs- und Kulturlinguistik erforscht dieses in Sprache codierte Wissen ganz systematisch.
Im Sprachgebrauch – dem ewigen Sprachspiel (Wittgenstein) – sind Missverständnisse an der Tagesordnung – aber kein Problem. Kommunikation ist nicht einfach Sender – Kanal (Nachricht) – Empfänger, sondern weitaus komplexer: Ein laufendes Aushandeln von Bedeutung, bei dem zwar Leute irgendwelche Intentionen hegen, im Ergebnis jedoch ein unvorhersehbares Schlamassel entsteht. Ein Schlamassel allerdings, das Zeuge der laufenden Sprachhandelsprozesse ist. Wenn die plattdeutsche Redensart in der falschen Übersetzung ein kommunikatives Bedürfnis erfüllt, dann bewährt sie sich eben und bleibt erhalten.
Interessant dabei: Wenn etwas sprachlich gut klingt, dann tendieren wir dazu, es auch für wahr und wichtig zu halten. Deshalb lieben wir Sprichwörter. Jedoch: Ein Reim ist noch kein Argument.

COVID-19: Vor und nach dem 13. März 2020

Noah Bubenhofer — Sun, 19 Apr 2020 22:04:49 +0000

Eine Pandemie, wie die gegenwärtige des COVID-19-Virus, ist einerseits ein medizinisches Problem. Andererseits ein kommunikatives Phänomen. Als Linguistinnen und Linguisten am meinem Lehrstuhl beobachten wir den COVID-19-Diskurs momentan genau, um Rückschlüsse zu ziehen, wie die Gesellschaft auf die Pandemie reagiert. Und wir wollen wissen, wie diskursiv gehandelt wird: Wie wird COVID-19 diskutiert und damit gefasst? Welche Handlungen folgen daraus?

Basis der aktuellen Analyse ist ein Korpus von gut 324.000 Kommentaren in den Onlinemedien 20 Minuten, SRF Online, Nau.ch und Blick.ch zu Artikeln über das Coronavirus zwischen Januar und Mitte April 2020. Das sind gut 10 Mio. Wörter. Anstelle einer klassischen Medienanalyse interessieren wir uns also für die Reaktionen der Leserinnen und Leser auf die Berichterstattung.

Wir werden in den kommenden Wochen weitere Analysen veröffentlichen und die Datenbasis laufend ausbauen.

Heute geht es um die grobe Charakteristik des Diskurses – und den Wendepunkt am 13. März 2020: An diesem Tag verkündete der Bundesrat einschneidende Massnahmen in der Schweiz: Geschlossene Schulen, keine grösseren Veranstaltungen mehr und Grenzbeschränkungen. Welche Themen beherrschten den Diskurs davor und welche danach?

Eine Keyword-Analyse der beiden Teilkorpora (Kommentare vor dem 13. März – Prä-Lockdown – und solche vom und nach dem 13. März – Lockdown) zeigt, wie sich der Diskurs in der Zeit verändert hat. Berechnet wurde, welche Wörter für die jeweilige Zeitperiode statistisch auffallend sind.

Typisch für die Phase Prä-Lockdown sind Kommentare, die das Virus selbst thematisieren und mit anderen Viren vergleichen:

Prä-Lockdown: Virus, Grippe, Coronavirus, Viren, Inkubationszeit, Sars

Wichtiges Thema sind zudem die abgesagten Veranstaltungen:

Prä-Lockdown: Fasnacht, Basler, abgesagt, Fasnächtler, Veranstaltungen, Playoffs, Zuschauer, ZSC, Autosalon, Fans

Beide Aspekte, also das Virus selber und die Veranstaltungen, sind in den Kommentaren nach dem 13. März kein wichtiges Thema mehr. Auch Ausdrücke, die Ängste und Panik thematisieren, sind charakteristisch für die Prä-Lockdown-Phase, nicht aber für die Lockdownphase:

Prä-Lockdown: Panik, Hysterie, Angst, Panikmache, Panikmacherei

Der nationale und internationale Verkehr sind in der Prä-Lockdown-Phase ein viel diskutiertes Thema, das mit der Frage, ob die Grenzen geschlossen werden sollen oder nicht verbunden ist:

Prä-Lockdown: abgeriegelt, Grenze, Grenzen, Zug, Flughäfen, schliessen, Pendler, Züge

Zudem werden verschiedene Verhaltensmassnahmen thematisiert:

Prä-Lockdown: Hände waschen, Quarantäne, Stosszeiten, Ingwer, Händewaschen, Husten

Ganz anders sieht das in der Phase des Lockdowns aus. Der Lockdown selber ist selbstredend wichtiges Thema:

Lockdown: Krise, Lockdown, Ausgangssperre, Polizei, Regeln, Lockerung, Hilfe, Shutdown

Damit verbunden die Verhaltensmassnahmen und Tätigkeiten – vom Hände waschen ist nicht mehr oft die Rede, dafür vom Einkaufen, den Tätigkeiten zuhause und den Virentests:

Lockdown:
Tests
Klopapier, WC-Papier
Abstand, eingehalten
zuhause, Solidarität, zu Hause, draussen, spazieren, Zeit, Garten
einkaufen, bestellen, Haare, Online

Während in der Prä-Lockdown-Phase die wirtschaftlichen Probleme höchstens mit dem Ausdruck „Börse“ auffallend sind, geht es in der Lockdown-Phase um die handfesten Probleme (oder generell Herausforderungen, wie etwa bei der Post) der Wirtschaft:

Lockdown: Swiss, Post, Lufthansa, Kurzarbeit, arbeiten, Baustellen, Vermieter, Kredit, Baustellen, Läden

Schliesslich ein Vergleich der Akteure, die in den jeweiligen Phasen dominant diskutiert werden: In der Prä-Lockdown-Phase sind es:

Prä-Lockdown: Behörden, Medien, BAG, Sanders, Greta

Wir sehen also mit „Sanders“ und „Greta“ noch zwei Verweise auf Diskurse, die vor Corona dominant waren: Die US-Wahlen und der Klimawandel. In Sachen COVID-19 sind die abstrakten Ausdrücke „Behörden“, „BAG“ und „Medien“ auffallend, typisch für pauschalkritische Äusserungen.

In der Lockdown-Phase sind die häufig erwähnten Akteure:

Lockdown: BR, Koch, Pöstler, Senioren

Der Bundesrat wird also seit den Entscheidungen vom 13. März dominanter thematisiert, dazu natürlich Daniel Koch als Leiter der Abteilung «Übertragbare Krankheiten» des BAG. Die Senioren werden als Vertreter der grössten Risikogruppe thematisiert und die Pöstler als wichtige Akteure der Versorgung.

Zum Schluss weisen wir noch auf Ausdrücke hin, die auf den ersten Blick unauffällig erscheinen. Es sind wichtige Ausdrücke, die kommunikatives Handeln im Diskurs repräsentieren:

Lockdown: müssen, wir, Sie/sie, !

Zugenommen haben Formulierungen mit „wir müssen“, die also gesellschaftliche Obligationen postulieren: wir müssen Masken tragen, wir müssen solidarisch sein etc. Aber es wird auch auf jene verwiesen, die „arbeiten müssen“, und auf uns alle, die zuhause „bleiben müssen“. Die Personalpronomen „wir“ und „Sie/sie“ sind auch in der aktuellen Phase dominanter geworden und sind Indikatoren für eine Argumentation aus dem Kollektiv der Gesellschaft heraus („wir“) bzw. der Abgrenzung („Sie“ als Höflichkeitsanrede im direkten Dialog, „sie“ in der 3. Person Plural).

Zudem hat die Verwendung von Ausrufezeichen in den Kommentaren zugenommen – die Diskussionen in den Kommentarspalten sind hitziger geworden.

Ausrufe- und Fragezeichen sind für die Corona-Kommentare jedoch ganz generell bezeichnend. Während die Analyse oben nur die Unterschiede zwischen den beiden Phasen analysiert hat, folgt zum Schluss nun noch eine Liste der Ausdrücke, die für die Kommentare generell charakteristisch sind (im Vergleich mit einem allgemeinen Zeitungskorpus):

Satzzeichen !, …, ?
Ich, Virus, ja, nicht, du, man, Corona, was, Schweiz, ist, wenn, es, da, Grippe, mal, Masken, so, dann, Massnahmen, alle, Danke, jetzt, alles, einfach, bitte, Leute, selber, euch, %, weiss, wir, kann, genau, BAG, sind, nur, nichts, mir, zuhause, Coronavirus, leider, aber, auch, schon, Schweizer, arbeiten, noch…

Weitere Analysen werden folgen.

Team: Noah Bubenhofer, Livia Sutter, Niclas Bodenmann, Daniel Knuchel, Maaike Kellenberger