Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3

Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Im dritten Teil der Serie möchte ich auf meine dritte These eingehen: Vorgaben von Institutionen und Disziplinen zu bestimmten Bibliographieformaten sind überflüssig; Zitation kann endlich völlig losgelöst von Formalitäten betrachtet werden.

Eigentlich könnte es schon längst der Fall sein, dass die Formate von Bibliographien und des Zitierens eine rein individuelle Sache sind: Mögen Sie Zitationen als Fussnoten oder lieber im Text? Soll die Bibliographie alphabetisch nach Autor:innen-Name oder numerisch nach Reihenfolge der Nennung im Text angeordnet sein? Soll die Jahreszahl in Klammern stehen und was genau des Titels soll hervorgehoben sein?

Viele Publikationsorgane (Journals, Verlage) und Fächer an Universitäten bestehen nach wie vor auf bestimmten Formaten: APA, Harvard, Chicago, DIN… In Seminararbeiten wird überprüft (und bewertet), ob das Format korrekt eingehalten worden ist, der beim Journal eingereichte Artikel kommt mit formalen Korrekturen in der Bibliographie zurück.

Klug, wer schon lange das bibliographieren und zitieren nicht händisch macht, sondern Software dafür nutzt, z.B. Zotero:

Verwendung einer Literaturverwaltungs-Software wie Zotero

Praktisch jede Publikation hat eine ID, z.B. eine DOI (Digital Object Identifier, im Jahr 2000 gegründet), Bücher eine ISBN (definiert 1972) und die Bibliotheken und der Buchhandel bemühen sich seit Jahrzehnten, strukturierte Formen der Titelerfassung zu nutzen.

Eine Software wie Zotero schlägt über die Eingabe solcher Identifier die bibliographischen Daten in verschiedenen Datenbanken nach und produziert bei der Verwendung jede denkbare Formatierung des Titels. Wer konsequent mit einer solchen Software arbeitet, investiert ein bisschen Zeit in die Pflege der eigenen Titeldatenbank, erhält dafür am Ende des Textes automatisch das korrekt nach einem bestimmbaren Stil formatierte Literaturverzeichnis.

So weit, so gut. Doch:

  • Warum sind Zitationsstile überhaupt noch relevant? Warum liegt die Entscheidung für den gewünschten Stil nicht in der Hand der Leserin?
  • Warum tun sich doch immer noch viele Forschende schwer, den Umgang mit Literatur in die Hände von Software zu legen?
  • Und können wir dank Künstlicher Intelligenz uns vielleicht sogar von der strukturierten Literaturerfassung mit Literaturverwaltungssoftware verabschieden?

Leserin entscheidet

Bei digital präsentierten Texten müssten eigentlich der Zitationsstil und das Format der Bibliographie gar nicht von der Autorin des Textes definiert werden müssen. Es reicht ja beim Schreiben, den richtigen Identifier zu hinterlegen und erst bei der Darstellung des Textes wird entschieden, nach welchem Stil formatiert wird. Wenn die Leserin lieber Fussnoten hätte: bitteschön! Die sind die Pest? Dann halt inline. Die Bibliographie selber ist eigentlich auch nicht nötig: Die Vollanzeige des Titels kann ja z.B. beim Hovern über die Zitation direkt angezeigt werden. Aber wenn die Leserin lieber eine Liste aller zitierten Titel hätte: Auch kein Problem.

Die Hürde, so zu denken, ist das PDF-Format, das nach wie vor unheimlich beliebt aber eigentlich völlig ungeeignet ist, um digitale Texte anzuzeigen. Es folgt der Logik der Schreibmaschinenkultur des Schreibens: Ein Text wird in einer bestimmten Form gesetzt – und so bleibt er. Mit HTML (oder Markdown) stünden Formate bereit, die einen Text erst im Moment des Anzeigens setzen (rendern). Viele Verlage bieten HTML-Ansichten von Texten inzwischen an, das PDF hält sich aber hartnäckig. Zudem schreiben wir normalerweise nicht in HTML, sondern in einer Textverarbeitungssoftware, die sich nicht entscheiden kann, ob sie der Schreibmaschinenkultur oder der Programmierkultur des Schreibens folgen will.

Unwille, Software zu nutzen

Selbst wenn man nicht den Traum der rezeptionsorientierten Darstellung von Text träumt, müsste die Nutzung von Literaturverwaltungssoftware attraktiv sein. Trotzdem zögern viele Forschende, wahrscheinlich oft in den Geisteswissenschaften, sie zu nutzen: Die Software mit den Titeln zu füllen, bedeutet Arbeit, wenn man nicht schon lange konsequent damit gearbeitet hat. Wenn dieser Schritt geschafft ist, dann gilt es nur, immer konsequent zu sein: Alles, was man an Literatur so findet, muss man sofort in die Datenbank importieren – oft reicht zum Glück ein Klick im Browser.

Doch: Müsste es nicht doch viel einfacher gehen?

Künstliche Intelligenz: Zurück zum Unstrukturierten

Dieser Gedanke kam mir, als ich die Publikationsliste auf der Webseite meiner Kollegin Konstanze Marx anschaute:

2023 mit Simon Meier-Vieracker, Lars Bülow und Robert Mroczynski. Digitale Pragmatik: Einleitung. In: Meier-Vieracker, Simon/Bülow, Lars/Marx, Konstanze/Mroczynski, Robert (Hrsg.): Digitale Pragmatik. Stuttgart: Metzler, 1–12.
2022 mit Janine Luth und Christian Pentzold. Ethische und rechtliche Aspekte der Analyse von digitalen Diskursen. In: Gredel, Eva und das DFG-Netzwerk (Hrsg.): Diskurse – digital: Theorien, Methoden, Anwendungen. Berlin, Boston: de Gruyter, 99–134.
2022 Schwimmen im Strudel oder Datenerhebung im Spannungsfeld zwischen Ethik und Erkenntnisinteresse. In: Beißwenger, Michael/Lemnitzer, Lothar/Müller-Spitzer, Carolin (Hrsg.): Forschen in der Linguistik. Eine Methodeneinführung für das Germanistik-Studium. Paderborn: Brill|Fink (UTB 5711), 292–303.

https://www.konstanze-marx.de/publikationen/

Ungünstig, wenn man diese Titel in eine Literaturverwaltungssoftware importieren will. (Ich erinnerte mich daran, dass ich vor langer, langer Zeit mal einen Parser programmierte, der versuchte, solche Literaturangaben automatisch in ein strukturiertes Format zu konvertieren…) Doch ein Sprachmodell wie ChatGPT kennt sich mit Mustern prima aus, deshalb:

Prompt: Hier sind Publikationen von Konstanze Marx. Bitte formatiere sie im RIS-Format (mit ausgeschriebenen Vornamen):
[Liste der Publikationen von oben]

Antwort:
TY – BOOK
AU – Marx, Konstanze
AU – Meier-Vieracker, Simon
AU – Bülow, Lars
AU – Mroczynski, Robert
PY – 2023
TI – Digitale Pragmatik: Einleitung
T3 – Digitale Pragmatik
PB – Metzler
CY – Stuttgart
SP – 1
EP – 12

TY – CHAP
AU – Marx, Konstanze
AU – Luth, Janine
AU – Pentzold, Christian
PY – 2022
TI – Ethische und rechtliche Aspekte der Analyse von digitalen Diskursen
BT – Diskurse – digital: Theorien, Methoden, Anwendungen
ED – Gredel, Eva
ED – DFG-Netzwerk
PB – de Gruyter
CY – Berlin, Boston
SP – 99
EP – 134

[…]

ChatGPT-Dialog vom 27. Februar 2023

Das Sprachmodell ist also in der Lage, aus den unstrukturierten Daten ein strukturiertes Format zu erzeugen, das dann z.B. Zotero problemlos lesen kann.

Damit ergeben sich neue Möglichkeiten:

  • Die Literatur kommt unkomplizierter in eine Literaturverwaltungssoftware.
  • Eigentlich ist eine Literaturverwaltungssoftware gar nicht mehr nötig.

Vielleicht haben die Skeptiker:innen doch Recht: Wir wollen unser wissenschaftliches Leben ja überhaupt gar nicht mit formalem Literaturkram verbringen. Zitationsstile sollten uns sowieso egal sein, aber auch das Jonglieren mit Software ist unnötig. Wenn ich beim Schreiben etwas zitieren will, dann ziehe ich dieses Etwas (ein PDF auf meinem Rechner, ein Browserfenster mit einem geöffneten Paper, eine beliebige andere Webseite) einfach in meine Textverarbeitung und die KI kümmert sich um den Rest. Habe ich das Buch auf meinem Schreibtisch liegen, dann sollte es reichen, es vor die Kamera des Rechners zu halten und die KI weiss Bescheid. Sie prüft, ob es eine ordentliche DOI dazu gibt und die Textverarbeitung speichert diese Information. Publiziere ich meinen Text, dann entscheidet die Leserin und der Leser, welche Darstellung auf dem Device, das sie oder er in Händen hält, gerade am praktischsten ist.

Ich gebe zu: Ich war bisher ein grosser Freund von Literaturverwaltungssoftware. Aber die Zukunft ist es wohl nicht…

Bereits erschienen:

Dieser Beitrag wurde unter Computer, Textverarbeitung abgelegt und mit , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

4 Antworten zu Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3

  1. Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 1 | Sprechtakel

  2. Patrick Sahle sagt:

    1. Stilvorgaben habe ich (und vermutlich andere auch) längst überwunden. Für Bibliographien gelten die drei „e“: eindeutig, einfach, einheitlich. Sonst nichts. Fuß-/Endnoten, Inline-Referenzen? Egal, Hauptsache einheitlich.
    2. Ist das nicht der eigentliche Zweck des Bibliographieterrors? Einerseits strenges, regelgeleiteten Vorgehen einzuüben und andererseits „bibliographische Kritik“ zu lernen: „was ist das hier für ein Informationsobjekt“?
    3. Machst du es dir mit „DOI“ nicht zu leicht? Nach meiner Erfahrung haben 80% der Informationsressourcen (in meinem Fachbereich) keine DOI. Bei Webseiten müssen die Studis manchmal im Code nach Urhebern suchen oder im Internet Archive nach dem Entstehungsjahr. Wer testet ChatGPT? Mach aus dieser Webseite eine bibliografische Angabe mit Autor und Jahr (auch wenn die nicht auf der Seite stehen).
    4. Mein Sohn hat letztens angefangen zu studieren. Keine Geisteswissenschaft, leider. Erste Sitzung Einführungsseminar: „es ist egal, welche Literaturverwaltung ihr benutzt, aber ausgeschlossen, dass ihr keine benutzt“ – so sollte das doch überall sein?

    • Noah Bubenhofer sagt:

      Ja, sehr einverstanden!
      Zu 1: Das ist toll, aber du bist auch DHer! Ich fürchte, da sind nicht alle so fortschrittlich-entspannt…
      Zu 2: Genau, „Bibliographieterror“ als akademische Disziplinierungsmassnahme – endlich können wir uns davon lösen und wichtige Dinge machen…
      Zu 3: Ich weiss nicht, ob DOIs die Lösung sind; es braucht wahrscheinlich eine Mischung von unterschiedlichen Identifiern. Und: Mit der gegenwärtigen Version von ChatGPT geht das noch nicht alles, aber das kann ja noch kommen.
      Zu 4: Klar, das predige ich auch. Aber auch das ist m.E. keine Selbstverständlichkeit. Noch nicht.

  3. Philipp Zumstein sagt:

    ChatGPT macht hier aber einige Fehler: Bei der ersten Publikation handelt es sich um eine Buchkapitel und nicht das gesamte Buch. Ebenfalls fehlen die Herausgeber*innen und der Titel sowie Buchtitel sind nicht richtig aufgetrennt. Zudem fehlt syntaktisch jeweils die ER Tags am Ende einer jeden Referenz.

    Solch ein Parsen von unstrukturierten Literaturangaben ist aber auch nichts Neues; beispielsweise anystyle kann dies bereits seit über 10 Jahren machen. Wieso jetzt grundlegend was anders ist, sehe ich nicht.

    Mit Literaturverwaltungsprogrammen kann man aber auch die ganze gelesene Literatur verwalten und annotieren (im Sinne eines Zettelkastens). Zudem sind etwa Suchfunktionalität nützlich, wenn man sich nur vage erinnert etwas gelesen zu haben, aber nicht mehr genau weiß wo. Diese Funktionalitäten gehen über das Ausspucken einer richtig formatierten Zitation oder eines Literaturverzeichnis hinaus.

    Daher bin ich eher etwas skeptisch, ob ChatGPT oder andere KI-Modelle in einem Bereich wie Literaturverwaltungssoftware viel Veränderung mit sich bringen.

Kommentare sind geschlossen.