Wenn die KI das Denken übernimmt

Eine Untersuchung des Massachusetts Institute of Technology (MIT) lässt den Schluss zu, dass der Einsatz von KI-Assistenten wie ChatGPT beim Verfassen von Texten zu einer „kognitiven Schuld“ führen kann. Damit wird ein Zustand beschrieben, bei dem die an eine KI ausgelagerte „Denkarbeit“ die eigene Lernfähigkeit und kritische Auseinandersetzung mit einem Thema beeinträchtigt.

Forscher des MIT ließen 54 Probanden, fast alle Studierende an Bostoner Universitäten, Essays schreiben. Eine Gruppe nutzte ausschließlich OpenAIs GPT-40 (LLM-Gruppe, Large Language Models), eine zweite Gruppe recherchierte mit Suchmaschinen wie Google (ohne KI-gestützte Antworten; Suchmaschinen-Gruppe). Die dritte Gruppe verfasste ihre Essays ohne KI-Hilfsmittel (Nur-Gehirn-Gruppe). Innerhalb von vier Monaten absolvierten die Teilnehmer drei Essay-Sitzungen, bei denen sie jeweils einen von drei zur Auswahl stehenden SAT-Prüfungsthemen innerhalb von 20 Minuten bearbeiteten. In einer optionalen vierten Sitzung mit 18 Personen wurden die Bedingungen für die LLM- und Nur-Gehirn-Gruppen getauscht (die LLM-Gruppe schrieb jetzt ohne Hilfsmittel, die Nur-Gehirn-Gruppe nutzte erstmals den Bot (Gehirn-zu-LLM), wobei sie ein bereits bekanntes Thema bearbeitet. Zur Datenerhebung und Auswertung setzten die Forscher Elektroenzephalographie (EEG), NLP-Analysen der Essays, Interviews mit und Bewertungen durch menschliche Lehrkräfte sowie einen KI-Richter ein.

Die Ergebnisse in Kürze:

  • Kognitive Schuld: Der Einsatz von ChatGPT beim Schreiben von Essays beeinflusst das Denken und Lernen und führt zu „kognitiver Schuld“, eine Begriff für die Beeinträchtigung der eigenen Lernfähigkeit durch ausgelagerte „Denkarbeit“ (wobei KI-Bots nicht denken, sondern Ergebnisse nach Wahrscheinlichkeit berechnen).
  • Pädagogisch: Der frühzeitige Einsatz von KI-Werkzeugen wie ChatGPT führt in eine umfassende Abhängigkeit von diesen Werkzeugen und beeinträchtigt das eigenständige, kritische Denken. Die MIT-Forscher empfehlen daher, LLMs allenfalls ergänzend und reflektiert in Lernprozesse einzubinden.
  • Physiologisch: Teilnehmer, die mit LLM-Unterstützung arbeiten, zeigen in ihren EEG-Analysen signifikant weniger neuronale Aktivität und geringere Vernetzung als Gruppen, die Suchmaschinen nutzten oder ohne Hilfsmittel arbeiteten. LLM-Nutzer zeigen zudem Defizite beim Erinnern und Zitieren eigener Texte.

Siehe auch:

MIT-Studie zeigt „kognitive Schuld“ durch ChatGPT – was das für die Praxis bedeutet
Von Maximilian Schreiner, The Decoder


Ihr Gehirn auf ChatGPT: Anhäufung von kognitiven Schulden bei der Verwendung eines KI-Assistenten für Aufsatzschreibaufgaben

Nataliya Kosmyna, Eugene Hauptmann, Ye Tong Yuan, Jessica Situ, Xian-Hao Liao, Ashly Vivian Beresnitzky, Iris Braunstein, Pattie Maes

Zusammenfassung

Diese Studie untersucht die neuronalen und verhaltensbezogenen Konsequenzen des LLM-unterstützten Aufsatzschreibens. Die Teilnehmer wurden in drei Gruppen eingeteilt: LLM, Suchmaschine und nur das Gehirn (keine Hilfsmittel). Jede Gruppe absolvierte drei Sitzungen unter den gleichen Bedingungen. In einer vierten Sitzung wurden die LLM-Nutzer der Nur-Gehirn-Gruppe (LLM-to-Brain) und die Nur-Gehirn-Nutzer der LLM-Bedingung (Brain-to-LLM) zugewiesen. Insgesamt 54 Teilnehmer nahmen an den Sitzungen 1-3 teil, wobei 18 die Sitzung 4 abschlossen. Wir setzten Elektroenzephalographie (EEG) ein, um die kognitive Belastung während des Aufsatzschreibens zu messen, und analysierten die Aufsätze mithilfe von NLP und bewerteten die Aufsätze mit Hilfe von menschlichen Lehrern und einem KI-Richter. Über die Gruppen hinweg zeigten NERs, n-Gramm-Muster und die Themenontologie Homogenität innerhalb der Gruppe. Das EEG zeigte signifikante Unterschiede in der Konnektivität des Gehirns:

Die kognitive Aktivität verringerte sich im Verhältnis zur Verwendung externer Werkzeuge. In Sitzung 4 zeigten LLM-zu-Gehirn-Teilnehmer eine reduzierte Alpha- und Beta-Konnektivität, was auf ein zu geringes Engagement hindeutet. Brain-to-LLM-Nutzer wiesen eine höhere Erinnerungsleistung und eine Aktivierung der okzipito-parietalen und präfrontalen Areale auf, ähnlich wie die Nutzer von Suchmaschinen. Der selbstberichtete Besitz von Aufsätzen war in der LLM-Gruppe am niedrigsten und in der reinen Brain-Gruppe am höchsten. LLM-Nutzer hatten auch Schwierigkeiten, ihre eigene Arbeit genau zu zitieren. Während LLMs sofortige Bequemlichkeit bieten, weisen unsere Ergebnisse auf mögliche kognitive Kosten hin. Über einen Zeitraum von vier Monaten zeigten die LLM-Benutzer durchweg schlechtere Leistungen auf neuronaler, sprachlicher und verhaltensbezogener Ebene. Diese Ergebnisse geben Anlass zur Besorgnis über die langfristigen pädagogischen Auswirkungen der LLM-Nutzung und unterstreichen die Notwendigkeit, die Rolle der KI beim Lernen genauer zu untersuchen.

Link: https://arxiv.org/abs/2506.08872


Original

Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task

Nataliya Kosmyna, Eugene Hauptmann, Ye Tong Yuan, Jessica Situ, Xian-Hao Liao, Ashly Vivian Beresnitzky, Iris Braunstein, Pattie Maes

Abstract

This study explores the neural and behavioral consequences of LLM-assisted essay writing. Participants were divided into three groups: LLM, Search Engine, and Brain-only (no tools). Each completed three sessions under the same condition. In a fourth session, LLM users were reassigned to Brain-only group (LLM-to-Brain), and Brain-only users were reassigned to LLM condition (Brain-to-LLM). A total of 54 participants took part in Sessions 1-3, with 18 completing session 4. We used electroencephalography (EEG) to assess cognitive load during essay writing, and analyzed essays using NLP, as well as scoring essays with the help from human teachers and an AI judge. Across groups, NERs, n-gram patterns, and topic ontology showed within-group homogeneity. EEG revealed significant differences in brain connectivity: Brain-only participants exhibited the strongest, most distributed networks; Search Engine users showed moderate engagement; and LLM users displayed the weakest connectivity.

Cognitive activity scaled down in relation to external tool use. In session 4, LLM-to-Brain participants showed reduced alpha and beta connectivity, indicating under-engagement. Brain-to-LLM users exhibited higher memory recall and activation of occipito-parietal and prefrontal areas, similar to Search Engine users. Self-reported ownership of essays was the lowest in the LLM group and the highest in the Brain-only group. LLM users also struggled to accurately quote their own work. While LLMs offer immediate convenience, our findings highlight potential cognitive costs. Over four months, LLM users consistently underperformed at neural, linguistic, and behavioral levels. These results raise concerns about the long-term educational implications of LLM reliance and underscore the need for deeper inquiry into AI’s role in learning.

Link: https://arxiv.org/abs/2506.08872