Was KI nicht ersetzen kann
Alicja Gulcz ist Lehrerin für Mathematik, Musik und Chemie an einer Gesamtschule und Fachleiterin für Musik am ZfsL Düsseldorf. Sie argumentiert: Gelingensnachweise — kompetenzbasierte Prüfungsformate auf Basis formativen Assessments — lösen die KI-Debatte an Schulen auf, weil sie Kompetenz nachweisbar machen statt Produkte bewertbar.
Schulinterner Fortbildungstag. Thema: KI. Diesmal keine Lehrkräfte auf dem Podium, sondern Schüler*innen. Sie berichten, wofür und wie sie generative KI einsetzen. Was ich an diesem Tag erlebe, bringt mich zu einer Überzeugung: Gelingensnachweise sind die Antwort auf KI in der Schule — nicht Verbote, nicht neue Tools.
Einiges davon klingt pädagogisch sinnvoll: Vokabeln abfragen lassen, Spickzettel als Lernstrategie, Zusammenfassungen generieren. Dann wird es ehrlich. Klare Kritik an unseren Aufgabenformaten.
Vergessen Sie Hausaufgaben. Keiner macht sie noch.
Kein Kichern. Kein Provozieren. Eine Feststellung. Und sie haben nicht ganz unrecht.
Am Ende eine offene Fragerunde. Ich stelle die Frage, die mich wirklich umtreibt:
„Wir als Lehrkräfte machen uns große Gedanken. Unser Auftrag ist Bildung. Was können wir tun, um eure körpereigenen LLMs — eure Gehirne — mit guten Daten zu füttern und eure eigenen Algorithmen richtig zu vernetzen?“
Stille.
Dieselben Schüler*innen, die mir eben noch messerscharf erklärt haben, was alles nicht funktioniert. Die mir zeigen konnten, wie sie KI nutzen. Die konnten mir nicht sagen, was sie bräuchten, um selbst lernen zu wollen.
Und genau das ist die Diagnose. Sie können benennen, was kaputt ist. Sie können die Werkzeuge bedienen. Aber sie können nicht sagen, warum es sich lohnen würde, den eigenen Kopf anzustrengen.
Ich verlasse den Raum mit einem einzigen Gedanken: Es ist die Motivation. Nur die Motivation zu lernen wird den Kids — und unserer Gesellschaft — den Allerwertesten retten. Nicht die Tools. Nicht die Verbote. Nicht die besseren Aufgabenformate. Die Frage, die wir beantworten müssen, ist nicht: Wie verhindern wir, dass Schüler*innen KI nutzen? Sondern:
Wie schaffen wir es, dass sie lernen wollen?

Was KI mit unseren Noten macht
Das klassische Bewertungssystem lebt in Graubereichen. Eine Vier minus ist kein Können. Eine Vier minus ist: gerade so nicht durchgefallen. KI lebt in genau dieser Grauzone. Sie ist spektakulär gut darin, den Bereich zwischen „nicht gekonnt“ und „irgendwie bestanden“ zu überbrücken. Es ist ein System, in dem man Kompetenz behaupten kann, ohne sie zu zeigen — weil niemand genau genug hinschaut. Die Schwelle ist so niedrig, dass eine Maschine sie mühelos überspringt.
Wir wollten das lösen. Weg von der Klassenarbeit, hin zu Portfolios, Podcasts, Videos, Prozessdokumentation. Aber:
Portfolios? KI. Essays? KI. Podcasts? NotebookLM generiert sie mit deiner eigenen Stimme. Prozessdokumentation? Kann man prompten.
Die Schüler*innen auf dem Fortbildungstag haben das längst begriffen. Sie haben uns nicht provoziert. Sie haben uns die Wahrheit gesagt: Eure Aufgabenformate funktionieren nicht mehr.
Die Frage ist nicht, ob wir das hinnehmen. Die Frage ist: Wenn sowohl Produkte als auch Prozesse automatisierbar sind — was bleibt dann?
Warum Motivation alles ist
Zurück zur Motivation. Aber nicht als Kuschelpädagogik, sondern als wissenschaftliches Konzept.
Wann hat man eigentlich Lust zu lernen?
Deci und Ryan haben mit der Selbstbestimmungstheorie drei psychologische Grundbedürfnisse identifiziert, die entscheidend sind: Autonomie, Kompetenzerleben und soziale Eingebundenheit. Wenn man sich anschaut, wie unser Schulsystem mit diesen drei Bedürfnissen umgeht, wird schnell klar, warum die Motivation stirbt.
Autonomie? Schüler*innen dürfen oft nicht mal entscheiden, wann sie ein Thema vertiefen und wann sie weitergehen. Kompetenzerleben? Eine Vier minus sagt nicht „Du kannst das“ — sie sagt „Du bist gerade so nicht durchgefallen.“ Soziale Eingebundenheit? Dreißig Kinder, 45 Minuten, nächste Klasse — da bleibt wenig Raum, um gesehen zu werden.
Wenn diese drei Bedürfnisse frustriert werden, stirbt die intrinsische Motivation — die Art von Motivation, die einen antreibt, ohne dass jemand droht oder belohnt. Werden sie befriedigt, entsteht etwas anderes: das Erleben, dass Anstrengung sich lohnt. Dass ich etwas kann, was ich vorher nicht konnte. Dass ich dranbleibe, die Sache noch einmal angehe, irgendwann in den Flow komme — in diesen Zustand, in dem Herausforderung und Fähigkeit im Gleichgewicht sind und Lernen sich nicht mehr nach Arbeit anfühlt.

Kompetenzerleben in Gemeinschaft ist dabei der Schlüssel.
Lernfreude ist die Voraussetzung für lebenslanges Lernen. Und lebenslanges Lernen ist das, was diese Generation am dringendsten brauchen wird.
Wie wäre die Idee, Kompetenzerleben zu ermöglichen, indem wir die Grauzone der Bewertung durch eine klare Schwelle ersetzen: Kompetenz erworben — oder noch nicht?
Geht nicht? Geht doch. Und zwar so:
Gelingensnachweise erzeugen Motivation , weil sie Kompetenzerleben ermöglichen.
An der Alemannenschule Wutöschingen funktioniert das so: Schüler*innen — dort Lernpartner*innen genannt — erarbeiten sich Kompetenzen in ihrem eigenen Tempo. Wenn sie sich bereit fühlen, legen sie einen Gelingensnachweis ab. Bestanden hat, wer mindestens 80 % erreicht. Wer das nicht schafft, hat nicht versagt. Die Kompetenzen sind nur noch nicht da. Man kann es nochmal versuchen. So oft es nötig ist.
Kein Abhaken. Kein „Schade popade. Nächstes Thema.“ Kein Anhäufen von Defiziten, die dann teuer in der Nachhilfe nachgearbeitet werden müss(t)en.
Die Note wird zum Feedback und das Scheitern zum Zwischenstand.
Dabei bedienen Gelingensnachweise alle drei Grundbedürfnisse der Selbstbestimmungstheorie gleichzeitig. Kompetenzerleben? Ich beweise, dass ich es kann — nicht an einem willkürlichen Stichtag, sondern wenn ich soweit bin. Autonomie? Ich entscheide, wann ich den Nachweis ablege. Soziale Eingebundenheit? Mein Lernbegleiter kennt meinen Weg und begleitet mich.
Wer Kompetenz erleben darf, will weiterlernen. Das ist der Zusammenhang, den unser Bewertungssystem systematisch unterbricht — und den Gelingensnachweise wiederherstellen.
Das klingt revolutionär. Ist es aber nicht. Die Idee ist weder neu noch exotisch. Sie wird nur in Deutschland kaum praktiziert.
In Finnland können Schüler*innen Prüfungen wiederholen, um Kompetenz nachzuweisen — das gesamte System ist auf formatives Assessment ausgerichtet. In den USA breitet sich unter dem Label „Standards-Based Grading“ die Praxis der Reassessments aus: mehrere Versuche, weil Lernen der Maßstab ist, nicht der Stichtag. Und auch in den Bildungssystemen des ehemaligen Ostblocks war die formative Nachschreibemöglichkeit selbstverständlich: Arbeit zurück, klare Rückmeldung, nochmal schreiben.
Die Alemannenschule zeigt, was passiert, wenn man es tut: Schülerinnen und Schüler kommen gerne zur Schule. Die ersten Abiturjahrgänge erreichten einen Schnitt von 1,7. Betriebe berichten von besonderer Selbstständigkeit der Absolvent*innen. 2019 und 2021 gab es den Deutschen Schulpreis. Sie mauserte sich von einer Hauptschule im Brennpunkt zu einer anerkannten Institution. Natürlich ist die Alemannenschule mit 800 Schüler*innen eine kleine Gemeinschaftsschule auf dem Land — die Übertragung auf eine sechszügige Gesamtschule in der Großstadt ist nicht trivial. Aber dass das nicht überall passiert, liegt nicht an fehlender Evidenz — sondern an konservativ ausgelegten Prüfungsordnungen – besonders in der Sekundarstufe 1 – und Strukturen, die Gelingen nicht vorsehen.
Das 2-Sigma Problem und wie KI es lösen kann
Die meisten Lehrkräfte wissen genau, was nötig wäre: individuelles Feedback, Begleitung, Anknüpfen an das, was ein Kind schon kann. Aber die Strukturen geben es nicht her. Dreißig Kinder, sechs Niveaus, 45 Minuten. Dann die nächste Klasse. Da kann die innere Haltung noch so gut sein — Lehrkräfte sind am Ende ihrer Kapazitäten. Das ist kein individuelles Versagen. Der Erziehungswissenschaftler und Psychologe Benjamin Bloom hat genau dieses Problem schon 1984 beschrieben. Er nannte es das „2-Sigma-Problem“: Wenn Schüler*innen individuell begleitet werden — kombiniert mit einer Lernstruktur, in der man erst weitergeht, wenn man eine Kompetenz wirklich beherrscht —, dann übertrifft der Durchschnitt 98 % der konventionell unterrichteten Mitschüler*innen. Gelingensnachweise sind die konsequente Umsetzung von Blooms Mastery Learning.
Eine Kompetenz. Klar definiert. Bestanden ab 80 %.
Wer es nicht schafft, hat nicht versagt — die Kompetenz ist nur noch nicht da. Nochmal. So oft es nötig ist. Aber Bloom sagte auch: Eins-zu-eins-Betreuung ist zu teuer. Kein Bildungssystem kann das skalieren.
Und genau hier kommt die KI ins Spiel. Sie ist das fehlende Puzzlestück, das individuelle Begleitung skalierbar macht.
Stellen wir uns vor: Ein pädagogischer Agent, der Lösungen nicht verrät, sondern Checkpoints einbaut. Der auf dem richtigen Niveau erklärt — mit Fachsprache, nicht immer vereinfacht. Der geduldig ist, ohne müde zu werden. Nicht als Ersatz für die Lehrkraft, sondern als Verlängerung ihrer Reichweite.
Dass das funktioniert, zeigen erste Studien: Eine Harvard-Studie von 2025 (Kestin et al., Scientific Reports) ergab, dass Studierende mit einem KI-Tutor signifikant mehr lernten als im Präsenzunterricht — wobei intelligente Tutorsysteme am effektivsten in Kombination mit lehrergeleiteter Anleitung waren.
KI gleicht damit nicht nur Defizite von Schüler*innen aus. Sie gleicht Defizite im System aus — wenn am Ende das Gelingen steht.
Gelingen zum Maßstab machen
Zurück zum Fortbildungstag. Zurück zu der Stille, als ich meine Frage stellte. Die Schüler*innen wussten keine Antwort. Aber vielleicht war die Frage falsch gestellt.
Vielleicht hätte ich nicht fragen sollen: „Was können wir tun?“ Sondern: „Was müssen wir lassen?“
Aufhören, Produkte zu bewerten, die eine Maschine besser liefert. Aufhören, Hausaufgaben zu stellen, die niemand mehr macht. Aufhören, ein Bewertungssystem zu verteidigen, das nicht mehr funktioniert.
Und anfangen, Gelingen zum Maßstab zu machen.
KI gekoppelt an eine Klassenarbeit, die man einmal schreibt und abgibt: Das ist ein Mogel-Werkzeug. KI gekoppelt an einen Gelingensnachweis: Das ist ein Lernwerkzeug.
Die Frage ‚Hat das Kind das selbst gemacht?‘ löst sich nicht auf, weil sie beantwortet wird. Sie löst sich auf, weil sie ihre Relevanz verliert. Es ist egal, wie du dich vorbereitet hast – mit KI, ohne KI, mit Nachhilfe, mit YouTube. Am Ende sitzt du da und zeigst, dass du es kannst. Unter kontrollierten Bedingungen. In Präsenz.
Der Unterschied liegt nicht in der Technologie. Er liegt in der Struktur: KI gibt das Feedback. Die Lehrkraft gibt die Haltung. Und der Gelingensnachweis gibt den Rahmen. „Ich möchte, dass du es am Ende kannst. Nicht, dass du siehst, dass du es noch nicht kannst. Ich möchte, dass du so lange probierst, bis du es schaffst.“
Digitale Bildung ist keine Software-Frage. Sie ist eine Kulturfrage. Und die Kultur, die wir brauchen, ist eine Kultur des Gelingens.

Was sind eure Erfahrungen? Schreibt mir auf LinkedIn — ich freue mich auf den Austausch.