Generative KI in der Finanzgerichtsbarkeit: Potenziale, Grenzen, Perspektiven
Rückblick auf den Vortrag bei der Münchner Steuerfachtagung 2025 von Michael Krebbers, Richter am Finanzgericht Düsseldorf
Im Rahmen der DigiTax-Session auf der Münchner Steuerfachtagung (27.03.2025, 9:00–12:30 Uhr) wurde ein Thema beleuchtet, das derzeit viele bewegt – mal euphorisch, mal kritisch: Generative KI in der Finanzgerichtsbarkeit. Schnell entsteht dabei das Bild des „Robo-Judge“, der bald automatisiert Urteile fällt. Doch diese Vorstellung greift zu kurz. KI im Gerichtssaal? Ja – aber anders als viele denken. Es geht nicht um KI als Ersatz für richterliche Entscheidungskompetenz, sondern um ihren konkreten Nutzen entlang der Arbeitsprozesse in einem Gerichtsverfahren.

📚 Die Realität: Datenflut statt Papierstapel
Auch wenn die meisten Akten inzwischen digital geführt werden: Was den Gerichten tagtäglich begegnet, sind riesige Mengen unstrukturierter Daten – seitenlange Schriftsätze, Stellungnahmen, Anlagen. Die Herausforderung besteht darin, sich schnell einen strukturierten Überblick zu verschaffen, relevante Informationen herauszufiltern und gezielt zu den entscheidungserheblichen Inhalten zu navigieren.
Hier liegt das erste große Potenzial der generativen KI:
- Informationsextraktion zur schnellen Orientierung
- automatisierte Aktenaufbereitung
- sprachgestützte Navigation innerhalb von Dokumenten („sprechende Akte“)
Das erleichtert die Einarbeitung und Bewertung komplexer Verfahrenslagen – eine echte Entlastung im Arbeitsalltag. Hinweis am Rande: Diese Anwendungen helfen nicht nur der Justiz, sondern wären auch für Kanzleien, Verwaltung und Beratung sehr relevant.
🧠 KI als Assistenz bei der Sachverhaltsermittlung
Ein besonders vielversprechender Anwendungsbereich für generative KI liegt in der Vorbereitung aufklärender Maßnahmen innerhalb des gerichtlichen Verfahrens. Gerade bei komplexen oder fachlich ungewohnten Sachverhalten ist es entscheidend, die richtigen Fragen zu stellen, um dem tatsächlichen Geschehen so nahe wie möglich zu kommen. Genau hier kann KI sinnvoll unterstützen – nicht, indem sie Antworten vorgibt, sondern indem sie bei der Strukturierung und Formulierung gezielter Rückfragen hilft.
In gemeinsamen Tests mit einem Kollegen wurden verschiedene Konstellationen durchgespielt: Die KI generierte dabei Vorschläge für Fragenkataloge, die zur Sachverhaltsaufklärung an die Beteiligten verschickt wurden. Die Ergebnisse waren erstaunlich präzise – gerade bei branchenspezifischen oder technisch anspruchsvollen Themen, bei denen menschliche Einschätzungen an ihre Grenzen stoßen.
Auch bei der Erstellung von Aufklärungsverfügungen entfaltet die KI ihr Potenzial. Sie unterstützt nicht nur beim sprachlichen Feinschliff, sondern kann auf Basis verfügbarer Informationen helfen, blinde Flecken zu identifizieren, die in der Kommunikation mit den Beteiligten noch geklärt werden müssen.
Dabei bleibt KI immer in der Rolle eines Werkzeugs: Sie muss nicht immer endgültige inhaltliche Antworten liefern, sondern hilft, bessere Fragen zu stellen. Ein wichtiger Unterschied, der auch im juristischen Kontext nicht unterschätzt werden darf.
🔍 Qualitätssicherung & Recherche neu gedacht
Auch im Bereich der Rechtsrecherche und Urteilsanalyse eröffnet der Einsatz von KI völlig neue Perspektiven. So können Urteilsentwürfe automatisiert mit der einschlägigen BFH-Rechtsprechung oder der einschlägigen Kommentarliteratur abgeglichen werden.
Gleichzeitig können formale Schwächen oder argumentative Brüche frühzeitig erkannt werden. Die KI kann gezielt auf Textstellen hinweisen, an denen eine zusätzliche Begründung oder Klarstellung sinnvoll wäre. Dadurch wird nicht nur die Effizienz der Bearbeitung gesteigert, sondern auch die Qualität der Entscheidungen kann gezielt verbessert werden.
⚠️ Risiken erkennen: Der Automation Bias
Ein Aspekt, der besonders hervorgehoben werden sollte, ist das psychologische Phänomen des sogenannten Automation Bias. Je besser eine Maschine arbeitet, desto eher neigen Menschen dazu, ihre Ergebnisse unkritisch zu akzeptieren. Was bei einem Navigationssystem im Auto manchmal harmlos ist, wird in einem gerichtlichen Verfahren – gerade vor dem Hintergrund knapper Ressourcen – schnell zur Gefahr.
Die richterliche Unabhängigkeit ist kein Standesprivileg, sondern ein Grundpfeiler unserer Rechtsordnung. Wer automatisierte Vorschläge übernimmt, ohne sie aktiv zu reflektieren, setzt diese Unabhängigkeit aufs Spiel. Es ist daher notwendig, sich selbst zu sensibilisieren, strukturelle Schutzmechanismen in die Systeme einzubauen und sicherzustellen, dass die Rolle der KI klar auf Assistenzfunktionen beschränkt bleibt.
☁️ Infrastrukturfragen: Daten, Cloud & Justiz-KI
Wenn der Einsatz von generativer KI in der Justiz ernsthaft verfolgt werden soll, muss auch die technische Grundlage berücksichtigt werden. Derzeit werden nur etwa zwei Prozent aller Gerichtsurteile veröffentlicht – der Großteil ist dezentral in 16 verschiedenen Rechenzentren der Bundesländer gespeichert. Ein effektiver Datenaustausch über Ländergrenzen hinweg ist damit kaum möglich – nicht zuletzt wegen divergierender Datenschutzgesetze und fehlender technischer Schnittstellen.
Ein erster wichtiger Schritt ist das vom 5. Bund-Länder-Digitalgipfel der Justizministerinnen und Justizminister auf den Weg gebrachte Projekt einer bundeseinheitlichen Justizcloud. Ziel ist es, bis Ende 2026 eine Infrastruktur zu schaffen, die diese Datensilos aufbricht und einen gemeinsamen Datenpool ermöglicht.
Voraussetzung dafür ist ein funktionierendes Pseudonymisierungstool, das große Mengen von Gerichtsentscheidungen automatisiert und datenschutzkonform anonymisieren kann. Erst auf dieser Grundlage können Sprachmodelle trainiert werden, die tatsächlich auf die Bedürfnisse der Justiz zugeschnitten sind – und perspektivisch auch für angrenzende Akteure wie Prozessfinanzierer, Rechtsschutzversicherer oder Steuerberater von Nutzen sein könnten.
⚖️ Und, schreibt KI nun die besseren Urteile?
Die Frage taucht früher oder später immer auf – also hier eine indirekte Antwort:
Die aufgeworfene Frage bedarf im Finanzgericht aktuell keiner Antwort, weil sich eine KI-Unterstützung auf die vorbereitenden Prozesse konzentriert.
Dass generative KI in Deutschland keine Urteile fällen kann und soll, ist rechtsstaatlich klar geregelt. Artikel 92 des Grundgesetzes weist die rechtsprechende Gewalt den Richtern zu. Die europäische KI-Verordnung (Art. 6 Verordnung über Künstliche Intelligenz (EU), dazu Erwägungsgrund 61 VO (EU) 2024/1689) erlaubt Entscheidungsunterstützung, verbietet aber Entscheidungsersatz.
Auch wenn es rechtsdogmatisch spannende Gegenpositionen gibt – für die Praxis, insbesondere in der Finanzgerichtsbarkeit, ist klar: Die Verantwortung für die Entscheidung bleibt beim Menschen.
FAZIT
KI als Objekt – nicht als Subjekt
Die Diskussion sollte nicht vom „Robo-Judge“ her gedacht werden, sondern von den realen Herausforderungen im Arbeitsalltag. Dort gibt es viele konkrete und sinnvolle Einsatzmöglichkeiten – und genau dort sollte angesetzt werden.
KI wird Teil der Arbeit, nicht deren Grundlage. Das Idealbild ist nicht ein autonomer Entscheidungsautomat, sondern ein Werkzeug, das menschliche Fähigkeiten ergänzt und verstärkt, ohne sie zu verdrängen.
KEY-TAKEAWAYS
👉 KI in der Justiz ist möglich
Nicht im Urteilsspruch, aber bei Aktenaufbereitung, Sachverhaltsermittlung und Recherche bietet KI konkrete Unterstützung.
👉 Automation Bias im Blick behalten
Je besser KI funktioniert, desto größer das Risiko unkritischer Übernahme. Die richterliche Unabhängigkeit bleibt unersetzlich.
👉 Daten sind der Schlüssel
Eine funktionsfähige Justiz-KI braucht Zugriff auf große Datenmengen – datenschutzkonform und technisch zugänglich.
👉 Vom Werkzeug statt Wunder denken
KI ist keine Revolution im Gerichtssaal, sondern ein evolutionäres Werkzeug – mit Potenzial zur echten Qualitätssteigerung.