Von Future-Law, Sophie Martinetz
Sieben KI-Modelle, zwölf juristische Aufgaben, ein Ziel: herausfinden, wer wirklich liefert — und wer halluziniert, als wäre das ein Feature.
Future-Law hat im Dezember 2025 erstmals in Österreich ein systematisches LLM-Benchmarking speziell für den juristischen Einsatz durchgeführt. Gleiches Spielfeld, gleiche Aufgaben, keine Ausreden.
Das zentrale Ergebnis: Das eine beste KI-Modell existiert nicht. Was existiert, ist das richtige Modell für die richtige Aufgabe — und genau das zeigt dieses Ranking.
1. Projektübersicht
Erstmals in Österreich: Systematisches LLM-Benchmark-Review speziell für den juristischen Einsatz
Es gibt kein universell bestes KI-Modell. Die Leistung variiert stark je nach Aufgabentyp. Claude erzielte die höchste Gesamtpunktzahl, andere Modelle dominierten in Teilbereichen.
Folgende Aufgaben wurden für die LLMs vorbereitet:
| Prüfungsaufgabe | Max. Punkte | Besonderheit |
| OGH-Entscheidung via Geschäftszahl (GZ) | 260 | Modell muss Entscheidung selbst finden |
| OGH-Entscheidung via Weblink (RIS) | 260 | Modell muss Link öffnen und analysieren |
| OGH-Entscheidung via PDF | 260 | Dokument direkt bereitgestellt |
| OGH-Entscheidung via Entscheidungstext | 260 | Volltext direkt bereitgestellt |
| Newsletter zu OGH-Entscheidung | 120 | GZ: 1Ob91/22x |
| E-Mail zu OGH-Entscheidung | 120 | GZ: 1Ob91/22x |
| Sachverhaltsanalyse (4 Prompt-Varianten) | 4 × 90 | Rollen: Anwalt, OGH-Richterin, Jus-Stud., Professorin |
| KG-Vertragsmuster (WKO-Checkliste) | 17 × 10 = 170 | 17 Vertragspunkte, × 10 multipliziert |
| AGB-Klausel-Analyse (4 Fragen) | 250 | Dokument einer österreichischen Großbank |
Haupterkenntnis: Die größte Herausforderung liegt nicht in der Analyse, sondern im Auffinden der korrekten Information.
| Modell | GZ-Test (Accuracy) | Link-Test (Accuracy) | Halluzinationen |
| Claude | 78 / 90 | 77 / 90 | Keine |
| CoPilot | 74 / 90 | — | Keine |
| DeepSeek | Schlecht | Bester Wert | — |
| Gemini | Niedrig | Niedrig | Gravierend |
| Mistral / ChatGPT | Niedrig | Keine Halluz., Aufgabe nicht erfüllt | — |
| Grok | Sehr schlecht | — | — |
Sobald der Text direkt bereitgestellt wird, homogenisiert sich die Leistung. Alle Modelle erzielen hohe Accuracy-Werte (70er-Bereich von 90 möglichen Punkten). Kein Modell hat hier einen signifikanten Vorteil.
Newsletter: Die Modelle erhielten den Volltext einer OGH-Entscheidung (GZ: 1Ob91/22x) und mussten daraus einen professionellen Newsletter für Kunden, Mandanten und Stakeholder erstellen – klar, prägnant und zielgruppengerecht.
E-Mail: Auf Basis desselben Entscheidungstexts mussten die Modelle zusätzlich eine formelle E-Mail verfassen, die direkt an Kund:innen und Mandant:innen weitergeleitet werden kann – mit klarer Struktur und minimalem Nachbearbeitungsaufwand.
| Aufgabe | Beste Modelle | Schwächste Modelle |
| Newsletter | Claude, DeepSeek | Gemini (Halluzinationen) |
| Claude, Mistral | Grok, DeepSeek, CoPilot (ähnliches Niveau) |
Newsletter: Die Fähigkeit, eine komplexe OGH-Entscheidung in einen mandantengerechten Newsletter zu verwandeln, trennte die Modelle deutlich – Claude und DeepSeek lieferten strategisch verwertbare Texte, während Gemini mit Halluzinationen auffüllte, was nicht im Urteil stand.
E-Mail: Bei kürzeren, klar definierten Kommunikationsformaten zeigten fast alle Modelle ein solides Prompt-Verständnis – Claude und Mistral stachen durch besonders prägnante, direkt nutzbare Formulierungen hervor.
Alle Modelle erhielten denselben Sachverhalt in vier Prompt-Varianten mit unterschiedlichen Rollen (Rechtsanwalt, OGH-Richterin, Jus-Studierende/r, Universitätsprofessorin) um einen Sachverhalt zu analysieren. Ziel war zu testen, ob die Rollenzuweisung die Qualität der Analyse beeinflusst — und welches Modell konsistent über alle vier Varianten überzeugt.
| Prompt-Rolle | Platz 1 | Platz 2 | Schlusslicht |
| Rechtsanwalt | Claude / CoPilot | ChatGPT / Gemini | Mistral, Grok, DeepSeek |
| OGH-Richterin | Claude | Gemini | Mistral, Grok, DeepSeek |
| Jus-Studierende/r | Claude / DeepSeek | Gemini, Mistral, Grok, ChatGPT | CoPilot |
| Universitätsprofessorin | Claude / DeepSeek | Gemini, Mistral, Grok, ChatGPT | CoPilot |
Die Modelle erhielten die offizielle WKO-Checkliste mit 17 Vertragspunkten und mussten darauf basierend ein vollständiges Mustervertragsdokument für eine Kommanditgesellschaft erstellen — ohne zusätzliches juristisches Domainwissen als Input. Bewertet wurde, wie viele der 17 Pflichtpunkte erfüllt wurden, sowie ob die Modelle proaktiv relevante Zusatzklauseln ergänzten.
Keines der Modelle hat Punkt 17 (Schlussbestimmungen) vollständig erfüllt. Punkt vergeben ab teilweiser Erfüllung.
| Modell | Punkte (von 17) | Wertung (× 10) | Proaktive Zusatzklauseln |
| Claude | 17/17 | 170 | Kontrollrechte Kommanditisten, Übertragung Geschäftsanteile |
| Gemini | 16/17 | 160 | Übertragung Gesellschaftsanteile |
| Grok | 16/17 | 160 | Salvatorische Klausel |
| DeepSeek | 15/17 | 150 | Kontrollrechte, Salvatorische Klausel (teilw. außerhalb Vertrag) |
| ChatGPT | 13/17 | 130 | Erläuterung Haftungsregeln KG |
| CoPilot | 13/17 | 130 | Österr. Recht, Gerichtsstand |
| Mistral | 11/17 | 110 | Jahresabschluss, Informationsrechte Kommanditisten |
Die Modelle erhielten das vollständige AGB-Dokument einer österreichischen Großbank und mussten vier konkrete Fragen dazu beantworten — zu Kündigungsrechten der Bank, Kündigungsrechten des Kunden, Entstehung des Pfandrechts und Rückzahlungswährung bei Fremdwährungskrediten. Geprüft wurde dabei nicht nur die inhaltliche Korrektheit, sondern auch ob die Modelle zwischen Verbraucher- und Unternehmerrechten korrekt differenzieren.
Fragen: (1) Kündigung durch Bank, (2) Kündigung durch Kunden, (3) Entstehung Pfandrecht, (4) Rückzahlungswährung Fremdwährungskredit
| Modell | Ergebnis | Besonderheit |
| Mistral | Bestes Ergebnis | Hauptregel + Ausnahmen, vollständige Darstellung Umwandlungsrechte Bank |
| CoPilot | Bestes Ergebnis | Jede Aussage mit AGB-Zitatbeleg untermauert |
| ChatGPT / Claude / DeepSeek | Dicht dahinter | Solide, weitgehend korrekte Outputs |
| Gemini | Schwach | Halluzination: behauptet Pfandrecht nicht geregelt; verwechselt Z 37 (Fremdwährungskonto) mit Z 75 (Fremdwährungskredit) |
| Grok | Schwach | Halluzination: behauptet keine explizite Regelung zur Rückzahlungswährung; falsche Normzitierung |
Kritische Erkenntnis AGB: 2 von 7 Modellen produzierten Halluzinationen, die auf den ersten Blick plausibel wirken. Für Rechtsabteilungen ohne Fachkenntnis nicht erkennbar.
Das Ranking basiert auf der Summe aller Einzelbewertungen über alle 12 Prüfungsaufgaben hinweg — von der OGH-Recherche bis zum Vertragsentwurf. Claude erreichte mit Abstand die höchste Gesamtpunktzahl, wobei der Abstand zu den Plätzen 2 und 3 (CoPilot, DeepSeek) vor allem durch die starken Leistungen bei Vertragserstellung und Sachverhaltsanalyse zustande kam.
Das Ranking basiert auf der Summe aller Einzelbewertungen über alle 12 Prüfungsaufgaben hinweg — von der OGH-Recherche bis zum Vertragsentwurf, bei einer maximalen Gesamtpunktzahl von 2.060 Punkten. Claude erreichte mit Abstand die höchste Gesamtpunktzahl, wobei der Abstand zu den Plätzen 2 und 3 vor allem durch die dominante Leistung bei Vertragserstellung und Sachverhaltsanalyse zustande kam.
| Rang | Modell | Stärken |
| 1 | Claude | Höchste Gesamtpunktzahl, dominant bei Vertragserstellung und juristischen Analysen |
| 2 | CoPilot | Stark bei AGB-Analyse, GZ-Recherche, konsistente Leistung |
| 3 | DeepSeek | Sehr stark bei Link-Recherche, Newsletter; schwach bei Sachverhalten |
| 4 | Gemini | Konsistent bei allg. Aufgaben; Halluzinationen bei AGB und GZ |
| 5 | Mistral | Bester AGB-Output; schwach bei OGH-Recherche und Sachverhalten |
| 6 | ChatGPT | Variable Leistung, keine klaren Spitzenplätze |
| 7 | Grok | Durchgehend schwach, Halluzinationen bei AGB |
Die Tabelle zeigt auf einen Blick, welches Modell für welche konkrete Aufgabe in einer Rechtsabteilung am besten geeignet ist — denn die Rangfolge verschiebt sich je nach Aufgabentyp erheblich. Die zentrale Empfehlung lautet daher: nicht ein Modell für alles wählen, sondern gezielt das passende Tool für den jeweiligen Use Case einsetzen.
| Aufgabe | Empfohlenes Modell |
| OGH-Entscheidung recherchieren (nur GZ bekannt) | Claude, CoPilot |
| OGH-Entscheidung über Link analysieren | DeepSeek, Claude |
| OGH-Entscheidung via Text/PDF zusammenfassen | Alle Modelle vergleichbar |
| Newsletter oder E-Mail zu OGH-Entscheidung | Claude, DeepSeek (Newsletter); Claude, Mistral (E-Mail) |
| Juristische Sachverhalte lösen | Claude (konsistent über alle 4 Prompt-Varianten) |
| KG-Vertragsmuster erstellen | Claude (einziges Modell mit 17/17 Punkten) |
| AGB-Klauseln analysieren | Mistral, CoPilot |
Das beste KI-Modell existiert nicht. Claude ist das vielseitigste Modell mit der höchsten Gesamtpunktzahl. Für spezialisierte Aufgaben (AGB: Mistral/CoPilot; Link-Recherche: DeepSeek) sind andere Modelle besser geeignet. Halluzinationen traten bei Gemini und Grok auf und sind ohne juristisches Fachwissen nicht erkennbar. Das Prinzip „Human in Command“ – nicht nur „Human in the Loop“ – bleibt in jedem Fall unverzichtbar.
Danke an das Future-Law Team für tolle Arbeit!
Sie wollen eine längere Version des LLM Benchmarkings?
Für Rückfragen stehen wir Ihnen gerne zur Verfügung.

Legal Tech Barometer 2026: KI ist im juristischen Alltag angekommen, aber Strukturen fehlen

Am Montag, den 04. Mai 2026, haben wir mit Vertreter:innen verschiedener Rechtsbereiche die Ergebnisse unseres Legal Tech-Barometers 2026 diskutiert.
Das Future-Law Legal Tech Barometer ist die führende österreichische Studie zur Digitalisierung und KI-Adoption in der Rechtsbranche. Die zehnte Ausgabe zeigt: Künstliche Intelligenz hat sich vom Experiment zum Alltagswerkzeug entwickelt – und stellt die Branche vor grundlegende Strukturfragen.

„Jetzt entscheidet sich, wer den Wandel aktiv gestaltet – und wer von ihm gestaltet wird.“ – Sophie Martinetz, Gründerin Future-Law



KI-Nutzung auf historischem Höchststand
Fast die Hälfte der befragten Juristinnen und Juristen (45 %) nutzt KI bereits mehrmals täglich. Insgesamt greifen 99 % zumindest gelegentlich auf KI-Tools zurück. Die rechtliche Recherche ist mit 81 % der meistgenutzte Anwendungsfall, gefolgt von Übersetzungen (54 %), Textentwürfen (48 %) und Dokumentenanalyse (47 %).
Die Zeitersparnis ist real und messbar: 44 % der Befragten gewinnen täglich 30 Minuten oder mehr. Diese Zeit wird überwiegend sinnvoll eingesetzt – für komplexere juristische Fragestellungen (64 %), Qualitätssicherung (34 %) und strategische Beratung (28 %).
Berufsbild im Wandel
KI verschiebt Aufgaben – spürbar und strukturell. Routinetätigkeiten, die bisher von Juniors, Assistenzfunktionen oder externen Kanzleien erledigt wurden, werden zunehmend KI-gestützt abgewickelt. 62 % der Befragten bestätigen diesen Shift bereits heute.
Für die kommenden zwei Jahre erwarten die Teilnehmenden eine weitreichende KI-Übernahme zentraler juristischer Tätigkeiten: Due Diligence (86 %), Vertragsanalyse (84 %), Wissensmanagement (84 %) und rechtliche Recherche (81 %) werden weitgehend KI-unterstützt erfolgen – so die Einschätzung der Befragten.
Qualität bleibt Herausforderung
Trotz hoher Nutzung bleibt die Qualität ein kritischer Faktor: 52 % bewerten KI-Ergebnisse als mittelmäßig, fast 70 % müssen Outputs häufig oder sehr häufig korrigieren. Die meistgeforderten Eigenschaften von KI-Lösungen sind Richtigkeit und Aktualität (87 % „sehr wichtig“) sowie Datenschutz und Vertraulichkeit (75 % „sehr wichtig“). Die juristische Fachkompetenz bleibt damit unverzichtbare Kontrollinstanz.
Strukturelle Lücken bremsen das Potenzial
Die hohe Nutzungsrate steht einem klaren Strukturdefizit gegenüber: 44 % der Organisationen haben keine verantwortliche Person für Legal Tech oder KI, 27 % verfügen über kein dediziertes Budget. Die nächste große Herausforderung ist die Integration: 50 % planen Schnittstellen zu neuen Tools, 41 % die Einführung automatisierter Workflows.
„Die Nutzung ist da – die Strukturen hinken hinterher“, bringt es Future-Law-Gründerin Mag. Sophie Martinetz auf den Punkt.
Über das Legal Tech Barometer
Das Future-Law Legal Tech Barometer wird seit neun Jahren jährlich veröffentlicht und gilt als zentrale Studie zur Digitalisierung der Rechtsbranche in Österreich. Die Ausgabe 2025 basiert auf einer umfassenden Befragung von Fachkräften aus Rechtsabteilungen, Kanzleien und dem öffentlichen Bereich.
Download:
In Kooperation mit unseren Partnern:

Sie möchten selber KI-Projekte durchführen? Dann melden Sie sich unter office@future-law.at oder informieren Sie sich hier über unsere KI-Leistungen.
Im Rahmen unseres Legal Tech Frühstücks für Rechtsabteilungen diskutierten wir diesmal den praktischen Einsatz von KI-Tools im juristischen Alltag – mit Fokus auf Recherche, Dokumentenerstellung und Visualisierung von Prozessen.
Laut einer Future-Law-Studie können Jurist:innen durch den Einsatz von KI bei der Rechtsrecherche durchschnittlich drei bis zehn Stunden pro Woche einsparen. Leider sind in Österreich hochwertige juristische Inhalte größtenteils nur kostenpflichtig verfügbar, weshalb viele Tools auf frei zugängliche Quellen beschränkt bleiben.
Im Austausch der Teilnehmer:innen zeigte sich, dass Microsoft Copilot derzeit zwar zu den am häufigsten eingesetzten AI-Tools in Rechtsabteilungen zählt, die Ergebnisse in der Praxis jedoch oft noch nicht vollständig zufriedenstellen. Besonders positiv bewertet wurde Claude, insbesondere das Claude Legal Plug-in für die Arbeit direkt in Word-Dokumenten oder die Bearbeitung im Track/Change-Modus. Einige Unternehmen haben jedoch dazu Sicherheits- und Datenschutzbedenken.
Ein weiterer Schwerpunkt war die Frage, welche Use Cases tatsächlich sinnvoll und wirtschaftlich sind. Im Bereich Regulatory und Compliance verursachen z.B. internationale und länderspezifische regulatorische Anforderungen hohen manuellen Aufwand. Anbieter stellen zwar globale Compliance-Monitorings bereitstellen, die Vielzahl täglicher Meldungen führt jedoch oft zu organisatorischen und prozessualen Herausforderungen.
Ein großer Usecase für KI ist die Visualisierung juristischer Themen wie Vertragsanhänge, Beteiligungsstrukturen aber auch der juristischen Prozesse. Gerade in Diskussionen mit anderen Unternehmensbereichen wurde die visuelle Darstellung als besser empfunden als klassische Excel-Listen.
Das gemeinsame Fazit des Frühstücks: Der Nutzen von KI-Tools hängt stark vom konkreten Use Case ab.





Das Frühstück für Rechtsabteilungen ist eine Kooperationsveranstaltung von Future-Law und der Vereinigung österreichischer Unternehmensjuristen (VUJ) zum Zweck des Best Practice-Austauschs und der Vernetzung.
Mehr unter: Future-Law – Legal Tech Fachkreis
Wir begleiten Sie mit unserer Expertise gerne, bitte melden Sie sich einfach bei s.martinetz@future-law.at.
Weil die entscheidenden Fragen rund um KI letztlich keine technischen Fragen sind. Natürlich ist es wichtig zu verstehen, welche Systeme verfügbar sind, welche Anwendungen eingesetzt werden können und welche Prozesse sich automatisieren lassen. Aber all das beantwortet noch nicht die Frage, wer Verantwortung übernimmt.
Im juristischen Umfeld wird das besonders deutlich. Stellen Sie sich vor, eine Rechtsabteilung nutzt KI, um ein komplexes regulatorisches Risiko zu analysieren oder einen Entwurf für ein Rechtsgutachten zu erstellen. Die KI liefert innerhalb weniger Minuten ein professionell wirkendes Dokument mit überzeugender Argumentation und vermeintlich passenden Quellen. Das Ergebnis sieht plausibel aus und vermittelt den Eindruck hoher fachlicher Qualität. Wenn sich später herausstellt, dass eine zentrale Rechtsfrage falsch beurteilt wurde oder eine zitierte Entscheidung gar nicht existiert, trägt nicht die KI die Verantwortung. Die Verantwortung liegt bei den Menschen, die das Ergebnis verwendet, geprüft und freigegeben haben.
Genau deshalb ist KI kein IT-Projekt, sondern ein Führungsprojekt. Führungskräfte müssen entscheiden, wo KI eingesetzt wird, welche Risiken akzeptabel sind, welche Kontrollen erforderlich sind und wo menschliche Entscheidungen unverzichtbar bleiben. Die zentrale Frage lautet nicht mehr, ob KI eingesetzt wird. Die zentrale Frage lautet, ob Führungskräfte bereit sind, Verantwortung für deren Einsatz zu übernehmen.
Nein. Die verfügbaren Studien zeigen sehr deutlich, dass zwischen Bewusstsein und tatsächlicher Handlungsfähigkeit eine erhebliche Lücke besteht.
Besonders aufschlussreich sind die Ergebnisse des Harvard Law School Corporate Governance Blog. Dort wurde Anfang 2026 veröffentlicht, dass 31 Prozent der Boards das Thema KI noch immer nicht regelmäßig auf ihrer Agenda haben. Gleichzeitig geben 66 Prozent der Vorstände an, nicht ausreichend Wissen über KI zu besitzen, um fundierte Entscheidungen treffen zu können. Lediglich fünf Prozent fühlen sich sehr gut auf eine stärkere Nutzung von KI vorbereitet.
Diese Zahlen sind bemerkenswert, weil sie zeigen, dass das Problem nicht mangelndes Interesse ist. Die meisten Führungskräfte wissen, dass KI relevant ist. Das eigentliche Problem besteht darin, dass viele Organisationen schneller KI einsetzen, als sie die notwendigen Führungs- und Governance-Strukturen aufbauen.
Deshalb sollten Führungskräfte KI nicht als einmaliges Innovationsprojekt betrachten. Vielmehr sollte die Frage nach Chancen, Risiken und Auswirkungen von KI ein fixer Bestandteil jeder Management- und Vorstandssitzung werden. Führung bedeutet in diesem Zusammenhang, die richtigen Fragen zu stellen: Wo wird KI bereits genutzt? Welche Entscheidungen beeinflusst sie? Welche Risiken entstehen daraus? Und wer trägt dafür Verantwortung?
Wir erleben derzeit die tiefgreifendste Veränderung juristischer Arbeit seit der Digitalisierung von Rechtsdatenbanken. Noch vor wenigen Jahren bestand Legal Tech hauptsächlich aus Dokumentenmanagementsystemen oder digitalen Akten. Heute sehen wir Systeme, die Verträge analysieren, Risiken identifizieren, Due-Diligence-Prüfungen unterstützen, Schriftsätze vorbereiten oder umfangreiche Rechtsrecherchen durchführen können.
Besonders deutlich wird dies bei der Entwicklung von M&A-Transaktionen. Früher haben Juristinnen und Juristen oftmals tausende Dokumente manuell geprüft – das war auch ein großes Geschäft für die Kanzleien. Teams arbeiteten wochenlang daran, Verträge zu analysieren, Risiken zu identifizieren und kritische Klauseln herauszuarbeiten. Heute können KI-Systeme innerhalb weniger Stunden Vertragsbestände analysieren, Haftungsklauseln hervorheben, Change-of-Control-Regelungen identifizieren oder Abweichungen von Standardverträgen erkennen.
Das bedeutet jedoch keineswegs, dass Juristinnen und Juristen ersetzt werden, die Arbeit verschiebt sich. Die Technologie übernimmt die Vorarbeit. Sie strukturiert Informationen, erkennt Muster und identifiziert Auffälligkeiten. Die eigentliche juristische Bewertung bleibt weiterhin eine menschliche Aufgabe.
Die entscheidende Veränderung besteht darin, dass sich die Wertschöpfung verschiebt. Früher entstand ein großer Teil des Wertes durch das Finden und Aufbereiten von Informationen. Künftig entsteht der Wert zunehmend durch die Fähigkeit, Informationen richtig einzuordnen und daraus belastbare Entscheidungen abzuleiten.
Die Zahlen sind beeindruckend, werden aber häufig missverstanden. Eine der bekanntesten Studien stammt von Harvard Business School und Boston Consulting Group. In dieser Untersuchung arbeiteten 758 Beraterinnen und Berater mit GPT-4. Die Ergebnisse zeigten, dass die Teilnehmer mit KI-Unterstützung Aufgaben um 25 Prozent schneller erledigten, zwölf Prozent mehr Aufgaben lösten und ihre Ergebnisse um rund 40 Prozent besser bewertet wurden.
Das klingt zunächst nach einer eindeutigen Erfolgsgeschichte. Interessant wird die Studie aber an einer anderen Stelle. Sobald sich die Aufgaben außerhalb der tatsächlichen Fähigkeiten der KI bewegten, sank die Qualität der Ergebnisse um 19 Prozent.
Für Führungskräfte ist genau diese Erkenntnis entscheidend. KI erhöht Produktivität nicht automatisch. Sie erhöht Produktivität dort, wo sie für die richtigen Aufgaben eingesetzt wird.
Deshalb reicht es nicht, Mitarbeitenden einfach neue Tools zur Verfügung zu stellen. Führungskräfte müssen gemeinsam mit ihren Teams herausarbeiten, für welche Tätigkeiten KI geeignet ist und wo menschliche Expertise unverzichtbar bleibt.
Gerade im Rechtsbereich gibt es zahlreiche Situationen, in denen strategische Einschätzungen, Verhandlungserfahrung oder Kontextverständnis entscheidend sind. Diese Fähigkeiten lassen sich nicht automatisieren.
Die Rolle von Führung verändert sich grundlegend. Lange Zeit wurden Führungskräfte dafür geschätzt, die besten Antworten zu kennen. Wer über mehr Erfahrung und Wissen verfügte, konnte bessere Entscheidungen treffen und andere anleiten. Das ist vor allem in ExpertInnen-Organisationen, wie Kanzleien und Rechtsabteilungen oft der Fall.
Heute erleben wir nun eine Situation, in der Wissen nahezu unbegrenzt verfügbar wird. Eine junge Juristin kann innerhalb weniger Sekunden mit Hilfe von KI auf Informationen zugreifen, für deren Recherche früher mehrere Stunden notwendig gewesen wären.
Dadurch verschiebt sich die Bedeutung von Führung. Führungskräfte müssen künftig weniger Antworten liefern und stärker Orientierung geben. Sie müssen Entscheidungen unter Unsicherheit treffen, Prioritäten setzen und Risiken bewerten.
Daher wird die, von manchen Führungskräften leider als unangenehm wahrgenommen Fähigkeit, gute Fragen zu stellen, wichtiger als die Fähigkeit, jede Antwort bereits zu kennen. Und das bedeutet auch, dass Führungskräfte neue Kompetenzen entwickeln müssen. Technologieverständnis wird ebenso wichtig wie ethische Fragestellungen, Governance-Kompetenz und die Fähigkeit, Mitarbeitende durch Veränderungsprozesse zu begleiten.
Das ist wahrscheinlich die wichtigste praktische Frage überhaupt.
Viele Unternehmen investieren derzeit Millionenbeträge in Technologien. Die erfolgreichsten Organisationen investieren jedoch vor allem in Menschen. Eine Studie von BCG zeigt, dass besonders erfolgreiche Unternehmen rund 70 Prozent ihrer Investitionen in Menschen und Prozesse investieren, während lediglich zehn Prozent in Algorithmen fließen. Das verdeutlicht, dass der entscheidende Erfolgsfaktor nicht die Technologie selbst ist, sondern die Fähigkeit der Organisation, mit ihr umzugehen.
Führungskräfte können hier sehr konkret ansetzen. Ein erster Schritt besteht darin, Transparenz zu schaffen. In vielen Unternehmen verwenden Mitarbeitende bereits KI, sprechen aber nicht darüber. Teilweise aus Unsicherheit, teilweise aus Sorge, als weniger kompetent wahrgenommen zu werden. Führungskräfte sollten daher aktiv nachfragen, welche Tools genutzt werden und welche Erfahrungen bereits gesammelt wurden.
Ebenso wichtig ist die Schaffung von Lernräumen. Teams sollten regelmäßig die Möglichkeit haben, Erfahrungen auszutauschen. Welche Anwendungen funktionieren gut? Wo treten Fehler auf? Welche Risiken wurden beobachtet? Solche Gespräche fördern nicht nur Wissenstransfer, sondern auch ein realistisches Verständnis der Technologie.
Darüber hinaus sollten Führungskräfte individuelle Kompetenzentwicklung fördern. Nicht jede Mitarbeiterin und jeder Mitarbeiter muss dieselben Fähigkeiten aufbauen. Einige werden sich auf KI-gestützte Vertragsanalyse spezialisieren, andere auf Wissensmanagement, Compliance oder Recherche. Die Aufgabe der Führung besteht darin, diese Potenziale sichtbar zu machen und gezielt zu fördern.
Weil KI die Bedrohungslage grundlegend verändert.
Die EY Human Risk Survey zeigt, dass bereits heute 80 Prozent der Mitarbeitenden besorgt über KI-gestützte Cyberangriffe sind. Gleichzeitig werden Angriffe immer schwerer erkennbar.
Besonders interessant sind die Zahlen der Generation Z. Nur 31 Prozent fühlen sich sicher beim Erkennen von Phishing-Angriffen. Gleichzeitig geben 72 Prozent an, bereits auf verdächtige Links geklickt zu haben. 39 Prozent kennen die internen Meldeprozesse für Sicherheitsvorfälle nicht.
Diese Zahlen zeigen, dass technische Schutzmaßnahmen also allein nicht ausreichen. Führungskräfte müssen eine Sicherheitskultur schaffen. Wenn Mitarbeitende Angst haben, Fehler zu melden, werden Vorfälle häufig zu spät erkannt. Wenn hingegen offen über Fehler gesprochen werden kann, entstehen wertvolle Lernprozesse. Eine moderne Sicherheitskultur basiert deshalb nicht auf Schuldzuweisungen, sondern auf Vertrauen und kontinuierlichem Lernen.
Die Ergebnisse aktueller Studien sind durchaus alarmierend.
Der Harvard Youth Poll 2025 zeigt, dass 59 Prozent der jungen Menschen KI als Bedrohung für ihren Arbeitsplatz wahrnehmen. 75 Prozent gehen davon aus, dass KI ihre Arbeit bereits innerhalb eines Jahres wesentlich verändern wird.
Gleichzeitig zeigt die Deloitte Gen Z Survey, dass nur sechs Prozent der jungen Menschen künftig eine Führungsposition anstreben. Das ist problematisch. Gerade in einer Zeit, in der Governance, Orientierung und verantwortungsvolle Entscheidungen immer wichtiger werden, sinkt die Bereitschaft, Führungsverantwortung zu übernehmen.
Führungskräfte müssen deshalb neue Wege finden, Leadership attraktiv zu machen. Die Führungskraft der Zukunft wird nicht dadurch überzeugen, dass sie jede fachliche Frage beantworten kann. Sie wird dadurch überzeugen, dass sie Menschen befähigt, mit Unsicherheit umzugehen, neue Technologien sinnvoll einzusetzen und verantwortungsvolle Entscheidungen zu treffen.
Der erste Schritt besteht darin, Transparenz zu schaffen. Jede Führungskraft sollte wissen, welche KI-Anwendungen bereits im Team genutzt werden und welche Auswirkungen diese auf Arbeitsabläufe haben.
Der zweite Schritt besteht darin, Kompetenzen sichtbar zu machen. In vielen Organisationen sitzen die größten KI-Expertinnen und -Experten bereits im Unternehmen. Häufig wissen weder die Führungskräfte noch die Kolleginnen und Kollegen davon. Diese Fähigkeiten sichtbar zu machen und zu vernetzen ist eine zentrale Führungsaufgabe.
Der dritte Schritt besteht darin, Lernen systematisch zu organisieren. Die erfolgreichsten Unternehmen der nächsten Jahre werden nicht jene sein, die die meisten Tools kaufen. Erfolgreich werden jene Organisationen sein, die am schnellsten lernen, sich anpassen und neue Kompetenzen entwickeln.
Die Technologie wird sich weiter verändern. Neue Modelle werden entstehen, bestehende Anwendungen werden verschwinden. Der nachhaltigste Wettbewerbsvorteil wird daher nicht die Technologie selbst sein, sondern die Fähigkeit einer Organisation, gemeinsam zu lernen und Verantwortung zu übernehmen.
KI macht Führung nicht weniger wichtig. Sie macht gute Führung wichtiger als je zuvor.
Je mehr Entscheidungen vorbereitet, analysiert oder unterstützt werden können, desto größer wird die Bedeutung von Verantwortung, Urteilsvermögen und Orientierung. Technologie kann Informationen liefern. Sie kann Muster erkennen. Sie kann Vorschläge machen. Aber sie kann keine Verantwortung übernehmen.
Deshalb wird der langfristige Erfolg von Organisationen nicht davon abhängen, welche KI sie einsetzen. Entscheidend wird sein, ob ihre Führungskräfte in der Lage sind, technologische Möglichkeiten mit menschlicher Verantwortung zu verbinden.
Genau darin liegt die eigentliche Führungsaufgabe des KI-Zeitalters.

KI ist kein Technologieprojekt – sie ist ein Führungsprojekt.
Die größte Herausforderung besteht nicht darin, KI einzuführen, sondern sie verantwortungsvoll zu steuern.
📌 66 % der Vorstände geben an, nicht ausreichend Wissen über KI zu besitzen, um fundierte Entscheidungen treffen zu können. Gleichzeitig wird KI bereits in zahlreichen Geschäftsprozessen eingesetzt. Die Governance-Strukturen halten mit der technologischen Entwicklung oft nicht Schritt.
📌 Nur 5 % der Führungsgremien fühlen sich sehr gut auf einen stärkeren KI-Einsatz vorbereitet. Die Kompetenzlücke auf Führungsebene wird damit zu einem strategischen Risiko.
📌 KI kann die Produktivität von Wissensarbeiterinnen und Wissensarbeitern massiv steigern. Die Harvard- und BCG-Studie zeigt: Mit KI-Unterstützung wurden Aufgaben um 25 % schneller erledigt, die Qualität der Ergebnisse stieg um 40 % und es konnten 12 % mehr Aufgaben bearbeitet werden.
📌 Gleichzeitig steigt das Fehlerrisiko, wenn KI außerhalb ihrer tatsächlichen Fähigkeiten eingesetzt wird. In denselben Untersuchungen sank die Qualität der Ergebnisse um 19 %, sobald Aufgaben die Grenzen der Systeme überschritten.
📌 Der Wert juristischer Arbeit verschiebt sich. Die Erstellung von Informationen wird zunehmend automatisiert. Der eigentliche Mehrwert entsteht künftig durch rechtliches Urteilsvermögen, strategische Einordnung, Risikobewertung und Verantwortung.
📌 Cybersecurity wird zur Führungsaufgabe. 80 % der Mitarbeitenden sorgen sich bereits heute um KI-gestützte Cyberangriffe. Deepfakes, KI-generierte Phishing-Angriffe und gefälschte Dokumente verändern die Bedrohungslage grundlegend.
📌 Die nächste Generation blickt mit Unsicherheit auf KI. 59 % der jungen Menschen sehen KI als Bedrohung für ihren Arbeitsplatz, gleichzeitig streben nur 6 % eine Führungsposition an. Unternehmen droht damit eine Leadership-Lücke genau zu jenem Zeitpunkt, an dem gute Führung wichtiger wird.
1. Transparenz schaffen
KI-Nutzung sichtbar machen und offen darüber sprechen, welche Tools bereits eingesetzt werden.
2. Kompetenzen aufbauen
Technologieverständnis darf nicht auf einzelne Expertinnen und Experten beschränkt bleiben.
3. Governance etablieren
Verantwortlichkeiten, Freigabeprozesse und Qualitätskontrollen definieren.
4. Lernkultur fördern
Fehler als Lernchance verstehen und den Wissensaustausch im Unternehmen stärken.
5. Menschen in den Mittelpunkt stellen
Erfolgreiche KI-Transformationen entstehen nicht durch bessere Algorithmen, sondern durch bessere Führung.
Die entscheidende Frage der nächsten Jahre lautet nicht, welche KI ein Unternehmen einsetzt.
Die entscheidende Frage lautet, ob die Führung bereit ist, Verantwortung für deren Einsatz zu übernehmen.
Denn KI ersetzt Führung nicht – sie macht gute Führung wichtiger als je zuvor.
Ein Beitrag von Future-Law, über das Future-Law LLM Benchmark Projekt
Projektüberblick
Future-Law Advisory hat als erste Organisation in Österreich ein umfassendes LLM Benchmark Review für den juristischen Einsatz durchgeführt. Es wurden sieben führende KI-Modelle (ChatGPT, Mistral , Gemini, Grok, Claude, DeepSeek und CoPilot) systematisch getestet und verglichen. Es wurden ausschließlich die kostenlosen Versionen der Modelle verwendet, um die Einstiegssituation typischer Rechtsabteilungen abzubilden.
Prüfungsdesign und Methodik
Alle Modelle erhielten identische Aufgaben mit identischen Prompts. Die Bewertung erfolgte über eine strukturierte Bewertungsmatrix mit klar definierten Kriterien. Zur Sicherstellung objektiver Ergebnisse wurden neue Benutzerkonten angelegt und der Inkognito-Modus verwendet. Die fünf Prüfungskategorien waren:
1. OGH-Entscheidungen (via Geschäftszahl, Weblink, PDF und Entscheidungstext)
2. Newsletter und E-Mail auf Basis einer OGH-Entscheidung
3. Juristischer Sachverhalt (vier verschiedene Prompt-Varianten)
4. KG-Vertragsmuster anhand der WKO-Checkliste (17 Punkte)
5. AGB-Klauselanalyse (vier Fragen zu Großbank-AGBs)
Kernerkenntnis: Es gibt kein universell „bestes“ KI-Modell.
Die Leistungsfähigkeit variiert stark je nach Aufgabentyp. Die wichtigsten Ergebnisse im Einzelnen:
– Claude erzielte insgesamt die höchste Gesamtpunktzahl und dominierte in vielen Kategorien – insbesondere bei Vertragsentwürfen (einziges Modell mit 17/17 Punkten auf der WKO-Checkliste), bei der Sachverhaltsanalyse und bei der OGH-Recherche via Geschäftszahl.
– DeepSeek überzeugte besonders bei der OGH-Analyse via Weblink sowie bei der Newsletter-Erstellung und bestimmten Sachverhaltsanalysen.
– CoPilot zeigte insbesondere bei der AGB Klauselanalyse gute Leistungen.
– Mistral erzielte Spitzenwerte bei der E-Mail-Erstellung und der AGB-Analyse, fiel aber bei Vertragsentwürfen deutlich ab (11/17).
– Gemini erzielte bei Vertragsentwürfen (16/17) starke Ergebnisse.
– ChatGPT erzielte insbesondere bei der E-Mail-Erstellung und der AGB-Analyse solide Ergebnisse.
– Grok überzeugte bei der Vertragserstellung mit starken 16/17 WKO-Punkten und zeigte bei der E-Mail-Erstellung solide Leistungen.
Die größte Schwachstelle der Modelle liegt nicht in der Textanalyse, sondern im Auffinden der korrekten Information. Wurde der Entscheidungstext direkt bereitgestellt (als Text oder PDF), erzielten fast alle Modelle ein hohes, homogenes Leistungsniveau. Bei der Suche über Geschäftszahl oder Weblink versagten hingegen die meisten Modelle.
– Kein Modell lieferte in allen Kategorien fehlerfreie Ergebnisse. Das Prinzip „Human-in-command“ bleibt unverzichtbar – die finale rechtliche Bewertung muss stets durch Jurist:innen erfolgen.
– Rechtsabteilungen sollten aufgabenspezifisch das passende Modell wählen, statt auf ein Alleskönner-Modell zu setzen.
– Die Ergebnisse sind eine Momentaufnahme (Stand Ende 2025); regelmäßige Neubewertungen sind aufgrund der rasanten KI-Entwicklung erforderlich.
Fazit: KI im Recht ist kein Hype, sondern ein Werkzeug mit messbarem Nutzen. Die strategische Frage lautet nicht mehr ob, sondern wie klug Rechtsabteilungen KI einsetzen.
Ein Beitrag von Future-Law, über Dr. ChatGPT und die professionelle Verantwortung gegenüber informierten Mandant:innen
1. Digitale Vorprägung als neue Mandatsrealität
Die Nutzung digitaler Rechtsinformationen durch Laien ist kein Randphänomen mehr, sondern struktureller Bestandteil moderner Rechtsdurchsetzung. Studien zu Legal Self-Help und Public Legal Education zeigen seit Jahren, dass Rechtsuchende systematisch Online-Quellen nutzen, bevor sie professionelle Beratung in Anspruch nehmen.1
Suchmaschinen, öffentlich zugängliche Datenbanken (z.B. RIS), Foren und zunehmend generative KI-Systeme erzeugen dabei keine bloße Informationsbasis, sondern vorgeformte rechtliche Narrative. Mandant:innen treten mit konkreten Erwartungen, Anspruchsbildern und Lösungsannahmen auf – häufig losgelöst von Verfahrensrecht, Beweislast oder strategischen Abwägungen. Eigentlich ein Idealbild, oder?
Diese Entwicklung wird in der Rechtssoziologie als Verschiebung von Experten- zu Laienepistemik beschrieben: Wissen wird zugänglich, Verantwortung bleibt professionell.2
2. Legal Self-Help: Empowerment oder Risiko?
Empirische Forschung zeigt ein ambivalentes Bild. Einerseits kann rechtliche Vorinformation
Andererseits weisen Studien darauf hin, dass ungefilterte Rechtsinformation
Besonders problematisch ist die Selektivität der Recherche: Mandant:innen tendieren dazu, Informationen zu bevorzugen, die ihre gewünschte Rechtsposition bestätigen (confirmation bias), während widersprechende Judikatur oder systematische Einschränkungen ausgeblendet werden.5
3. Öffentliche Rechtsdatenbanken (RIS) und der Mythos der „klaren Judikatur“
Im österreichischen Kontext kommt dem RIS eine besondere Rolle zu. Die freie Zugänglichkeit von Gesetzestexten und Entscheidungen stärkt Transparenz und Rechtsstaatlichkeit, erzeugt aber zugleich Interpretationsrisiken.
OGH-Entscheidungen werden von Laien häufig als abstrakte Regeln gelesen, obwohl sie stets einzelfallbezogen, sachverhaltsgebunden und instanzenkontextualisiert sind. Die juristische Methodenlehre (Auslegung, Systematik, Teleologie) bleibt dabei regelmäßig unsichtbar.6
Die Verantwortung der Jurist:innen besteht daher nicht darin, den Zugang zu kritisieren, sondern die Grenzen der Übertragbarkeit offenzulegen.
4. Generative KI als „Dr. ChatGPT“: eine neue Qualität der Vorprägung
Mit generativer KI verschärft sich das Phänomen qualitativ. Anders als Suchmaschinen liefern Large Language Models (LLMs)
Rechtswissenschaftliche Analysen zeigen, dass KI-Systeme
Besonders kritisch ist, dass diese Systeme weder haftungsrechtlich noch berufsrechtlich eingebunden sind. Die Illusion von Rechtsrat ohne Verantwortung stellt eine neue Herausforderung für die Anwaltschaft dar.8 Selbst der Hinweis von LLMs, dass sie keinen rechtlichen Rat geben können, schreckt die Nutzer:innen nicht ab.
5. Professionelle Verantwortung im Umgang mit digital vorinformierten Mandant:innen
Was aber können nun betroffene Jurist:innen tun?
5.1 Vertrauensschutz und Mandatsbeziehung
Berufsrechtlich und professionsethisch ist klar: Jurist:innen schulden keine Belehrung, sondern sachgerechte Beratung. Eine pauschale Abwertung vorab recherchierter Informationen kann das Vertrauensverhältnis nachhaltig schädigen.9
Anerkennung der Vorbereitung bedeutet jedoch nicht Anerkennung der Richtigkeit. Die juristische Kernleistung liegt in der Einordnung, Gewichtung und Begrenzung.
5.2 Risikokommunikation statt Ergebnisversprechen
Studien zur anwaltlichen Entscheidungsfindung zeigen, dass Mandant:innen insbesondere bei hoher emotionaler oder wirtschaftlicher Betroffenheit zu binären Erwartungshaltungen neigen.10
Juristische Verantwortung bedeutet hier,
Empathie und Gesprächsführung statt reinem Fachwissen also.
5.3 Informationskompetenz als Teil anwaltlicher Sorgfalt
Man könnte auch argumentieren, dass der Umgang mit Fehlinformationen Teil professioneller Sorgfaltspflichten ist – vergleichbar mit der Aufklärung über Risiken oder Alternativen. Dazu zählen insbesondere:
6. Haftung, Dokumentation und Abgrenzung
Aus haftungsrechtlicher Sicht ist relevant, dass digitale Vorannahmen das Verhalten von Mandant:innen beeinflussen können (z.B. Fristversäumnisse, Ablehnung von Vergleichen, Prozesseskalation).
Die Dokumentation der korrigierten Fehlannahmen und der besprochenen Risiken könnte somit an Bedeutung gewinnen. Die Entscheidung bleibt bei den Mandant:innen – die Verantwortung für die rechtliche Bewertung jedoch bei der Juristin bzw. beim Juristen.11
7. Schluss: Juristische Beratung als Ordnungsleistung
Das juristische „Netdoktorsyndrom“ ist kein Kommunikationsdefizit, sondern Ausdruck eines strukturellen Wandels. Der Wert professioneller Rechtsberatung liegt nicht mehr im exklusiven Zugang zu Information, sondern in der Fähigkeit,
Das erfordert Geduld und manchmal auch Mut. Diese Ordnungsleistung ist nicht delegierbar – weder an Suchmaschinen noch an KI.
Fußnoten & Quellen
Ein Beitrag von RA DR. Sebastian Sieder LL.M (Finance) und Lukas Messner, CIPP/E, über Prospekterstellung mit generativer KI: Werden Algorithmen zu Co-Autoren im Kapitalmarktrecht? Der Beitrag beleuchtet Chancen, Effizienzpotenziale und rechtliche Grenzen KI-gestützter Prospektentwürfe – von Prospekt-VO über KI-VO bis Datenschutz.Legal Tech-Expertin und Gründerin von Future-Law, darüber wie Anwält:innen ohne Programmierkenntnisse eigene Software bauen – und worauf sie achten müssen.
Algorithmen als Co-Autoren bei der Erstellung eines Basisprospekts?
Einleitung
Die Digitalisierung des Kapitalmarkts erreicht durch den Einsatz Künstlicher Intelligenz (KI) eine neue Stufe: Während die Erstellung von Prospekten traditionell einen hohen personellen und zeitlichen Aufwand erforderte, versprechen moderne Technologien heute eine Automatisierung wesentlicher Teile dieses Prozesses. Diese Entwicklung wirft grundlegende Fragen zur künftigen Rolle der KI als Standardwerkzeug in der Rechtsberatung auf. Wir nehmen die aktuellen Marktentwicklungen zum Anlass, die KI-gestützte Prospekterstellung aus unionsrechtlicher Sicht einzuordnen.
In der rechtswissenschaftlichen Literatur wird KI als technologischer Megatrend eingestuft, der die Strukturen des Kapitalmarkts fundamental transformiert. Die rechtswissenschaftliche Auseinandersetzung mit KI konzentrierte sich bislang primär auf die Kreditwürdigkeitsprüfung sowie den Bereich des Anlagegeschäfts. Im operativen Bankbetrieb ist KI zudem bereits fest in Prozessen wie Compliance, Risikomanagement und der Geldwäscheprävention verankert. Innerhalb des „Kernkapitalmarktrechts“ fokussiert die Literatur insbesondere auf die Marktmissbrauchsverordnung (MAR) hinsichtlich ihrer Tauglichkeit im Hinblick auf KI-Einsatzmöglichkeiten. Andere Abhandlungen zu KI und Kapitalmarktrecht fokussieren sich auf algorithmischen Handel und Hochfrequenzhandel, Besonderheiten bei Blockchain-basierten Handelssystemen und generell auf Blockchain, Distributed Ledger und Smart Contracts.
Ein wesentliches, zunehmend an Bedeutung gewinnendes Einsatzgebiet stellt die Due-Diligence-Prüfung dar. Im Bereich der Due-Diligence-Prüfung i.Z.m. M&A-Transaktionen ist der Einsatz von KI schon weit verbreitet. Da die Due-Diligence-Prüfung mitunter die Grundlage für die Prospekterstellung bildet und kontinuierlich bis zum Transaktionsabschluss fortgeführt werden muss, bietet der Einsatz von KI hier signifikante Effizienzpotentiale.
Wir konzentrieren uns jedoch dezidiert auf die theoretische Möglichkeit, KI-gestützter Prospekterstellung, da dieser Prozess den ressourcenintensivsten Teil einer Wertpapieremission darstellt, aus Emittentenperspektive die höchste Priorität für Effizienzsteigerungen besitzt und spiegelbildlich zum Bestreben der Aufsichtsbehörden steht, die eigene Prüfungstätigkeit durch technologische Hilfsmittel zu optimieren.
Die BaFin hat die systemische Relevanz der Künstlichen Intelligenz bereits 2018 als „fundamentalen Paradigmenwechsel“ eingestuft. Während ESMA, die Europäische Kommission und das Europäische Parlament durch Konsultationen und Stellungnahmen (Stand 2024/2025) Einsatzfelder wie u.a. Compliance, Risikomanagement und den Anlegerschutz adressieren, fehlen spezifische regulatorische Leitlinien zur KI-gestützten Prospekterstellung bislang. Gleichwohl zeigt sich eine zunehmende technologische Adaption aufseiten der Aufsicht: So nutzt die BaFin mit dem „RAGulator“ eine dedizierte KI-Plattform zur Unterstützung der Aufsichtstätigkeit, die FMA setzte bereits 2024 NLP-Verfahren zur automatisierten Prüfung tausender Basisinformationsblätter (PRIIPs-KID) ein und die CONSOB verwendet KI bereits dezidiert im Rahmen der Prospektprüfung.
Diese Entwicklung verdeutlicht eine technologische Divergenz: Während die Aufsichtsbehörden KI bereits zur Effizienzsteigerung bei der Validierung von Dokumenten nutzen, steht die systematische rechtliche Aufarbeitung für die Erstellungsseite noch am Anfang. Dies unterstreicht die Notwendigkeit, die Einsatzmöglichkeiten und den Rechtsrahmen für die Prospekterstellung mittels KI eingehend zu prüfen.

Die Regulierung von KI-Systemen folgt einem dualen Ansatz, bestehend aus sektorübergreifenden Normen (insb. KI-VO, DSGVO) und sektorspezifischen Bestimmungen (z.B. Regelung zur automatisierten Verarbeitung in der neuen Verbraucherkreditrichtlinie von 2023). Für die KI-gestützte Prospekterstellung bildet die Prospekt-VO die maßgebliche Rechtsgrundlage; diese enthält jedoch de lege lata keine spezifischen Vorgaben für den Einsatz algorithmischer Systeme.
Zentrales Element der allgemeinen Regulierung ist die KI-VO, die KI-Systeme basierend auf ihrem Gefährdungspotenzial für Gesundheit, Sicherheit und EU-Grundrechte in Risikoklassen einteilt. Je höher das diesbezügliche Risiko, desto strenger ist gemäß dem risikobasierten Ansatz die Regelung der KI-Verordnung.
Für die Prospekterstellung können einem KI-System vergleichbare gebilligte und veröffentlichte Prospekte als Datenbasis zugänglich gemacht werden. Ein wesentlicher Diskussionspunkt ist das „Black-Box-Phänomen“, das die mangelnde Nachvollziehbarkeit der internen Entscheidungsprozesse beschreibt, sprich wie die KI zu ihrem Ergebnis kommt (Hidden Layer). Hieraus resultieren Anforderungen an die technische Erklärbarkeit: Die BaFin vertritt grundsätzlich die Ansicht, dass KI-basierte Entscheidungen zur Erfüllung aufsichtlicher Vorgaben erklärbar sein müssen, während in manchen Teilen der Literatur eine Ausnahme vom Erklärungsgebot dort postuliert wird, wo die KI die menschliche Entscheidung nicht wesentlich beeinflusst. Da KI im Rahmen der Prospekterstellung lediglich zur Entwurfsgenerierung eingesetzt wird und die Letztentscheidung sowie die Verantwortung im Billigungsverfahren beim menschlichen Ersteller verbleiben, ist eine gesonderte Offenlegung oder Erklärung der KI-Anwendung u.E. nicht erforderlich.

Neben den spezifischen kapitalmarktrechtlichen Normen ist der Einsatz von KI an weitere regulatorische Voraussetzungen geknüpft, wobei insbesondere das Datenschutz- und Urheberrecht sowie berufsrechtliche Standards im Fokus stehen. Die Verarbeitung personenbezogener Daten erfordert die Einhaltung der DSGVO und etwaiger nationaler datenschutzrechtlicher Vorschriften. Liegt eine Form der Verarbeitung, insbesondere bei Verwendung neuer Technologien, vor, welche die Durchführung einer Datenschutz-Folgeabschätzung gebieten, ist eine solche durchzuführen (Art. 35 DSGVO). Bedient man sich eines Auftragsverarbeiters, so ist mit diesem eine Auftragsverarbeitervereinbarung (Art. 28 DSGVO) abzuschließen. Für wissenschaftliche Zwecke und bei der Verwendung rein öffentlicher Daten bestehen jedoch spezifische Erleichterungen.
Während die Nutzung urheberrechtlich geschützter Inhalte durch KI-Modelle (Training und Output) komplexe Rechtsfragen aufwirft, ist dies für die vorliegende Untersuchung aufgrund des Fokus auf öffentlich zugänglichen Prospektdaten und den wissenschaftlichen Kontext nicht unmittelbar hinderlich.
Abseits der genannten Rechtsbereiche sind zahlreiche andere gesetzliche Regelungen (z.B. Berufsrecht) und vertragliche Vereinbarungen (z.B. Mandatsvereinbarungen) vor dem Einsatz von KI-Anwendungen zu berücksichtigen. „KI-Checklisten“, die auch Inhalte gänzlich anderer Domänen (zB. IT- und Informationssicherheit) beinhalten, können hierbei als wertvolles Instrument dienen.
Die Erstellung von IPO-Prospekten unterliegt primär der Prospekt-VO, die bei öffentlichen Angeboten von Wertpapieren oder deren Zulassung an einem geregelten Markt eine Prospektpflicht statuiert. Emittenten steht hierbei ein differenziertes Spektrum an Prospektarten zur Verfügung, das durch den EU Listing Act teilweise reformiert wird. Der EU Listing Act forciert eine stärkere Vereinheitlichung der Prospektformate. Während dies initial einen Anpassungsaufwand für Emittenten bedeutet, erhöht die Standardisierung mittel- bis langfristig das Potenzial für KI-gestützte Effizienzsteigerungen, da die maschinelle Verarbeitbarkeit und Vergleichbarkeit der Dokumente optimiert wird. Vor allem im Bereich der automationsgestützten Texterstellung (Document Automation) sind regelbasierte Systeme – abseits oder in Kombination mit dem Einsatz generativer KI – wesentlich.
Die Prospekt-VO macht keine normativen Vorgaben zur Art der Prospekterstellung. Der Einsatz von textgenerierender KI ist somit rechtlich zulässig. Entscheidend ist, dass das Ergebnis (am Ende) den aufsichtsrechtlichen Prüfkriterien der Vollständigkeit, Verständlichkeit und Kohärenz (Art. 2 lit. r Prospekt-VO) genügt. Der Prospekt bedarf der Billigung durch die zuständige Aufsichtsbehörde (z. B. BaFin oder FMA) anhand der soeben genannten Prüfkriterien und muss als durchsuchbares elektronisches Dokument veröffentlicht werden.
Die Literatur erkennt bereits an, dass generative Sprachmodelle aufgrund der hohen Verfügbarkeit standardisierter Altdaten in der Lage sind, substanzielle Prospektkapitel autonom zu entwerfen. Wie dies praktisch funktioniert, haben wir in Teil II dieses Beitrags getestet.
Über die Autoren:


Lukas Messner, CIPP/E, ist als Legal Tech Advisor bei Müller Partner Rechtsanwälte
in Wien tätig und dort für Legal Tech und Digitalisierung verantwortlich.
RA Dr. Sebastian Sieder, LL.M. Finance, ist österreichischer Rechtsanwalt (RAK Wien) und
als niedergelassener europäischer Rechtsanwalt (Liechtensteinische RAK) bei
Gasser Partner Rechtsanwälte in Liechtenstein tätig.
Ein Beitrag von Peter Lohberger über KI im Vergaberecht: Wie Wiener Wohnen Hausbetreuung mit Legal Tech hunderte Bieterdokumente in Stunden statt Tagen prüft. Effizienter, objektiver und rechtskonform – dank KI-gestützter Evaluierung und klarem „Human in Command“-Prinzip. Ein Praxisbericht über Innovation im öffentlichen Beschaffungswesen.
Ausgangssituation: Hohe Anforderungen im öffentlichen Vergabewesen
Wiener Wohnen Hausbetreuung GmbH ist als Tochterunternehmen der Stadt Wien dem Bundesvergabegesetz unterworfen und mit einem hohen Beschaffungsvolumen konfrontiert. Jährlich werden viele öffentliche Ausschreibungen durchgeführt, mit steigender Tendenz. Diese Entwicklung stellt die Organisation vor wachsende Herausforderungen: Die komplexe Prüfung von Bieterunterlagen durch die Rechtsabteilung erfordert erheblichen personellen Aufwand bei zeitintensiven, repetitiven Prüfaufgaben.
Die Komplexität wird zusätzlich durch verschiedene Dokumentenformate verstärkt. Bieter reichen ihre Unterlagen in unterschiedlichsten Formaten ein – von PDF-Dokumenten über Word-Dateien und Excel-Tabellen bis hin zu eingescannten Bildern. Diese Heterogenität erschwert die systematische Auswertung erheblich und bindet wertvolle Ressourcen, die für komplexere rechtliche Fragestellungen dringend benötigt werden.
Vor diesem Hintergrund wurde die Entscheidung getroffen, Legal Tech und Künstliche Intelligenz gezielt einzusetzen, um die Effizienz zu steigern, ohne dabei die rechtliche Qualität und Verantwortung zu kompromittieren. Der Einsatz von Legal Tech und KI bei Wiener Wohnen Hausbetreuung erstreckt sich momentan auf die Angebotsprüfung und Zuschlagsentscheidung.
Zielsetzung und Business Case
Die Ziele des KI-Einsatzes sind klar definiert und messbar: An erster Stelle steht die Effizienzsteigerung durch Automatisierung zeitintensiver Routineprüfungen. Aufgaben, die bisher Tage in Anspruch nahmen, können nun in kurzer Zeit bewältigt werden.
Die Kosteneinsparung durch Reduzierung des manuellen Bearbeitungsaufwands ermöglicht es, personelle Ressourcen strategischer einzusetzen. Statt repetitive Prüfungen durchzuführen, können sich Rechtsexperten auf komplexe Fragestellungen konzentrieren, die echte juristische Expertise erfordern. Qualitätsverbesserung durch standardisierte und objektive Vorbewertung ist ein weiterer zentraler Aspekt. Die Beschleunigung der Vergabeverfahren durch automatisierte Vorqualifizierung kommt nicht nur Wiener Wohnen Hausbetreuung zugute, sondern auch den Bietern, die schneller Planungssicherheit erhalten. Dies verbessert die Attraktivität der Ausschreibungen und kann zu qualitativ hochwertigeren Angeboten führen.
Die strategische Ressourcenallokation für komplexe rechtliche Fragestellungen steigert letztlich die Qualität der gesamten Rechtsberatung.
Rechtsrahmen: Komplexe Anforderungen im Zusammenspiel
Die Implementierung erfolgte unter Berücksichtigung eines komplexen und mehrschichtigen Rechtsrahmens. Nebem der DSGVO und dem AI-Act mussten die Bestimmungen den BVergG 2018 beachtet werden, dieses regelt, dass die Vorbereitung einer Ausschreibung bzw. die Prüfung und Beurteilung eines Angebots nur solchen Personen zu übertragen ist, welche hierfür die fachlichen Voraussetzungen erfüllen. Diese Regelung wird durch das „Human in the Command“-Prinzip sichergestellt.
Herausforderungen auf drei Ebenen
Die Implementierung stand vor vielfältigen Herausforderungen, die sich in drei Kategorien gliedern lassen: strategische, organisatorische und technische Herausforderungen.
Auf strategischer Ebene war die Auswahl des geeigneten KI-Dienstleisters eine Schlüsselentscheidung. Der Markt ist fragmentiert, die Qualität der Lösungen variiert erheblich. Die Überzeugungsarbeit im Unternehmen erforderte umfassende Aufklärung über Möglichkeiten und Grenzen von KI durch transparente Kommunikation. Budgetäre Limitierungen erforderten eine klare Priorisierung und einen stufenweisen Ausbau.
Organisatorisch war die Ressourcenbereitstellung über einen längeren Zeitraum eine Herausforderung. KI-Projekte sind keine Sprint-, sondern Marathon-Vorhaben. Zeitintensive Abstimmungen zwischen IT, Recht, Beschaffung und Management erforderten Geduld und Durchhaltevermögen. Umfangreiche Dokumentationsanforderungen, insbesondere im Hinblick auf AI-Act und Compliance, banden Kapazitäten.
Technisch stellten heterogene Dokumentenformate die wohl größte Herausforderung dar. Die Verarbeitung und Analyse von großen Datenmengen erforderte leistungsfähige Infrastruktur. Multimodale Inhalte – also die Kombination von Text, Tabellen und Bildern in einem Dokument – verlangten nach speziellen Analyse-Algorithmen. Datensicherheit und Datenschutz mussten auf höchstem Niveau gewährleistet werden. Die Integration in die bestehende IT-Landschaft stellte Anforderungen an Schnittstellen und Kompatibilität.
Implementierung: Von der Konzeption zur produktiven Lösung
Die Anforderungen an das System waren von Anfang an ambitioniert, aber klar definiert: Eine hohe Genauigkeit deutlich über der deutlich über der Konsistenz manueller Prüfungen sollte erreicht werden. Rechtskonformität sowie Datenschutz und Datensicherheit waren nicht verhandelbare Grundpfeiler. Der modulare und erweiterbare Aufbau sollte ermöglichen, das System schrittweise auszubauen und an neue Anforderungen anzupassen.
Nach einer gründlichen Analyse durch einen internen Audit-Prozess wurde eine WebApp-Lösung entwickelt. Die Entscheidung für eine Web-basierte Anwendung ermöglicht zentrale Updates und ortsunabhängigen Zugriff. Das Herzstück bilden agentische KI-Workflows, die mehrere spezialisierte KI-Modelle orchestrieren. Jedes Modell ist auf spezifische Aufgaben optimiert – von der Texterkennung über die semantische Analyse bis zur Kategorisierung.
Die laufende Evaluierung ermöglicht kontinuierliche Verbesserung des Systems und regelmäßige Qualitätskontrollen stellen sicher, dass die Genauigkeit des Systems nicht nachlässt.
Praktische Beispiele der Implementierung
Beispiel 1 – Durchführung eines Bieteraudits:
Ein agentischer KI-Workflow führt die eigentliche Prüfung durch. Basierend auf den strukturierten Bieterunterlagen und den definierten Prüfungskriterien erstellt er eine umfassende Audit-Ergebnisliste. Für jedes Einzelkriterium werden Name, Detailinfo und Ergebnis dokumentiert. Besonders wertvoll ist die automatisch generierte Begründung inklusive konkreter Referenzen auf Textstellen in den Unterlagen. Ein vollständiger Audit Trail dokumentiert jeden Schritt der Prüfung und macht sie nachvollziehbar. Das Gesamtergebnis wird durch Rechtsexperten geprüft und freigegeben.
Beispiel 2 – Generierung des Audit-Endberichts:
Die KI fasst alle gesammelten Informationen zusammen: Projektinfo, detaillierte Bieterinfo, alle Bewertungen, verwendete Referenzen, den kompletten Audit Trail sowie alle erfolgten Freigaben. Daraus entsteht ein strukturierter Audit-Endbericht, der sowohl für interne Zwecke als auch für mögliche Nachfragen oder Rechtsstreitigkeiten als Dokumentation dient.
Ergebnisse: Messbare Erfolge in der Praxis
Die Implementierung zeigt messbare und signifikante Erfolge: Die automatisierte Analyse von Angebotspaketen mit hunderten Dokumenten, die früher Tage in Anspruch nahm, erfolgt nun in wenigen Stunden. Die schnelle Vorqualifizierung anhand eines Kriterienkatalogs filtert nicht geeignete Angebote frühzeitig heraus und ermöglicht eine Konzentration auf vielversprechende Bieter. Die erhebliche Beschleunigung der Prüfprozesse kommt allen Beteiligten zugute. Die signifikante Reduzierung manueller Bearbeitungszeit setzt wertvolle Ressourcen frei. Die objektive Vorbewertung als Basis für Entscheidungen erhöht die Qualität der finalen Zuschlagsentscheidungen und reduziert das Risiko von Nachprüfungsverfahren.
Learnings: Erkenntnisse für künftige Projekte
Die wichtigsten Erkenntnisse aus dem Projekt bieten wertvolle Hinweise für andere Organisationen: Frühzeitiger Start verschafft Wettbewerbsvorteil – die KI-Technologie entwickelt sich rasant, und wer früh beginnt, kann Erfahrungen sammeln und seine Prozesse optimieren, während andere noch planen.
Inhouse KI-Kompetenz ist essentiell. Externe Dienstleister können unterstützen, aber das Verständnis für die Technologie und ihre Grenzen muss intern vorhanden sein. Rechtliche Rahmenbedingungen müssen von Anfang an mitgedacht werden – nachträgliche Anpassungen sind deutlich aufwändiger. Eine langfristige Perspektive ist wichtiger als kurzfristiger Return of Investment. KI-Projekte amortisieren sich oft erst nach Jahren, bringen dann aber nachhaltigen Nutzen.
Echte Partnerschaft mit dem Dienstleister ist entscheidend – rein vertragliche Beziehungen funktionieren bei innovativen Projekten selten gut. Dokumentenqualität ist entscheidend: „Garbage in, garbage out“ gilt besonders für KI-Systeme.
Vision Language Models sind überlegen gegenüber reinen Textanalyse-Systemen, da sie auch visuelle Struktur und Layout verstehen. On-Premise-Lösungen sollten für sensible Daten wenn möglich eingesetzt werden, um maximale Datenkontrolle zu gewährleisten. Ein Quellennachweis ist essentiell – jede KI-Aussage muss auf konkrete Dokumente und Textstellen zurückführbar sein.
Human in the Command-Prinzip: Verantwortung bleibt beim Menschen
Ein zentrales und nicht verhandelbares Prinzip der Implementierung ist „Human in the Command“: Die finale Bewertung verbleibt immer bei Experten der Rechtsabteilung. KI dient ausschließlich als intelligentes Unterstützungswerkzeug, nicht als Ersatz für menschliche Entscheidungen.
Juristische Expertise für Kontextwissen und Auslegungsfragen bleibt unverzichtbar. KI kann Muster erkennen und Vorschläge machen, aber die Interpretation komplexer Rechtsfragen erfordert profunde juristische Bildung und Erfahrung. Die rechtliche Verantwortungsstruktur bleibt eindeutig definiert und liegt bei natürlichen Personen, nicht bei Algorithmen.
Fortlaufende Qualitätskontrolle durch Expertenprüfung stellt sicher, dass das System nicht „abdriftet“ oder fehlerhafte Muster lernt. Ein verantwortungsvolles Verständnis digitaler Transformation bedeutet, Technologie als Werkzeug zu begreifen, das Menschen befähigt, nicht ersetzt.
Fazit und Ausblick
Das Beispiel Wiener Wohnen Hausbetreuung zeigt eindrucksvoll, dass Legal Tech im Vergabewesen vor allem dort wirksam ist, wo hohe Verfahrenszahlen mit klaren rechtlichen Vorgaben zusammentreffen. Der größte Nutzen entsteht nicht durch Automatisierung von Entscheidungen – diese bleiben menschlicher Expertise vorbehalten –, sondern durch Standardisierung, objektive Vorbewertung als Grundlage für qualifizierte Entscheidungen durch Fachexperten.
Die Reise ist dabei keineswegs zu Ende. Kontinuierliche Weiterentwicklung der KI-Modelle, Integration neuer Datenquellen und Erweiterung auf weitere Prozessschritte stehen auf der Agenda. Wie Dr. Peter Lohberger treffend formuliert: „The journey continues“ – die Reise geht weiter, und Wiener Wohnen Hausbetreuung hat sich als Pionier im Einsatz von Legal Tech im öffentlichen Vergabewesen positioniert.
Über den Autor:

Dr. Peter Lohberger MSc ist Leiter der Rechtsabteilung der Wiener Wohnen Hausbetreuung GmbH. Seine Schwerpunkte liegen in den Bereichen Vertrags-, Vergabe-, Arbeits-, Datenschutz-, IT-Recht und in der rechtlichen Begleitung von Digitalisierungsprojekten. Er ist zudem Autor, Vortragender, Schiedsrichter in Schiedsverfahren und selbständiger Datenschutzbeauftragter.
Sophie Martinetz, Gründerin und CEO von Future-Law, über die Ergebnisse des Legal Tech Barometer 2026 und was sie über den Zustand der Rechtsabteilungen verraten.
Frau Martinetz, Sie haben das Legal Tech Barometer 2026 bereits zum neunten Mal präsentiert – diesmal im Presseclub Concordia in Wien. Was ist Ihr wichtigstes Fazit?
Der Wandel ist in vollem Gange – und er ist nicht mehr aufzuhalten. 99 Prozent der befragten Juristinnen und Juristen nutzen KI zumindest gelegentlich, 45 Prozent sogar mehrmals täglich. Das zeigt: AI ist kein Experiment mehr, sondern Alltagswerkzeug. Die entscheidende Frage ist jetzt nicht mehr ob, sondern wie gut Organisationen diesen Wandel gestalten.
Rechtsabteilungen stechen in der Studie besonders hervor. Was macht sie so anders?
Sie sind die intensivsten Nutzerinnen im gesamten Rechtsmarkt – aber nicht aus Digitalisierungsbegeisterung. 55 Prozent berichten von steigenden Aufwänden bei gleichbleibender Teamgröße, im Gesamtfeld sind es nur 21 Prozent. Das ist ein enormer Unterschied. AI wird hier eingesetzt, weil es schlicht keine andere Option gibt. Viele starten bereits mit konkreten Anwendungen, ohne dass Governance, Budget und Strategie ausreichend geklärt sind.
Wo wird AI in Rechtsabteilungen konkret eingesetzt?
Vor allem im Kerngeschäft: Vertragsentwürfe, Dokumentenanalyse, Übersetzungen. Bei Vertragsentwürfen liegt die Nutzungsquote 37 Prozentpunkte über dem Branchenschnitt – das ist bemerkenswert. Als dominierendes Tool hat sich Microsoft Copilot etabliert, 72 Prozent setzen darauf. Das ist ein klassisches Infrastrukturphänomen: In Großunternehmen ist M365 bereits vorhanden, Copilot ist der naheliegendste Einstieg.
Die Studie zeigt aber auch eine klare Lücke: Trotz intensiver Nutzung kaum automatisierte Workflows. Wie erklären Sie das?
Das ist die zentrale Spannung, die mich am meisten beschäftigt. AI wird individuell genutzt – als persönliches Werkzeug. Aber systematisch, skalierbar, in Prozesse gegossen – das fehlt noch. 78 Prozent der Rechtsabteilungen haben keine automatisierten Workflows. Gleichzeitig planen rund 40 Prozent im Gesamtfeld deren Einführung. Die nächste Entwicklungsstufe zeichnet sich also ab: weg von einzelnen Tools hin zu integrierten, durchgängigen Prozessen.
Verändert AI auch das juristische Berufsbild?
Eindeutig ja – aber nicht so, wie viele befürchten. Was wir beobachten, ist keine Verdrängung, sondern eine Verlagerung. Routinetätigkeiten wandern zur KI, die gewonnene Zeit wird für komplexere Fragestellungen, strategische Beratung und Qualitätssicherung genutzt. Urteilsvermögen, Mandantennähe, ethische Verantwortung – das gewinnt im KI-Zeitalter sogar an Bedeutung. Juristinnen und Juristen, die KI als Werkzeug beherrschen, werden künftig dort gebraucht, wo diese menschlichen Qualitäten gefragt sind.
Und wie optimistisch blicken die Rechtsabteilungen in die Zukunft?
Sehr – auffallend optimistisch sogar. 100 Prozent der Befragten aus Rechtsabteilungen erwarten, dass Due-Diligence-Prüfungen innerhalb von zwei Jahren vollständig durch AI übernommen werden. Das ist eine bemerkenswerte Aussage aus einem Bereich, der für seine Vorsicht bekannt ist. Jetzt entscheidet sich, wer den Wandel aktiv gestaltet – und wer von ihm gestaltet wird.
Sophie Martinetz ist Gründerin und CEO von Future-Law, der führenden unabhängigen Plattform für Legal Tech und Digitalisierung im Rechtsbereich in Österreich. Das Legal Tech Barometer 2026 wurde gemeinsam mit LexisNexis, Dilitrust, der Vereinigung Österreichischer Unternehmensjuristen (VUJ) und der Österreichischen Notariatskammer erhoben. Weitere Informationen: www.future-law.at
Österreichs Rechtsbranche im Digitalcheck: Insights aus der Legal Tech Map
Future-Law präsentiert stolz die aktualisierte Legal Tech Map Austria 2026. Unsere aktualisierte Karte bietet Ihnen einen umfassenden Überblick über die aktuellen und neuesten österreichischen Anbieter und Einsatzbereiche von Legal Tech Tools für Ihre Rechtsabteilung und Kanzlei.

„Die Frage ist nicht mehr, ob wir Legal Tech einsetzen, sondern ob wir es schaffen, unsere Arbeitsweise nachhaltig zu verändern und echten Mehrwert daraus zu generieren.“ – Sophie Martinetz, Gründerin Future-Law.
Die neue Legal Tech Map Austria 2026 zeigt deutlich: Die österreichische Legal-Tech-Szene hat die reine Experimentierphase hinter sich gelassen. Der Markt entwickelt sich zunehmend zu einem integrierten Ökosystem, in dem Legal AI, Prozessoptimierung und digitale Infrastruktur immer stärker zusammenwachsen.
Im Mittelpunkt stehen nicht nur generative KI und neue Recherchelösungen, sondern vor allem die Frage, wie juristische Prozesse effizienter, strukturierter und strategischer gestaltet werden können. Denn der größte Mehrwert entsteht dort, wo Technologie konkrete Arbeitsabläufe verbessert – von Contract Management über Matter Management bis hin zu Access to Justice.
Die Legal Tech Map Austria 2026 zeigt:
Besonders spannend ist die Entwicklung weg von isolierten Einzellösungen hin zu vernetzten digitalen Ökosystemen. Gleichzeitig gibt es großes Potenzial in pragmatischen Lösungen, die administrative Prozesse vereinfachen und juristische Teams im Alltag entlasten.
Auch Organisationen wie Future-Law, das Legal Tech Center der WU, Legal Hackers oder das BRZ tragen wesentlich dazu bei, Innovation, Ausbildung und Vernetzung im österreichischen Markt voranzutreiben.
Die vollständige Legal Tech Map Austria 2026 macht sichtbar, wie dynamisch sich der Markt entwickelt – und warum die kommenden Jahre entscheidend für die strategische Umsetzung von Legal Tech in Kanzleien, Unternehmen und Organisationen sein werden.
Die Kategorien der Legal Tech Map Austria 2026:
Laden Sie die Legal Tech Map Austria 2026 herunter und bleiben Sie auf dem neuesten Stand über die aufregenden Entwicklungen im Bereich Legal Tech.
Sind Sie noch nicht in der Legal Tech Map Austria vertreten? Bewerben Sie sich für die nächste Ausgabe via Link.
Sie überlegen für Ihre eigene Rechtsabteilung/Kanzlei ein Legal Tech Projekt? Dann schauen Sie sich unsere weiteren Informationen und Angebote an:
Bleiben Sie am Puls der Zeit mit Future-Law und gestalten Sie die Zukunft des Rechtswesens aktiv mit!
Ein Beitrag von Sophie Martinetz, Legal Tech-Expertin und Gründerin von Future-Law, darüber wie Anwält:innen ohne Programmierkenntnisse eigene Software bauen – und worauf sie achten müssen.
Ein/e Anwält:in beschreibt in normaler Sprache, was er/sie braucht – und Sekunden später liegt funktionierender Code vor. Kein Informatikstudium, kein IT-Budget, kein Warten auf die Tech-Abteilung. Was nach Science-Fiction klingt, ist unter dem Begriff „Vibe Coding“ bereits Realität in internationalen Kanzleien. Ein Überblick über Chancen, Risiken und konkrete Anwendungsmöglichkeiten.
Was ist Vibe Coding?
Andrej Karpathy, Co-Gründer von OpenAI und ehemaliger KI-Leiter bei Tesla, prägte Anfang 2025 den Begriff „Vibe Coding“: eine Softwareentwicklungsmethode, bei der Nutzer:innen die gewünschte Funktionalität in normaler Alltagssprache beschreiben und ein Large Language Model (LLM) den entsprechenden Programmcode automatisch generiert. Der Fokus liegt auf dem gewünschten Ergebnis, nicht auf technischen Details. Das Wort „Vibe“ signalisiert bewusst eine intuitive, nicht-technische Herangehensweise.
Der Unterschied zur klassischen Programmierung ist fundamental: Traditionelle Softwareentwicklung erfordert jahrelange Ausbildung in Programmiersprachen, Algorithmen und Softwarearchitektur. Vibe Coding ermöglicht funktionale Prototypen ohne diese Vorkenntnisse – es bedarf lediglich einer klaren Formulierung dessen, was die Anwendung leisten soll.
Von No-Code-Plattformen wie Bubble oder BRYTER unterscheidet sich Vibe Coding ebenfalls: Diese bieten vorgefertigte Bausteine in grafischen Oberflächen. Vibe Coding hingegen generiert maßgeschneiderten Code von Grund auf und bietet theoretisch unbegrenzte Flexibilität – ist aber auch fehleranfälliger und erfordert mehr kritisches Urteilsvermögen.
| Tool | Besonderheit |
| Cursor | Professionelle IDE mit KI-Composer |
| GitHub Copilot | Integration in VS Code, Inline-Vervollständigung |
| Replit AI | Browser-basiert, keine Installation nötig |
| ChatGPT | Code Interpreter mit direkter Ausführung |
| Claude Artifacts | Sofortige Vorschau der generierten App |
| Case.dev | Spezialisiert für Legal Tech |
Der typische Workflow folgt einem klaren Muster. Am Anfang steht ein konkretes Problem: etwa die wiederkehrende Aufgabe, dutzende Verträge wöchentlich auf bestimmte Haftungsklauseln zu durchsuchen. Daraus wird eine natürlichsprachliche Beschreibung formuliert – zum Beispiel:
„Erstelle eine Webanwendung, die es ermöglicht, mehrere PDF-Verträge hochzuladen und automatisch nach Haftungsausschlussklauseln zu durchsuchen. Zeige die Ergebnisse in einer Tabelle mit Dokumentname, Seitenzahl und Risikolevel an. Die App soll komplett im Browser laufen, ohne Daten an externe Server zu senden.“
Das LLM generiert innerhalb von Sekunden eine vollständige HTML-Datei mit eingebettetem Design und Funktionalität – typischerweise 200 bis 500 Zeilen Code. Diese Datei wird gespeichert, im Browser geöffnet und mit Testdokumenten geprüft.

Abb. 1: So sieht ein typischer Vibe-Coding-Prompt aus – natürlichsprachliche Anweisung, sofortige Code-Generierung, iterative Verfeinerung.
Entscheidend ist die iterative Verfeinerung: „Mach die Schrift größer“, „Hochrisiko-Klauseln sollen rot markiert werden“, „Füge einen Excel-Export-Button hinzu“. Das LLM modifiziert den bestehenden Code entsprechend. Dieser Zyklus wiederholt sich, bis die Anwendung alle Anforderungen erfüllt.
Die fertige Anwendung kann als lokale HTML-Datei per Doppelklick geöffnet, per E-Mail geteilt, auf einem Intranet bereitgestellt oder über Cloud-Dienste online gehostet werden.

Abb. 2: Die fertige Klauselsuche-App – per Vibe Coding erstellt. Fünf Verträge analysiert, zwölf Klauseln gefunden, Risikobewertung inklusive.
Automatische Extraktion spezifischer Klauseln aus Verträgen – Kündigungsfristen, Gerichtsstände, Gewährleistungsausschlüsse. Vergleich mehrerer Vertragsversionen mit Highlighting der Änderungen. Quantitative Auswertung über Vertragsportfolios: „In wie vielen unserer 100 Lieferverträge findet sich Klausel X?“
Berechnung prozessualer Fristen unter automatischer Berücksichtigung von Gerichtsferien, Wochenenden und Feiertagen. Warnungen bei nahenden Fristen, Export von Kalendereinträgen und Spezialrechner für Verjährungsfristen oder Kündigungsfristen.
Strukturierte digitale Fragebögen für neue Mandant:innen, automatische Konfliktprüfung, Generierung von Checklisten für erforderliche Dokumente und erste Risikoeinschätzung basierend auf der Falltypologie.
Automatisierte Zusammenfassung von Gerichtsentscheidungen, Visualisierung von Zitatnetzwerken, Volltextsuche in lokalen Rechtsprechungssammlungen. Dazu kommen Trainingsanwendungen: Multiple-Choice-Quiz, interaktive Fallstudien mit verzweigten Entscheidungsbäumen und gamifizierte Lernumgebungen.
Visualisierung laufender Projekte oder Transaktionen nach Status, Volumen und Timeline. Automatisierte Reports für Management-Meetings und Resource-Allocation-Übersichten.
Demokratisierung. Personen ohne IT-Ausbildung können funktionale Tools erstellen. Die Eintrittsbarriere zur Softwareentwicklung sinkt drastisch. Was früher Wochen dauerte, entsteht in Stunden. Eine Idee vom Freitagabend kann am Montagmorgen als funktionierendes Tool vorliegen.
Bessere Lösungen durch Fachexpertise. Jurist:innen verstehen die spezifischen Nuancen und Workflow-Anforderungen besser als externe Entwickler:innen. Das führt zu präziseren und praxistauglicheren Lösungen.
Innovation von unten. Traditionell kommen Innovationen von IT-Abteilungen oder spezialisierten Startups. Vibe Coding ermöglicht Bottom-up-Innovation: Mitarbeitende entwickeln Tools für ihre täglichen Probleme, erfolgreiche Lösungen werden organisch geteilt und verbessert.
Wettbewerbsvorteile. Organisationen, die Vibe Coding früh adoptieren, können schneller reagieren, sich durch proprietäre Tools differenzieren, tech-affine Fachkräfte anziehen und Effizienzgewinne in kompetitive Preise übersetzen.
Zugänglichkeit von Rechtsdienstleistungen. Vibe-coded Tools können auch für den öffentlichen Zugang entwickelt werden: Selbsthilfe-Tools für häufige Rechtsfragen, vereinfachte Formulare für selbst vertretene Parteien, mehrsprachige Interfaces. Das kann zur Schließung der Justice Gap beitragen.
KI-generierter Code kann funktional sein, aber technisch suboptimal: ineffiziente Algorithmen, die bei größeren Datenmengen versagen, unstrukturierter Code ohne klare Logik, fehlende Dokumentation. LLMs generieren nicht automatisch sicheren Code und können gefährliche Schwachstellen einführen – von Cross-Site Scripting über SQL Injection bis zu unsicherer Datenspeicherung. Personen ohne Security-Expertise können diese Risiken nicht erkennen.
Hinzu kommen Halluzinationen: LLMs können plausibel klingende, aber faktisch falsche Code-Komponenten generieren – nicht-existente Bibliotheken, Logikfehler in der Fristenberechnung, semantische Fehler, bei denen der Code läuft, aber nicht das Richtige tut. Erinnert sei an den Fall von US-Anwält:innen, die von ChatGPT erfundene Gerichtsentscheidungen in einem Schriftsatz zitierten und vom Gericht sanktioniert wurden.
Sorgfaltspflichten. Im Rechtsbereich bestehen besondere Sorgfaltspflichten bei der Berufsausübung. Ein Vibe-coded Fristenrechner, der eine Rechtsmittelfrist falsch berechnet, kann zum Verlust von Rechtsansprüchen führen. Ein Dokumentenanalyse-Tool, das eine kritische Haftungsklausel übersieht, verursacht wirtschaftlichen Schaden. Die verantwortliche Person haftet persönlich – auch wenn „die KI den Fehler gemacht hat“.
Verschwiegenheitspflicht und Datenschutz. Die größte rechtliche Herausforderung: Vertrauliche Daten, die in öffentliche KI-Chatbots eingegeben werden, können zum Training des KI-Modells verwendet werden, liegen auf Servern in den USA und sind für KI-Provider theoretisch zugänglich. Das kann als Verletzung des Berufsgeheimnisses gewertet werden. Dazu kommen DSGVO-Anforderungen: Rechtsgrundlage, Transparenz gegenüber Mandant:innen, Auftragsverarbeitungsverträge mit KI-Providern und Regelungen zum Drittlandtransfer.
Urheberrecht. Die Rechtslage zu KI-generiertem Code ist ungeklärt: Enthält der generierte Code urheberrechtlich geschützte Snippets? Wem gehört das Copyright? Werden Open-Source-Lizenzen verletzt? Die laufenden Klagen rund um GitHub Copilot in den USA zeigen, dass diese Fragen erst am Anfang ihrer juristischen Aufarbeitung stehen.
Psychologische Forschung zeigt, dass Menschen dazu neigen, Computerausgaben übermäßig zu vertrauen – sogenannter Automation Bias. Bei Vibe Coding besteht das Risiko, dass KI-generierter Code nicht ausreichend getestet, Tool-Outputs für definitiv korrekt gehalten und Verantwortung auf die KI abgeschoben wird.
Organisatorisch stellen sich Governance-Fragen: Welche Tools dürfen entwickelt werden? Wer trägt Verantwortung für Testing? Wie wird Dokumentation sichergestellt? Und wenn Einzelpersonen undokumentierte Tools entwickeln und die Organisation verlassen, geht kritisches Know-how verloren.
Vibe Coding eignet sich gut für einfache bis mittelkomplexe Web-Anwendungen, client-seitige Tools im Browser, Prototypen, Automatisierung repetitiver Aufgaben sowie Datenvisualisierung. An Grenzen stößt es bei hochkomplexen Multi-User-Systemen mit Datenbanken, Echtzeit-Kollaboration, Anwendungen mit hohen Sicherheitsanforderungen, Integration in komplexe bestehende IT-Infrastrukturen und performance-kritischen Anwendungen mit großen Datenmengen.
Die technologische Entwicklung beschleunigt sich weiter. Multimodale Modelle werden Bilder, Audio und Video verarbeiten – automatische Transkription von Vernehmungen, Analyse gescannter Dokumente ohne OCR. Agentic AI wird komplexe Aufgaben autonom ausführen: Ein Legal Research Agent durchsucht selbstständig Datenbanken und erstellt annotierte Bibliographien. Spezialisierte Legal LLMs mit integrierten Rechtsprechungsdatenbanken werden höhere Genauigkeit bieten.
Für Jurist:innen bedeutet das: Fachliches Wissen bleibt der Kern, ergänzt durch KI-Literacy, Prompt Engineering und grundlegende Tech-Kompetenz. Kritisches Denken wird wichtiger denn je. Neue Rollen entstehen – von Tech-Spezialist:innen mit Fachexpertise bis zu AI Supervisors und Compliance Officers für KI-Systeme.
Die Zukunft wird hybrid sein: Fachliches Urteilsvermögen und ethische Integrität kombiniert mit intelligenten, KI-gestützten Werkzeugen. Wer diese Kombination beherrscht, wird den Rechtsmarkt der nächsten Dekade prägen.
| 10 TIPPS FÜR DEN EINSTIEG INS VIBE CODING | |
| 1. | Enterprise-KI-Services nutzen: Bei vertraulichen Daten ausschließlich Enterprise-Versionen mit Zero Data Retention verwenden (z. B. ChatGPT Enterprise, Claude for Work). Kostenlose Versionen sind für Mandant:innendaten tabu. |
| 2. | Klein anfangen: Mit einfachen internen Tools starten – Rechner, Formulare, Checklisten. Keine Datenbanksysteme oder komplexe Integrationen zum Einstieg. |
| 3. | Synthetische Testdaten verwenden: Beim Prompten niemals echte Mandant:innendaten eingeben. Stattdessen anonymisierte Musterverträge und generische Namen verwenden. |
| 4. | Gründlich testen: Jede Version sofort mit realistischen Szenarien testen, inklusive Edge Cases wie Sonderzeichen, leere Felder und sehr lange Eingaben. Kollegiales Testing ist Pflicht. |
| 5. | Code Review einholen: Vor dem produktiven Einsatz den generierten Code von einer technisch versierten Person prüfen lassen. Legal-Tech-Communities bieten hierfür Unterstützung. |
| 6. | Versionierung nutzen: Alle Code-Versionen speichern (z. B. auf GitHub). Funktionierende Versionen als Backup sichern und Änderungen dokumentieren. |
| 7. | Client-seitig arbeiten: Bevorzugt Anwendungen entwickeln, die komplett im Browser laufen, ohne Daten an externe Server zu senden. Das reduziert Datenschutzrisiken erheblich. |
| 8. | Dokumentation pflegen: Jeden entwickelten Prototyp dokumentieren: Was macht das Tool? Welche Einschränkungen gibt es? Wer ist verantwortlich? Das sichert Know-how für die Organisation. |
| 9. | Versicherung informieren: Berufshaftpflichtversicherer proaktiv über den Einsatz KI-generierter Tools informieren und klären, welche Risiken abgedeckt sind. |
| 10. | Menschliche Verantwortung behalten: KI ist Werkzeug, nicht Entscheiderin. Alle Outputs müssen menschlich verifiziert werden. Bei Unsicherheit: konservativ handeln und im Zweifel manuell prüfen. |
Über Sophie Martinetz:
Sophie Martinetz ist Gründerin von Future-Law und eine der führenden Stimmen für Legal Tech und Innovation im deutschsprachigen Raum. Sie berät Kanzleien und Rechtsabteilungen bei der Digitalisierung und ist überzeugt, dass technologische Kompetenz zur Kernqualifikation moderner Jurist:innen gehört.

© AngelStone Media GmbH, 2022. All Rights Reserved.