Was passiert, wenn der KI-Agent nicht nur Code schreibt, sondern auch prüft, ob er funktioniert? QF-Test, das professionelle Tool für UI-Testautomatisierung von Quality First Software (QFS), gibt eine konkrete Antwort — mit einem gestaffelten Ansatz für agentisches Testen, der heute schon einsetzbar ist.

Von der Aufnahme zur Anweisung: Wie sich die Testautomatisierung grundlegend ändert

Wer Software entwickelt, kennt das Problem: Jedes Update, jede neue Funktion und jede Codeänderung muss verifiziert werden. Hat alles noch wie vorher funktioniert? Zeigt die Anwendung das, was sie zeigen soll? Die klassische Testautomatisierung hat diesen Prozess bereits erheblich vereinfacht: Ein Tool übernimmt das Klicken, prüft die Ergebnisse und läuft immer wieder automatisch durch – zuverlässig, wiederholbar und schnell. QF-Test wird seit Jahren genau dafür eingesetzt, bei Web- und Desktop-Anwendungen, Java-GUIs, mobilen Apps und PDF-Dokumenten.

Doch jetzt verändert sich das Spiel erneut. Denn dieselben Entwicklerteams, die heute mit Claude Code, Cursor oder GitHub Copilot Code schreiben lassen, wollen denselben Agenten auch fürs Testen einsetzen, ohne das Test-Tool überhaupt öffnen zu müssen. „Unsere Kunden interessieren sich wahnsinnig dafür, welchen Teil des Testprozesses sie an KI abgeben können”, erklärt Max Melzer, Softwareentwickler und Trainer bei QFS. Das ist kein Zufall: Wer einmal erlebt hat, wie ein KI-Agent eigenständig Code refactort, fragt sich zwangsläufig, warum er denselben Agenten nicht auch testen lassen kann.

Drei Ebenen des agentischen Testens mit QF-Test

QF-Test verfolgt einen gestaffelten Ansatz – von ersten KI-gestützten Prüffunktionen bis hin zur vollständigen Integration in agentische Entwicklungs-Pipelines. Alle drei Ebenen bauen aufeinander auf und sind Teil der laufenden Produktentwicklung.

Ebene 1: KI als semantischer Prüfer – heute verfügbar

Die erste Form des agentischen Testens in QF-Test ist bereits produktiv einsetzbar: KI-gestützte Prüfungen für Ergebnisse, die sich nicht mit simplen Ja/Nein-Checks erfassen lassen.

Ein Paradebeispiel hierfür ist das Testen integrierter Chatbots. Deren Antworten sind niemals wortwörtlich vorhersagbar – und trotzdem soll der Test prüfen, ob die Antwort inhaltlich korrekt ist. QF-Test übergibt das Ergebnis an ein Sprachmodell zur Bewertung. Ist diese Antwort plausibel? Entspricht sie dem erwarteten Rahmen? Das Modell trifft eine Entscheidung und QF-Test übernimmt das Ergebnis in den Testlauf. Semantisches Testen statt starrer String-Vergleiche.

Ebene 2: KI generiert Testsuites – ab QF-Test 11.

Der nächste Schritt ist die automatische Generierung ganzer Testsuites und damit deutlich ambitionierter. Anstatt Tests manuell aufzunehmen oder zu schreiben, übernimmt die KI den ersten Entwurf.

Auf Basis bestehender Testpläne oder Jira-Tickets importiert QF-Test strukturierte Anforderungen und erzeugt daraus eine Testsuite im richtigen QF-Test-Format. Daneben kann QF-Test die Anwendung eigenständig erkunden. Die KI navigiert durch Menüs und Dialoge, identifiziert testbare Bereiche und schlägt einen Testplan vor, und das alles ohne menschliche Anleitung.

„Es ist nie so, dass man das einfach nehmen kann und sagen kann: Jetzt sind wir fertig“, erklärt Max Melzer. „Aber es nimmt einem viel Arbeit ab – vor allem beim Start.“ Ein guter Erstentwurf, den erfahrene Tester weiterentwickeln. Das ist der realistische Mehrwert agentischer Testgenerierung heute.

Ebene 3: QF-Test als MCP-Server – der eigentliche Durchbruch!

Das ist der Kern des agentischen Ansatzes: Mit QF-Test 11 erhält das Tool einen integrierten MCP-Server. MCP steht für „Model Context Protocol” – ein offener Standard, über den KI-Agenten standardisiert auf externe Tools zugreifen können.

Das bedeutet in der Praxis: Wer Claude Code oder einen anderen KI-Coding-Agenten in seiner Entwicklungsumgebung einsetzt, kann diesem Agenten die Fähigkeiten von QF-Test bereitstellen. Der Agent kann dann – ohne dass QF-Test manuell geöffnet werden muss – Anwendungen starten, Tests ausführen, Ergebnisse prüfen und Fehler zurückmelden. QF-Test wird Teil des agentischen Workflows und ist ein Werkzeug, das der KI-Agent wie jedes andere Tool aufruft.

Eine experimentelle Vorabversion dieses MCP-Servers ist bereits als Public Preview verfügbar. Erste Kunden integrieren ihn bereits in ihre CI/CD-Pipelines und Entwicklungsumgebungen.

Der Vorteil von QF-Test beim agentenbasierten Testen: Breite schlägt Nische.

Was QF-Test in diesem Bereich auszeichnet, ist nicht allein die MCP-Fähigkeit – die bieten inzwischen auch spezialisierte Tools wie Playwright. Der entscheidende Unterschied liegt in der Plattformbreite: Anders als viele Wettbewerber, die sich auf Web-Anwendungen spezialisiert haben, testet QF-Test native Windows-Anwendungen, Java-GUIs, Android- und iOS-Apps sowie PDF-Dokumente mit demselben Ansatz. Wer also in seiner Entwicklungsumgebung eine heterogene Anwendungslandschaft betreibt – und das ist in Unternehmen eher die Regel als die Ausnahme – erhält mit QF-Test einen einheitlichen Test-Agenten für alle Bereiche.

Stand heute: Was ist verfügbar, was kommt noch?

QF-Test hat sich bewusst dafür entschieden, die KI-Features bereits vor der offiziellen Veröffentlichung zu kommunizieren. Das Spezialwebinar zu KI-Checks zeigt, was heute bereits möglich ist. Die Generierungsfunktionen und der integrierte MCP-Server werden mit QF-Test 11 eingeführt, das für das Jahr 2026 geplant ist.

Wer das früher ausprobieren möchte, kann sich direkt an QF-Test wenden. Vorabversionen werden gezielt an interessierte Kunden und Partner weitergegeben, um echtes Feedback aus realen Projekten zu sammeln.

FAQ: Agentisches Testen mit QF-Test

Was versteht man unter agentic testing / agentischem Testen?

Beim agentischen Testen (engl. agentic testing) handelt es sich um einen Ansatz in der Softwarequalitätssicherung, bei dem KI-Agenten Testaufgaben selbstständig planen, ausführen und auswerten. Dabei schließen sich Autonomie und Reproduzierbarkeit nicht aus: QF-Test verfolgt einen Hybrid-Ansatz – fest definierte Testbausteine bilden das zuverlässige Rückgrat, während der KI-Agent flexibel entscheidet, welche Bausteine er in welcher Reihenfolge einsetzt. So bleibt der Testlauf reproduzierbar und nachvollziehbar, ohne dass jeder Schritt vorab starr festgelegt sein muss. Mit QF-Test ist auch vollständig autonomes Testen möglich, für produktive Umgebungen empfiehlt QFS jedoch den strukturierten Hybrid-Ansatz.

Wie unterscheidet sich agentisches Testen von klassischer Testautomatisierung?

Klassische Testautomatisierung arbeitet mit festen Skripten: Schritt A, dann Schritt B, dann Prüfung C. Ändert sich die Oberfläche der Anwendung, bricht das Skript. QF-Test verfolgt hier einen Hybrid-Ansatz: Der KI-Agent arbeitet mit fest definierten Testbausteinen, entscheidet aber selbst, welche er wie einsetzt — das verbindet die Flexibilität agentischer Systeme mit der Reproduzierbarkeit, die zuverlässige Testautomatisierung erfordert.

Was ist ein MCP-Server im Kontext von Testautomatisierung?

MCP steht für Model Context Protocol, einen offenen Standard für die Kommunikation zwischen KI-Agenten und externen Tools. Ein MCP-Server stellt die Fähigkeiten eines Tools (z.B. QF-Test) für KI-Agenten wie Claude Code oder Cursor bereit. Der Agent kann das Tool dann aufrufen, als wäre es eine eigene Funktion — ohne dass ein Mensch die Testumgebung manuell bedient.

Kann QF-Test KI-Agenten wie Claude Code oder GitHub Copilot integrieren?

Ja. Mit dem MCP-Server von QF-Test — der als Vorabversion bereits verfügbar ist und mit QF-Test 11 vollständig integriert kommt — können KI-Agenten wie Claude Code direkt auf QF-Test zugreifen: Tests starten, Ergebnisse abrufen, Anwendungen steuern.

Für welche Plattformen unterstützt QF-Test agentisches Testen?

QF-Test unterstützt agentisches Testen für Webanwendungen, native Windows-Anwendungen, Java-GUIs (Swing, SWT, JavaFX, Eclipse RCP), Android- und iOS-Apps sowie PDF-Dokumente — damit deutlich breiter als reine Web-Testing-Tools wie Playwright.

Wann erscheint QF-Test 11 mit den vollen KI-Funktionen?

QF-Test 11 mit integrierten KI-Features (Testsuite-Generierung, produktionsreifer MCP-Server) ist für 2026 geplant. Eine experimentelle Vorabversion des MCP-Servers steht bereits als Public Preview zur Verfügung.

Ersetzt agentisches Testen menschliche Tester?

Nein. KI-generierte Testsuites liefern einen strukturierten Erstentwurf, der von erfahrenen Testern weiterentwickelt und validiert werden muss. Der Mehrwert liegt in der Reduktion von Aufwand bei der Testerstellung und -pflege — nicht in der vollständigen Ablösung menschlicher Expertise.