Zurück zum Blog
ai
architecture
mcp
harness
agent
mcplato

Harness and Agent: Die mehrschichtige Architektur von KI-Systemen

Erforschung der Beziehung zwischen Tool-Layer und Agent-Layer und wie MCPlato eine MCP-native Architektur implementiert

Veröffentlicht am 2026-03-19

Harness and Agent: Die mehrschichtige Architektur von KI-Systemen

Vom MCP-Protokoll zu MCPlatos Tool-Layer- und Agent-Layer-Design


1. Einleitung: Das architektonische Erwachen von KI-Systemen

Von der Modellherrschaft zur Architekturherrschaft

In den letzten drei Jahren war die KI-Industrie besessen von einer einzigen Metrik: der Modellfähigkeit. Benchmark-Ergebnisse, Parameterzahlen und Kontextfenstergrößen dominierten die technischen Diskussionen. Die implizite Annahme war klar – je besser das Modell, desto besser das System.

Aber etwas veränderte sich im Jahr 2024.

Als Large Language Models (LLMs) die Schwelle von "gut genug" für die meisten praktischen Aufgaben überschritten, entdeckten Praktiker eine nüchterne Wahrheit: Der Engpass in KI-Systemen ist selten das Modell selbst. Ein GPT-4-Klasse-Modell mit schlechter Tool-Integration schneidet schlechter ab als ein GPT-3.5-Klasse-Modell mit einem gut gestalteten Tool-Layer. Der Fokus des Wettbewerbs hat sich von roher Intelligenz zu architektonischer Eleganz verschoben.

Warum die Harness-Schicht wichtiger ist als das Modell

Betrachten Sie dieses Szenario: Sie haben Zugriff auf das leistungsfähigste KI-Modell der Welt. Es kann über komplexe Probleme nachdenken, ausgefeilten Code schreiben und nuancierte Anweisungen verstehen. Aber wenn es versucht, mit der realen Welt zu interagieren – Dateien zu lesen, APIs aufzurufen, Websites zu durchsuchen – tut es dies durch schlecht gestaltete, inkonsistent formatierte und unsicher implementierte Tools.

Das Ergebnis? Frustration, Fehler und letztendlich das Versagen, Wert zu liefern.

Die Harness-Schicht (auch als Tool-Layer bekannt) repräsentiert alles, was einer KI ermöglicht, mit der externen Welt zu interagieren: Tool-Definitionen, Ausführungsumgebungen, Sicherheitsrichtlinien, Fehlerbehandlung, Ergebnisformatierung und Speicherverwaltung. Es ist der Unterschied zwischen einem brillanten Geist, der in einem Raum gefangen ist, und einem, der ausgestattet ist, auf die Welt zu handeln.

Die zentrale Herausforderung: Sichere und zuverlässige Tool-Nutzung

Die grundlegende Frage, der sich moderne KI-Architektur stellen muss, ist täuschend einfach: Wie ermöglichen wir Agenten die sichere, zuverlässige und effektive Nutzung von Tools?

Diese Frage umfasst:

  • Sicherheit: Wie verhindern wir unbefugten Dateizugriff, Datenexfiltration oder bösartige Code-Ausführung?
  • Zuverlässigkeit: Wie stellen wir sicher, dass Tools konsistent funktionieren, Fehler elegant behandeln und sich von Ausfällen erholen?
  • Komponierbarkeit: Wie ermöglichen wir Agenten die Kombination mehrerer Tools zur Bewältigung komplexer Aufgaben?
  • Auffindbarkeit: Woher wissen Agenten, welche Tools verfügbar sind und wann sie sie verwenden sollen?

Die Beantwortung dieser Fragen erfordert einen bewussten architektonischen Ansatz – einen, der Belange trennt, klare Schnittstellen etabliert und Robustheit gegenüber Bequemlichkeit priorisiert.


2. Mehrschichtige Architektur: Das theoretische Modell von Harness und Agent

Um diese Herausforderungen anzugehen, schlagen wir eine klare Trennung der Belange zwischen zwei verschiedenen architektonischen Schichten vor: der Harness-Schicht und der Agent-Schicht. Diese Trennung ist nicht nur organisatorisch – sie spiegelt grundlegend verschiedene Verantwortlichkeiten, Fehlermodi und Optimierungsziele wider.

2.1 Die Harness-Schicht (Tool-Layer)

Die Harness-Schicht dient als Schnittstelle zwischen KI-Reasoning und der externen Welt. Ihre Verantwortlichkeiten sind konkret, operativ und vorrangig mit Ausführung statt Entscheidungsfindung befasst.

Kernverantwortlichkeiten

VerantwortlichkeitBeschreibung
Tool-KapselungEinbettung externer Fähigkeiten (Dateisysteme, APIs, Datenbanken, Browser) in wohldefinierte, aufrufbare Schnittstellen
AusführungsorchestrierungVerwaltung des Lebenszyklus von Tool-Aufrufen: Validierung, Ausführung, Timeout-Behandlung und Bereinigung
Validierung & SchutzDurchsetzung von Sicherheitsrichtlinien, Sandboxing nicht vertrauenswürdiger Operationen und Verhinderung unbefugten Zugriffs
SpeicherverwaltungBehandlung von Zustandspersistenz, Session-Speicherung und Kontextteilung zwischen Tool-Aufrufen
ErgebnisformatierungKonvertierung von rohen Tool-Ausgaben in strukturierte Formate, die für den Modellverbrauch geeignet sind

Wichtige Erkenntnis: Die Harness behandelt "Alles andere"

Das bestimmende Merkmal der Harness-Schicht ist, dass sie alles außerhalb des reinen Modell-Reasonings behandelt. Wenn ein Modell einen Plan generiert, um "die Verkaufsdaten-CSV zu analysieren und einen Zusammenfassungsbericht zu generieren", tut die Harness-Schicht folgendes:

  • Lokalisiert und liest die CSV-Datei
  • Validiert Dateiberechtigungen und Format
  • Führt die Analyse aus (möglicherweise Code-Aufruf)
  • Behandelt alle Fehler oder Randfälle
  • Formatiert Ergebnisse für den Modellverbrauch
  • Verwaltet temporäre Ressourcen und Bereinigung

Das Modell konzentriert sich darauf, was getan werden sollte; die Harness stellt sicher, dass es sicher und zuverlässig getan werden kann.

2.2 Die Agent-Schicht (Proxy-Layer)

Wenn die Harness-Schicht um Ausführung geht, geht es bei der Agent-Schicht um Entscheidungsfindung. Sie operiert auf einem höheren Abstraktionsniveau, konzentriert sich auf Ziele, Pläne und Strategien statt auf spezifische Tool-Aufrufe.

Kernverantwortlichkeiten

VerantwortlichkeitBeschreibung
AufgabenplanungAufschlüsselung hochrangiger Ziele in handhabbare Teilaufgaben und Bestimmung der Ausführungsreihenfolge
Tool-AuswahlAuswahl, welche Tools (falls vorhanden) für eine bestimmte Teilaufgabe angemessen sind
Reasoning & EntscheidungsfindungBewertung von Zwischenergebnissen, Anpassung von Plänen basierend auf Feedback und Umgang mit Mehrdeutigkeit
KontextmanagementAufrechterhaltung relevanter Konversationshistorie, Filterung von Rauschen und Priorisierung wichtiger Informationen
BenutzerinteraktionBestimmung, wann um Klärung gebeten, Zwischenergebnisse präsentiert oder Genehmigung angefordert werden soll

Wichtige Erkenntnis: Der Agent operiert durch Abstraktionen

Die Agent-Schicht manipuliert nicht direkt Dateien oder führt Code aus. Stattdessen operiert sie durch Abstraktionen von Tools – Verständnis ihrer Fähigkeiten, Einschränkungen und angemessenen Anwendungsfälle. Wenn ein Agent beschließt, "nach relevanter Dokumentation zu suchen", delegiert er die tatsächliche Suchoperation an die Harness-Schicht und vertraut darauf, dass die Harness die Spezifika der Abfrageformulierung, API-Aufruf und Ergebnisabfrage behandeln wird.

2.3 Interaktionsmodell: Ein Textflussdiagramm

Die Beziehung zwischen Agent und Harness folgt einem Anfrage-Antwort-Muster mit klaren Grenzen:

┌─────────────────────────────────────────────────────────────────────┐
│                         INTERAKTIONSFLUSS                           │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│  ┌──────────────┐     Tool-Erkennung    ┌──────────────────────┐   │
│  │              │ ─────────────────────> │                      │   │
│  │    AGENT     │                        │       HARNESS        │   │
│  │    LAYER     │                        │       LAYER          │   │
│  │              │ <───────────────────── │                      │   │
│  │              │     Tool-Manifest      │                      │   │
│  └──────┬───────┘                        └──────────────────────┘   │
│         │                                                           │
│         │  1. Agent analysiert Aufgabe und wählt passendes Tool    │
│         │  2. Agent formuliert Aufrufanfrage mit Parametern        │
│         │                                                           │
│         ▼                                                           │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    AUFRUFANFRAGE                             │    │
│  │  {                                                         │    │
│  │    "tool": "file_read",                                     │    │
│  │    "params": { "path": "/data/sales.csv" },                  │    │
│  │    "context": { "session_id": "abc123" }                     │    │
│  │  }                                                         │    │
│  └─────────────────────────────────────────────────────────────┘    │
│         │                                                           │
│         ▼                                                           │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    HARNESS-VERARBEITUNG                      │    │
│  │                                                              │    │
│  │  ┌──────────────┐   ┌──────────────┐   ┌──────────────┐     │    │
│  │  │   Validieren │ ─>│   Ausführen  │ ─>│   Formatieren│     │    │
│  │  │   Anfrage    │   │    Tool      │   │   Ergebnis   │     │    │
│  │  └──────────────┘   └──────────────┘   └──────────────┘     │    │
│  │                                                              │    │
│  └─────────────────────────────────────────────────────────────┘    │
│         │                                                           │
│         ▼                                                           │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    ANTWORTNACHRICHT                          │    │
│  │  {                                                         │    │
│  │    "status": "success",                                     │    │
│  │    "result": { "content": "...", "metadata": {...} },        │    │
│  │    "elapsed_ms": 150                                       │    │
│  │  }                                                         │    │
│  └─────────────────────────────────────────────────────────────┘    │
│         │                                                           │
│         ▼                                                           │
│  ┌──────────────┐                                                   │
│  │    AGENT     │  ← Agent integriert Ergebnis, setzt Reasoning fort│
│  └──────────────┘                                                   │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘

2.4 Die Vorteile der Trennung

Diese mehrschichtige Architektur bietet mehrere kritische Vorteile:

1. Unabhängige Evolution Die Harness-Schicht kann mit neuen Tools erweitert werden, ohne die Agent-Schicht zu modifizieren. Wenn eine neue API verfügbar wird, muss sich nur die Tool-Implementierung ändern – der Agent sieht einfach eine neue Fähigkeit im Tool-Manifest.

2. Reproduzierbarkeit und Testbarkeit Harness-Operationen sind deterministisch und testbar. Sie können überprüfen, dass eine Dateileseoperation korrekt funktioniert, unabhängig von der Entscheidung des Agenten, diese Datei zu lesen. Diese Trennung ermöglicht Unit-Tests auf beiden Schichten.

3. Sicherheitsgrenzen Sicherheitsrichtlinien werden auf der Harness-Schicht durchgesetzt und schaffen eine harte Grenze, die Agenten nicht umgehen können. Selbst wenn ein Agent kompromittiert oder irregeführt wird, operiert er innerhalb der Einschränkungen der Harness-Sandbox.

4. Multi-Agent-Support Mehrere Agenten können dieselbe Harness-Schicht teilen und profitieren jeweils von konsistentem Tool-Verhalten und Sicherheitsrichtlinien. Dies ermöglicht kollaborative Szenarien, in denen verschiedene Agenten verschiedene Aspekte einer komplexen Aufgabe bearbeiten.


3. MCP-Protokoll: Die USB-C-Schnittstelle für KI

Im November 2024 veröffentlichte Anthropic das Model Context Protocol (MCP), einen offenen Standard, der verspricht, für die KI-Tool-Integration zu tun, was USB-C für die Gerätekonnektivität getan hat: eine einzelne, universelle Schnittstelle bereitzustellen, die Fragmentierung eliminiert und echte Interoperabilität ermöglicht.

3.1 Das Problem, das MCP löst

Vor MCP erforderte die Integration einer neuen Datenquelle oder eines neuen Tools in eine KI-Anwendung typischerweise den Bau eines benutzerdefinierten Konnektors. Möchten Sie, dass Ihre KI eine Postgres-Datenbank abfragt? Schreiben Sie einen Konnektor. Möchten Sie, dass sie auf das CRM Ihres Unternehmens zugreift? Schreiben Sie einen weiteren Konnektor. Jede Integration war maßgeschneidert, brüchig und an spezifische KI-Plattformen gebunden.

MCP eliminiert diese Integrationskosten, indem es ein Standardprotokoll definiert, wie KI-Anwendungen mit externen Systemen verbunden werden. Anstelle von N×M-Integrationen (N Tools × M KI-Plattformen) ermöglicht MCP N+M-Integrationen (jedes Tool implementiert MCP einmal, jede Plattform unterstützt MCP einmal).

3.2 MCP-Architektur: Drei Kernrollen

MCP definiert drei architektonische Rollen, die verschiedenen Verantwortlichkeiten im Tool-Ökosystem entsprechen:

┌─────────────────────────────────────────────────────────────────────┐
│                      MCP-ARCHITEKTUR                                │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│   ┌──────────────┐         ┌──────────────┐         ┌────────────┐  │
│   │              │         │              │         │            │  │
│   │    HOST      │◄───────►│    CLIENT    │◄───────►│   SERVER   │  │
│   │              │         │              │         │            │  │
│   │  KI-App      │         │ Verbindungs- │         │ Tool/Daten │  │
│   │  (MCPlato,   │         │ Management   │         │ Provider   │  │
│   │  Claude,     │         │              │         │            │  │
│   │  Cursor)     │         │ • Protokoll- │         │ • Tools    │  │
│   │              │         │   Handhabung │         │ • Resources│  │
│   │ Orchestriert │         │ • Fähigkeits-│         │ • Prompts  │  │
│   │ Interaktion  │         │   Entdeckung │         │            │  │
│   │              │         │ • Zustands-  │         │            │  │
│   │              │         │   verwaltung │         │            │  │
│   └──────────────┘         └──────────────┘         └────────────┘  │
│                                                                     │
│   Verantwortlichkeiten:                                               │
│   • HOST: UX, Orchestrierung, Lebenszyklusmanagement                 │
│   • CLIENT: Protokollkonformität, Fähigkeitsverhandlung              │
│   • SERVER: Tool-Implementierung, Datenzugriff, Ausführung           │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘
RolleBeschreibungBeispiel
HostDie KI-Anwendung, mit der Benutzer interagieren; verwaltet Verbindungen und orchestriert InteraktionenMCPlato, Claude Desktop, Cursor
ClientVerwaltet die Verbindung zu einem bestimmten MCP-Server; behandelt Protokollkonformität und FähigkeitserkennungIntegrierter MCP-Client innerhalb des Hosts
ServerBietet spezifische Fähigkeiten (Tools, Resources, Prompts) über das MCP-ProtokollDateisystem-Server, GitHub-Server, Postgres-Server

3.3 MCP-Kernprimitive

MCP definiert drei fundamentale Primitive, die Server bereitstellen können:

Tools (Ausführbare Funktionen) Tools sind Funktionen, die Aktionen ausführen – Dateien lesen, Datenbanken abfragen, Nachrichten senden oder Code ausführen. Sie akzeptieren strukturierte Parameter und geben strukturierte Ergebnisse zurück. Tools werden explizit von der KI basierend auf Kontext und Bedarf aufgerufen.

{
  "name": "file_read",
  "description": "Inhalt einer Datei lesen",
  "inputSchema": {
    "type": "object",
    "properties": {
      "path": { "type": "string", "description": "Dateipfad" }
    },
    "required": ["path"]
  }
}

Resources (Datenquellen) Resources repräsentieren Daten, auf die die KI referenzieren kann – Dateiinhalte, Datenbankschemata, API-Dokumentation oder Konfigurationsdateien. Im Gegensatz zu Tools sind Resources typischerweise schreibgeschützt und dienen als Kontext statt als Aktionen.

Prompts (Interaktionsvorlagen) Prompts bieten vordefinierte Interaktionsmuster oder Vorlagen, die das Verhalten der KI für spezifische Aufgaben leiten. Sie können Systemanweisungen, Beispielinteraktionen oder strukturierte Anfrageformate enthalten.

3.4 Warum MCP für die Architektur wichtig ist

MCP ist mehr als nur ein Komfort – es repräsentiert einen grundlegenden Wandel in der Art und Weise, wie wir über KI-Tool-Integration denken:

Standardisierung ermöglicht Wettbewerb Wenn Tools einen gemeinsamen Standard implementieren, verlagert sich der Wettbewerb von "wer hat die meisten Integrationen" zu "wer bietet die beste Erfahrung mit diesen Integrationen". Dies kommt den Benutzern zugute und treibt Innovation sowohl in der Tool-Qualität als auch in den KI-Fähigkeiten voran.

Entkopplung ermöglicht Spezialisierung Mit MCP können sich Tool-Entwickler darauf konzentrieren, großartige Tools zu bauen, ohne sich Sorgen über KI-Plattform-Kompatibilität zu machen. KI-Plattformen können sich auf Orchestrierung und Reasoning konzentrieren, ohne unzählige benutzerdefinierte Konnektoren zu warten.

Komponierbarkeit ermöglicht Ökosysteme MCP schafft Netzwerkeffekte: Jeder neue MCP-Server profitiert allen MCP-kompatiblen Hosts, und jeder neue MCP-Host schafft Wert für alle bestehenden Server. Dieser Schwungrad-Effekt beschleunigt das Ökosystemwachstum.


4. MCPlatos architektonische Praxis

MCPlato repräsentiert eine konkrete Implementierung der Harness-Agent-mehrschichtigen Architektur, gebaut mit MCP als grundlegendem Prinzip statt als nachträglicher Gedanke. Sein Design spiegelt Lektionen wider, die sowohl aus akademischer Forschung als auch aus praktischer Bereitstellung von KI-Systemen gewonnen wurden.

4.1 Drei-Schichten-Architekturmodell

MCPlatos Architektur ist um drei verschiedene Schichten organisiert, jede mit klaren Verantwortlichkeiten und Grenzen:

┌─────────────────────────────────────────────────────────────────────┐
│                    MCPLATO-ARCHITEKTUR                              │
├─────────────────────────────────────────────────────────────────────┤
│                                                                     │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    WORKSPACE-LAYER                           │    │
│  │                                                              │    │
│  │  • Workspace-Management und Isolation                        │    │
│  │  • Multi-Verzeichnis-Mounting                                │    │
│  │  • Cross-Session-Speicher (Diary)                            │    │
│  │  • Umgebungskonfiguration                                    │    │
│  │                                                              │    │
│  └─────────────────────────────────────────────────────────────┘    │
│                              ▲                                      │
│                              │                                      │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    SESSION-LAYER                             │    │
│  │                                                              │    │
│  │  • Kontexterhaltung und Nachrichtenhistorie                  │    │
│  │  • Nachrichtenrouting und -verteilung                        │    │
│  │  • Session-Level-Zustandsverwaltung                          │    │
│  │  • Multi-Session-Koordination                                │    │
│  │                                                              │    │
│  └─────────────────────────────────────────────────────────────┘    │
│                              ▲                                      │
│                              │                                      │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                     AGENT-LAYER                              │    │
│  │                                                              │    │
│  │  • ClawMode-autonome Ausführung                              │    │
│  │  • Aufgabenplanung und Dekomposition                         │    │
│  │  • Tool-Auswahl und -aufruf                                  │    │
│  │  • Multi-Step-Reasoning und -Wiederherstellung               │    │
│  │                                                              │    │
│  └─────────────────────────────────────────────────────────────┘    │
│                                                                     │
│  ┌─────────────────────────────────────────────────────────────┐    │
│  │                    HARNESS-LAYER                             │    │
│  │                                                              │    │
│  │  ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌────────┐ │    │
│  │  │   @Tool     │ │ Infographic │ │   Browser   │ │  PDF   │ │    │
│  │  │   Suite     │ │   Creator   │ │ Automation  │ │ Tools  │ │    │
│  │  └─────────────┘ └─────────────┘ └─────────────┘ └────────┘ │    │
│  │                                                              │    │
│  │  ┌─────────────┐ ┌─────────────┐ ┌────────────────────────┐ │    │
│  │  │    MCP      │ │  Image Gen  │ │   Document Analysis    │ │    │
│  │  │   Host      │ │   & Edit    │ │   (OCR/Understanding)  │ │    │
│  │  └─────────────┘ └─────────────┘ └────────────────────────┘ │    │
│  │                                                              │    │
│  └─────────────────────────────────────────────────────────────┘    │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘

Workspace-Layer

Die Workspace-Schicht bietet organisatorische Grenzen und persistenten Speicher, der einzelne Sessions überspannt. Es ist die höchste Abstraktionsebene in MCPlatos Hierarchie.

Schlüsselfähigkeiten:

  • Isolation: Jeder Workspace unterhält separate Konfiguration, gemountete Verzeichnisse und Umgebungsvariablen
  • Multi-Verzeichnis-Mounting: Workspaces können mehrere Projektverzeichnisse umfassen und ermöglichen so projektübergreifende Workflows
  • Persistenter Speicher: Das Diary-System unterhält Langzeitgedächtnis über Sessions hinweg und bewahrt Erkenntnisse und Entscheidungen
  • Umgebungsmanagement: Workspace-Level-Konfiguration für MCP-Server, benutzerdefinierte Tools und Verhaltenseinstellungen

Session-Layer

Die Session-Schicht verwaltet den unmittelbaren Interaktionskontext – die Nachrichten, den Zustand und die flüchtigen Daten, die mit einer bestimmten Konversation oder Aufgabe verbunden sind.

Schlüsselfähigkeiten:

  • Kontexterhaltung: Nachrichtenhistorie, Tool-Ergebnisse und Zwischenzustand innerhalb einer Session
  • Nachrichtenrouting: Verteilung von Benutzereingaben an passende Handler und Zurückrouting von Ausgaben
  • Parallele Ausführung: Unterstützung für mehrere gleichzeitige Sessions innerhalb eines einzelnen Workspaces
  • Zustandspersistenz: Fähigkeit, Session-Zustand für langlaufende Aufgaben zu speichern und wiederaufzunehmen

Agent-Layer

Die Agent-Schicht implementiert die Reasoning- und Entscheidungsfähigkeiten des Systems, verkörpert in MCPlatos ClawMode-autonomer Ausführungsengine.

Schlüsselfähigkeiten:

  • Autonome Ausführung: ClawMode ermöglicht dem Agenten, unabhängig zu arbeiten und Entscheidungen ohne ständige Benutzereingabe zu treffen
  • Aufgabenplanung: Aufschlüsselung komplexer Ziele in handhabbare Schritte mit Abhängigkeitsmanagement
  • Multi-Session-Koordination: Orchestrierung von Arbeit über mehrere Sessions für parallele oder sequenzielle Ausführung
  • Selbstverbesserung: Die Fähigkeit, aus Ausführungsmustern zu lernen und zukünftiges Verhalten zu optimieren

4.2 Harness-Integrationsmerkmale

MCPlatos Harness-Schicht zeichnet sich durch mehrere wichtige Designdokumentationen aus:

MCP-native Unterstützung

Anders als Systeme, die MCP-Unterstützung als Plugin oder Erweiterung hinzufügen, implementiert MCPlato MCP als Kernarchitekturprinzip:

  • Integrierter MCP-Host: Vollständige MCP-Host-Implementierung mit Unterstützung für stdio- und HTTP-Transports
  • Dynamisches Server-Management: Laufzeit-Hinzufügen, Entfernen und Konfigurieren von MCP-Servern
  • Fähigkeitserkennung: Automatische Erkennung und Exposition verfügbarer Tools, Resources und Prompts
  • Hot-Loading: Neue MCP-Server können hinzugefügt werden, ohne die Anwendung neu zu starten

Integriertes Toolset

Über MCP hinaus bietet MCPlato einen umfassenden Satz integrierter Tools, die für Produktivitäts-Workflows entwickelt wurden:

Tool-KategorieFähigkeiten
@Tool SuiteDateioperationen, Bash-Ausführung, Code-Bearbeitung, Websuche
Infographic CreatorDatenvisualisierung, Diagrammgenerierung, Diagrammerstellung
Browser AutomationWeb-Navigation, Formularausfüllung, Screenshot-Erfassung, Elementinteraktion
Image ToolsGenerierung (mehrere Modelle), Bearbeitung (Inpaint/Outpaint), Komposition, Stiltransfer
Document ToolsPDF-Analyse, OCR, strukturierte Extraktion, Formatkonvertierung

Jedes Tool im integrierten Suite folgt denselben Schnittstellenstandards wie MCP-Tools und gewährleistet so konsistentes Verhalten, ob native Fähigkeiten oder externe Server verwendet werden.

Dynamische Tool-Erkennung

Die Harness-Schicht implementiert ausgeklügelte Tool-Erkennungsmechanismen:

  • Laufzeit-Introspektion: Tools werben dynamisch mit ihren Fähigkeiten, Parametern und Anforderungen
  • Semantisches Matching: Der Agent kann Tools basierend auf natürlichsprachlichen Beschreibungen von Bedürfnissen entdecken
  • Versionsmanagement: Unterstützung für mehrere Versionen desselben Tools mit graceful deprecation
  • Abhängigkeitsauflösung: Automatische Behandlung von Tool-Abhängigkeiten und Vorbedingungsprüfungen

4.3 Agent-Fähigkeiten

MCPlatos Agent-Layer (ClawMode) implementiert mehrere fortgeschrittene Fähigkeiten, die ihn von einfacheren Chat-basierten Schnittstellen unterscheiden:

Aufgabenplanung und Dekomposition

Wenn komplexe Ziele präsentiert werden:

  1. Analysiert der Agent das Ziel, um erforderliche Schritte und Abhängigkeiten zu identifizieren
  2. Wählt er passende Tools für jeden Schritt aus
  3. Etabliert er Erfolgskriterien und Checkpoints
  4. Erstellt er einen wiederherstellbaren Ausführungsplan, der Unterbrechungen überleben kann

Multi-Session-Koordination

Der Agent kann Arbeit über mehrere Sessions orchestrieren:

  • Parallele Ausführung: Ausführen unabhängiger Unteraufgaben in separaten Sessions
  • Sequentielle Pipelines: Verketten von Sessions, bei denen die Ausgabe einer die Eingabe einer anderen wird
  • Cross-Session-Speicher: Teilen relevanter Kontexte zwischen Sessions bei Beibehaltung der Isolation

Unterstützung für langlaufende Aufgaben

MCPlato unterstützt Aufgaben, die über eine einzelne Interaktion hinausgehen:

  • Geplante Ausführung: Cron-basierte und periodische Aufgabenplanung
  • Checkpoint und Wiederaufnahme: Speichern von Zuständen an wichtigen Meilensteinen zur Wiederherstellung
  • Fortschrittsberichterstattung: Echtzeit-Updates über langlaufende Operationen
  • Human-in-the-Loop: Angemessene Eskalationspunkte für Entscheidungen, die menschliches Urteilsvermögen erfordern

5. Vergleichende Architekturanalyse

Um MCPlatos architektonische Entscheidungen zu verstehen, ist es nützlich, sie mit anderen Systemen in der KI-Agent-Landschaft zu vergleichen. Die folgende Tabelle fasst wichtige architektonische Unterschiede zusammen:

ProduktHarness-DesignAgent-DesignArchitektonische Merkmale
Claude CodeIntegrierte Tools + MCP-UnterstützungEinzelner Agent, langlaufende SessionPionier der Agent-Harness-Integration; terminal-zentriert; CLAUDE.md für Speicher
CursorMCP-Ökosystem + integrierte Editor-ToolsAgent 2.0 mit autonomen FähigkeitenAgent-zuerst IDE; Composer für Multi-Datei-Änderungen; parallele Agent-Ausführung (bis zu 8)
OpenClawTool-Sandbox + Skills-FrameworkHierarchisches Multi-Agent-DesignOpen-Source-Framework; Gateway-Layer für Multi-Channel-Zugriff; selbstgehostet
DevinCloud-integriertes ToolsetEnd-to-End-Engineering-AgentAgent-natives IDE; vollständige Cloud-Sandbox; SWE-bench-optimiert
MCPlatoIntegrierte Tools + MCP-nativer HostClawMode-autonome AusführungDrei-Schichten-entkoppelte Architektur; Local First; vollständige Toolkette

5.1 Analyse der Designentscheidungen

Claude Code priorisiert Einfachheit und Integration mit bestehenden Entwickler-Workflows. Sein Harness ist schlank und konzentriert sich auf wesentliche Datei- und Terminaloperationen. Die Agent-Schicht unterhält eine einzelne langlaufende Session, was das Kontextmanagement vereinfacht, aber die Parallelisierung begrenzt.

Cursor betont Entwicklerproduktivität innerhalb eines IDE-Kontexts. Sein Harness nutzt die bestehenden Fähigkeiten des Editors und fügt MCP-Unterstützung für Erweiterbarkeit hinzu. Die Agent-2.0-Architektur führt Autonomie innerhalb des begrenzten Kontexts der Code-Bearbeitung ein.

OpenClaw (die Open-Source-Grundlage für MCPlato) bietet maximale Flexibilität durch seine Gateway-Agent-Tools-Hierarchie. Als Framework statt Produkt priorisiert es Konfigurierbarkeit gegenüber Out-of-Box-Erfahrung.

Devin repräsentiert das Cloud-native Extrem: Die gesamte Umgebung ist virtualisiert und verwaltet. Dies ermöglicht leistungsstarke Fähigkeiten, erfordert aber die Abtretung der Kontrolle an die Cloud-Infrastruktur.

MCPlato nimmt eine unverwechselbare Position ein: Es kombiniert die Flexibilität von OpenClaw mit Produktniveau-Polierung, fügt Local First-Prinzipien hinzu und implementiert eine Drei-Schichten-Architektur, die Belange sauber trennt.

5.2 Schlüsseldifferenzierungsfaktoren

DimensionMCPlato-Vorteil
ArchitekturtiefeDrei-Schichten-Design (Workspace-Session-Agent) vs. Zwei-Schichten- oder flache Designs
MCP-IntegrationNative Host-Implementierung vs. Add-on-Unterstützung
Local FirstVollständige lokale Toolkette vs. Cloud-Abhängigkeit oder Sandbox-Einschränkungen
Tool-VollständigkeitIntegrierte Bild-, Dokument-, Infographic- und Browser-Tools jenseits grundlegender Dateioperationen
SpeicherarchitekturDrei-Stufen-Persistenz (Workspace/Session/Diary) vs. Einzelkontext oder manuelle Speicherdateien
PlanungNative Cron-basierte Planung vs. externe Scheduler-Abhängigkeit oder keine Unterstützung

6. Architektonische Designprinzipien und Best Practices

Basierend auf der Analyse von MCPlato und vergleichbaren Systemen können wir mehrere Prinzipien für das Design effektiver Harness-Agent-Architekturen ableiten:

6.1 Prinzip 1: Mehrschichtige Entkopplung

Die Harness- und Agent-Schichten sollten klare, stabile Schnittstellen haben.

  • Definieren Sie explizite Verträge zwischen Schichten (Protokolle wie MCP bieten diese)
  • Vermeiden Sie das Durchsickern von Implementierungsdetails über Schichtgrenzen hinweg
  • Ermöglichen Sie unabhängiges Testen, Deployment und Evolution jeder Schicht
  • Widerstehen Sie der Versuchung, "bequeme" Abkürzungen hinzuzufügen, die Schichtverantwortlichkeiten verwischen

6.2 Prinzip 2: Standards zuerst

Adoptieren Sie offene Standards, bevor Sie benutzerdefinierte Lösungen bauen.

  • Standards wie MCP bieten sofortige Ökosystemvorteile
  • Benutzerdefinierte Protokolle schaffen technische Schulden und Integrationsherausforderungen
  • Standards entstehen aus kollektiver Weisheit – respektieren Sie dieses angesammelte Wissen
  • Tragen Sie zur Evolution von Standards bei, statt unnötig zu forken

6.3 Prinzip 3: Dynamische Erkennung

Tools sollten zur Laufzeit auffindbar sein, nicht hartcodiert.

  • Agenten sollten sich an verfügbare Tools anpassen können, ohne Code-Änderungen
  • Tool-Manifeste sollten reichhaltige Metadaten enthalten (Beschreibung, Parameter, Beispiele)
  • Unterstützen Sie Hot-Loading für Zero-Downtime-Tool-Updates
  • Ermöglichen Sie Tool-Chaining und -Komposition durch Standardschnittstellen

6.4 Prinzip 4: Sicherheitsisolation

Tool-Ausführung sollte sandgeboxt und richtliniengesteuert sein.

  • Gehen Sie davon aus, dass der Agent Fehler machen oder irregeführt werden kann
  • Implementieren Sie Verteidigung in der Tiefe: Validierung auf mehreren Ebenen
  • Verwenden Sie das Prinzip der geringsten Privilegien – Tools erhalten nur die Berechtigungen, die sie brauchen
  • Bieten Sie klare Audit-Trails für sicherheitskritische Operationen

6.5 Prinzip 5: Zustandspersistenz

Langlaufende Aufgaben erfordern robustes Zustandsmanagement.

  • Designen Sie für Unterbrechung – Aufgaben werden pausiert, beendet oder scheitern
  • Implementieren Sie Checkpoint/Restore-Mechanismen an Aufgabengrenzen
  • Trennen Sie flüchtigen Zustand von persistentem Zustand
  • Ermöglichen Sie graceful degradation, wenn Zustand verloren geht

6.6 Best Practices-Checkliste

Bei der Implementierung einer Harness-Agent-Architektur berücksichtigen Sie:

  • Tool-Definition: Sind Tools gut dokumentiert mit klaren Schemata und Beispielen?
  • Fehlerbehandlung: Bieten Tools umsetzbare Fehlermeldungen und Wiederherstellungsvorschläge?
  • Beobachtbarkeit: Können Sie eine Anfrage von der Agent-Entscheidung bis zur Harness-Ausführung verfolgen?
  • Ratenbegrenzung: Gibt es Schutzmaßnahmen gegen versehentlichen Missbrauch oder Endlosschleifen?
  • Benutzerkontrolle: Können Benutzer Agent-Tool-Auswahlen inspizieren, genehmigen oder überschreiben?
  • Fallback-Strategie: Was passiert, wenn bevorzugte Tools nicht verfügbar sind?
  • Ressourcenbereinigung: Werden temporäre Dateien, Verbindungen und Prozesse ordnungsgemäß freigegeben?

7. Fazit: Architektur als Wettbewerbsvorteil

Wenn wir in die Zukunft der KI-Systeme blicken, zeigt sich ein klares Muster: Modellfähigkeiten werden kommoditisiert, aber architektonische Exzellenz bleibt ein dauerhafter Wettbewerbsvorteil.

7.1 Das Plateau der Modellfähigkeiten

Die Lücke zwischen Frontier-Modellen und fähigen Open-Source-Alternativen schmälert sich. Techniken wie Destillation, Quantisierung und effizientes Training demokratisieren den Zugang zu leistungsstarken Reasoning-Fähigkeiten. Innerhalb weniger Jahre wird "Modellqualität" ein gelöstes Problem für die meisten Anwendungen sein.

Was nicht gelöst werden wird, ist die Integrationsherausforderung – die Verbindung dieser fähigen Modelle mit der chaotischen, heterogenen Realität von Unternehmenssystemen, persönlichen Workflows und externen Datenquellen. Dies ist die Domäne der Architektur.

7.2 Harness-Zuverlässigkeit als entscheidender Faktor

Wenn Modelle "gut genug" sind, werden die entscheidenden Faktoren:

  • Zuverlässigkeit: Funktioniert das System konsistent über diverse Szenarien hinweg?
  • Sicherheit: Können Benutzer dem System mit ihren Daten und Systemen vertrauen?
  • Erweiterbarkeit: Kann sich das System an neue Anforderungen anpassen, ohne neu designt zu werden?
  • Beobachtbarkeit: Können Betreiber Systemverhalten verstehen und debuggen?

Dies sind architektonische Belange, keine Modellbelange. Die Harness-Schicht ist der Ort, an dem diese Belange adressiert werden.

7.3 MCP und die Vereinheitlichung des Tool-Zugriffs

MCP repräsentiert einen entscheidenden Moment in der KI-Architektur – das Entstehen eines wahren Standards für Tool-Integration. Mit wachsender MCP-Adoption können wir erwarten:

  • Explosives Wachstum verfügbarer Tools (jedes SaaS-Produkt, jede Datenbank und jede API wird KI-zugänglich)
  • Erhöhter Wettbewerb zwischen KI-Plattformen um Orchestrierungsqualität statt Integrationsquantität
  • Entstehung spezialisierter Harness-Provider (sicherheitsfokussiert, leistungsoptimiert, domänenspezifisch)

7.4 Vom einzelnen Agenten zur Multi-Agent-Zusammenarbeit

Die aktuelle Generation von KI-Systemen behandelt den Agenten weitgehend als einzelne Entität. Die nächste Generation wird Multi-Agent-Architekturen umarmen, in denen spezialisierte Agenten bei komplexen Aufgaben zusammenarbeiten:

  • Research Agents, die Informationen sammeln und synthetisieren
  • Planning Agents, die Ziele aufschlüsseln und Ressourcen zuweisen
  • Execution Agents, die mit spezifischen Systemen und Tools interagieren
  • Review Agents, die Qualität verifizieren und Fehler aufspüren

Diese Multi-Agent-Systeme werden ausgeklügelte Harness-Schichten erfordern, die folgendes können:

  • Inter-Agent-Kommunikation und -Koordination
  • Gemeinsames Kontextmanagement über Agent-Grenzen hinweg
  • Konfliktlösung, wenn Agenten uneinig sind
  • Ressourcenzuweisung und -priorisierung

MCPlatos Drei-Schichten-Architektur – mit ihrer klaren Trennung von Workspace-, Session- und Agent-Belangen – bietet eine Grundlage für diese Multi-Agent-Zukunft.

7.5 Abschließende Gedanken

Der Übergang vom "modell-zuerst"- zum "architektur-zuerst"-Denken repräsentiert eine Reifung des KI-Feldes. Wir bewegen uns von einer Ära, in der gezeigt wurde, was möglich ist, in eine Ära, in der geliefert wird, was zuverlässig ist.

Für Praktiker, die heute KI-Systeme bauen, ist die Lektion klar: Investieren Sie in Ihre Harness-Schicht. Ein gut gestaltetes Harness wird Ihren aktuellen Modellprovider überdauern, sich an neue Anwendungsfälle anpassen und die Grundlage für noch nicht vorstellbare Fähigkeiten bieten.

MCPlatos Architektur – MCP-nativ, Drei-Schichten-entkoppelt, Local First – repräsentiert eine Vision davon, wie diese Grundlage aussehen kann. Es ist nicht der einzig gültige Ansatz, aber er demonstriert die Prinzipien, die erfolgreiche KI-Architekturen in den kommenden Jahren leiten werden.

Das Zeitalter der Architektur-zuerst-KI hat begonnen.


FAQ

F: Was ist die Harness-Schicht in KI-Systemen?

Die Harness-Schicht (Tool-Layer) ist verantwortlich für Tool-Kapselung, Ausführungsorchestrierung, Validierung und Schutz sowie Speicherverwaltung. Sie kapselt externe Fähigkeiten (Dateien, APIs, Suche) in aufrufbare Tools/Skills und behandelt alle Funktionen jenseits des Modell-Reasonings, einschließlich Sicherheits-Sandboxing, Fehlerbehandlung und Ergebnisformatierung.

F: Wie implementiert MCPlato die Harness-Agent-Architektur?

MCPlato implementiert eine Drei-Schichten-Architektur: Workspace-Layer für Workspace-Management und Isolation, Session-Layer für Kontexterhaltung und Nachrichtenverteilung sowie Agent-Layer für ClawMode-autonome Ausführung. Es bietet native MCP-Host-Fähigkeiten, integrierte Toolsets einschließlich @Tool, Infographic, Browser, Image und Document Tools sowie Unterstützung für dynamische Tool-Erkennung und Hot-Loading.

F: Was ist MCP und warum ist es wichtig?

MCP (Model Context Protocol) ist ein offener Standard, den Anthropic im November 2024 veröffentlicht hat. Es dient als universelle Schnittstelle zwischen KI-Anwendungen und externen Systemen und eliminiert die Notwendigkeit, separate Konnektoren für jede Datenquelle zu bauen. MCP definiert drei Kernprimitive: Tools (ausführbare Funktionen), Resources (Datenquellen) und Prompts (Interaktionsvorlagen).

F: Warum ist die Harness-Schicht wichtiger als das Modell selbst?

Jenseits eines bestimmten Schwellenwerts werden Modellfähigkeiten kommoditisiert. Die Zuverlässigkeit, Sicherheit und Qualität der Tool-Integration der Harness-Schicht werden zu den entscheidenden Faktoren für produktive KI-Systeme. Ein gut gestaltetes Harness ermöglicht sichere, zuverlässige Tool-Nutzung und bietet konsistente Schnittstellen unabhängig vom zugrunde liegenden Modell.

F: Was sind die Schlüsselprinzipien für das Design von Harness-Agent-Architekturen?

Schlüsselprinzipien umfassen: (1) Mehrschichtige Entkopplung mit klarer Trennung der Verantwortlichkeiten von Harness und Agent, (2) Standards-zuerst-Adoption von Protokollen wie MCP, (3) Dynamische Erkennung für Laufzeit-Tool-Registrierung, (4) Sicherheitsisolation durch Sandbox-Ausführung und (5) Zustandspersistenz für langlaufende Aufgaben.

F: Wie unterscheidet sich MCPlato von Claude Code und Cursor?

MCPlato unterscheidet sich durch: (1) Drei-Schichten-Architektur vs. Zwei-Schichten-Designs, (2) Native MCP-Host-Implementierung vs. Add-on-Unterstützung, (3) Local First mit vollständiger lokaler Toolkette, (4) Integrierte Bild-, Dokument-, Infographic- und Browser-Tools, (5) Drei-Stufen-Speicherarchitektur und (6) Native Planungsfähigkeiten.

F: Was ist die zukünftige Richtung für KI-Systemarchitekturen?

Die Branche bewegt sich von Einzel-Agenten zur Multi-Agent-Zusammenarbeit, vom modell-zentrierten zum architektur-zentrierten Design und von proprietären Integrationen zu standardisierten Protokollen wie MCP. Zukünftige Systeme werden Zuverlässigkeit, Beobachtbarkeit und Erweiterbarkeit als primäre Designdesignziele betonen.