Agentenkommunikationsprotokolle: Wie autonome KI-Systeme Informationen austauschen
In den vergangenen Jahren hat sich künstliche Intelligenz rasant von einem vorwiegend forschungsgetriebenen Bereich zu einer Technologie entwickelt, die in praktischen Anwendungen eingesetzt wird. Dadurch verändern sich technische Umgebungen: Aus isolierten Anwendungen entstehen zunehmend Netzwerke autonomer Agenten, die miteinander interagieren.
Ein autonomer Agent ist ein softwarebasiertes System oder eine KI-Einheit, die ihre Umgebung wahrnimmt, Informationen bewertet und mit einem hohen Maß an Eigenständigkeit handelt. Solche Agenten können verhandeln, gemeinsame Pläne erstellen, Ressourcen und Informationen austauschen und während der Ausführung miteinander kommunizieren. Agentenkommunikationsprotokolle legen fest, wie diese Interaktion funktioniert.
Agentenkommunikationsprotokolle sind standardisierte Regeln, Sprachen und Nachrichtenstrukturen, die bestimmen, wie Agenten Informationen austauschen. Agenten nutzen diese Protokolle, um Wissen zu teilen, Entscheidungen abzustimmen und Pläne zu koordinieren. Die Grundideen solcher Kommunikationssprachen existieren bereits seit vielen Jahren in klassischen Multi-Agenten-Systemen sowie in akademischen Arbeiten zu FIPA ACL und KQML. Durch große Sprachmodelle, JSON-basierte APIs und Orchestrierungsframeworks wie MCP, LangGraph, AutoGen und Swarm entwickelt sich dieser Bereich jedoch schnell weiter.
Dieser Beitrag erklärt die Grundlagen von Agentenkommunikationssprachen und den Aufbau einer Agentennachricht. Außerdem zeigt er praktische Einsatzszenarien, in denen Agenten über etablierte Konzepte und moderne Protokolle aus aktuellen Entwicklerwerkzeugen kommunizieren.
Wichtige Erkenntnisse
- Von monolithischen Systemen zu Multi-Agenten-Ökosystemen: KI-Systeme entwickeln sich zunehmend von zentralisierten Einzelanwendungen hin zu Ökosystemen aus vielen autonomen Agenten. Diese Agenten können denken, handeln und über definierte Protokolle miteinander kommunizieren.
- Kommunikation benötigt Struktur und Bedeutung: Agentenkommunikationssprachen wie FIPA ACL und KQML haben Performative, Inhaltsformate und Ontologien eingeführt, um Zweck und Bedeutung von Nachrichten eindeutig zu machen. Diese Konzepte prägen moderne Agentenkommunikation bis heute.
- Moderne Protokolle setzen auf JSON und APIs: Aktuelle Frameworks verwenden JSON-Verträge, Schemas und Standards wie das Model Context Protocol, um festzulegen, wie LLM-basierte Agenten mit Tools und Systemen interagieren. Das unterstützt klarere Kommunikation, bessere Interoperabilität und höhere Sicherheit.
- Sicherheit, Vertrauen und Beobachtbarkeit sind entscheidend: Moderne Agentensysteme nutzen Berechtigungen, Sandboxing und Protokollierung, um falsch ausgerichtete, fehlerhafte oder bösartige Agenten zu kontrollieren. Nachrichten-IDs, Tracing und Replay-Funktionen sind wichtig für Debugging und Transparenz.
- Standardisierung ermöglicht skalierbare Zusammenarbeit: Die Prinzipien von Multi-Agenten-Systemen und Agentenkommunikationssprachen finden sich auch in Ökosystemen wie LangGraph, AutoGen und Swarm wieder. Dort ermöglichen klar definierte Nachrichtenstrukturen eine sicherere und besser kompatible Zusammenarbeit.
Was ist Agentenkommunikation?
Agentenkommunikation beschreibt in Multi-Agenten-Systemen den Austausch von Nachrichten zwischen Agenten, damit diese zusammenarbeiten können. Ähnlich wie Menschen verwenden künstliche Agenten eine gemeinsame Sprache oder ein gemeinsames Protokoll, um mit anderen Agenten und ihrer Umgebung zu interagieren. Diese Nachrichten bestehen nicht nur aus Rohdaten. Sie sind strukturierte Informationseinheiten. Ein Agent kann einem anderen Agenten beispielsweise eine Tatsache mitteilen oder ihn auffordern, eine bestimmte Aktion auszuführen.
Warum Agentenkommunikationsprotokolle notwendig sind
Wenn Nachrichten keinem vereinbarten Format folgen, können andere Agenten sie ignorieren, zurückweisen oder falsch interpretieren. Protokolle sind aus mehreren Gründen wichtig:
- Interoperabilität: Ein gemeinsames Protokoll ermöglicht es Agenten, die von unterschiedlichen Entwicklern erstellt oder mit verschiedenen Frameworks gebaut wurden, miteinander zu kommunizieren. Es wirkt wie eine gemeinsame Übersetzungsschicht für Agenteninteraktion.
- Klare Absicht: Protokolle definieren Nachrichtentypen, häufig Performative oder Speech Acts genannt, etwa request, inform oder propose. Diese Nachrichtentypen liefern Metadaten, die erklären, was der Sender beabsichtigt.
- Koordination und Reihenfolge: Protokolle steuern häufig den Ablauf von Gesprächen. Ein definiertes Kommunikationsprotokoll stellt sicher, dass Agenten demselben Interaktionsmuster folgen. Nach dem Senden eines CFP, also eines Call for Proposal, kann ein Agent beispielsweise eine Antwort in Form eines Vorschlags oder einer Ablehnung erwarten.
- Zuverlässigkeit und Fehlerbehandlung: Gute Protokolle enthalten Mechanismen für ungültige oder unerwartete Nachrichten. Erhält ein Agent etwa eine beschädigte oder unbekannte Nachricht, kann er in FIPA ACL mit einem not-understood-Performativ oder in KQML mit einer sorry-Nachricht reagieren.
- Sicherheit und Vertrauen: In offenen Agentenumgebungen können Protokolle Einschränkungen wie Authentifizierungsfelder oder formale Schritte erzwingen, die abgeschlossen sein müssen, bevor eine Aktion erlaubt wird.
Klassische Modelle der Agentenkommunikation
Die frühe Forschung zu Multi-Agenten-Systemen entwickelte spezielle Sprachen für den Nachrichtenaustausch zwischen Agenten. Zwei der einflussreichsten Agentenkommunikationssprachen sind KQML und FIPA ACL. Beide führten strukturierte Nachrichtenformate und Semantiken auf Basis der Sprechakttheorie ein und beeinflussen moderne Protokolle bis heute.
KQML: Knowledge Query and Manipulation Language
KQML, die Knowledge Query and Manipulation Language, entstand Anfang der 1990er-Jahre im Rahmen einer Initiative zum Wissensaustausch. KQML definiert eine Reihe von Nachrichten-Performativen, also Verben, die den Zweck einer Nachricht beschreiben. Diese Performative funktionieren wie ein formaler Verhaltenskodex für Gespräche zwischen Agenten.
Typische Performative sind zum Beispiel ask für Informationsabfragen, tell für die Übermittlung von Informationen, achieve für die Aufforderung an einen anderen Agenten, ein Ziel zu erreichen, und reply für die Antwort auf eine Anfrage.
In KQML wird der eigentliche Nachrichteninhalt von der Kommunikationshülle getrennt. Eine KQML-Nachricht wird als Liste mit Lisp-ähnlichen Klammern geschrieben. Das erste Element ist das Performativ, gefolgt von Parametern wie Inhalt, Sender und Empfänger. Konzeptuell kann eine KQML-Nachricht so aussehen:
(ask-one
:sender Agent1
:receiver Agent2
:content "(temperature ?x)"
:language LPROLOG
:ontology weather)
In diesem Beispiel ist ask-one das Performativ. Es bedeutet, dass Agent1 Agent2 eine Frage stellt. Der Inhalt kann eine Abfrage wie temperature ?x in einer logischen Sprache darstellen. Die Felder ontology und language erklären, wie dieser Inhalt zu interpretieren ist.
KQML gehörte außerdem zu den ersten Ansätzen, die sogenannte Facilitator-Agenten einführten. Ein Facilitator agiert als Vermittler oder Broker, der Nachrichten weiterleitet und Agenten hilft, einander zu finden. Ein Agent kann seine Dienste beispielsweise bei einem Facilitator registrieren. Sendet ein anderer Agent anschließend eine Anfrage mit einem Performativ wie ask, kann der Facilitator diese an den passenden registrierten Agenten weiterleiten.
KQML enthielt auch Performative für netzwerkbezogene Aktionen wie register, forward und broadcast. Zudem unterstützte es frühe asynchrone Nachrichtenmuster, darunter subscribe. Damit kann ein Agent fortlaufende Aktualisierungen anfordern, sobald sich eine Bedingung ändert.
FIPA ACL: Foundation for Intelligent Physical Agents ACL
Nach KQML wurde FIPA ACL zum nächsten wichtigen Standard. Es wurde vor allem Ende der 1990er- und Anfang der 2000er-Jahre häufig genutzt. FIPA ist eine IEEE-Standardisierungsorganisation, die Spezifikationen für interoperable, verteilte Multi-Agenten-Systeme entwickelt. FIPA ACL verfeinerte die Liste der Performative und definierte formalere Semantiken auf Basis mentaler Agentenzustände wie Überzeugungen, Wünsche und Absichten.
FIPA ACL definiert rund 20 Standard-Performative, auch kommunikative Akte genannt. Viele davon basieren auf KQML, andere wurden später ergänzt. Häufig verwendete FIPA-Performative sind:
- inform: informiert einen anderen Agenten über eine Information, die der Sender für wahr hält. Es ist eines der am häufigsten genutzten Performative und entspricht einer Tatsachenaussage.
- request: fordert einen anderen Agenten auf, eine Aktion auszuführen.
- confirm / disconfirm: bestätigt, dass etwas wahr oder falsch ist, wenn der Sender davon ausgeht, dass der Empfänger unsicher war.
- cfp: steht für Call for Proposal und wird genutzt, um Vorschläge für eine Aktion anzufordern, häufig in Contract-Net-Interaktionen.
- propose: sendet einen Vorschlag als Antwort auf einen CFP.
- accept-proposal / reject-proposal: akzeptiert oder lehnt einen erhaltenen Vorschlag ab.
- agree: zeigt an, dass der Agent bereit ist, die angeforderte Aktion zu versuchen.
- refuse: signalisiert, dass der Agent die Ausführung der angeforderten Aktion ablehnt, optional mit Begründung.
- failure: zeigt an, dass eine angeforderte Aktion nicht abgeschlossen werden konnte.
- query-if / query-ref: stellt eine Ja-Nein-Frage oder fragt nach einer bestimmten Information.
- subscribe: fordert fortlaufende Benachrichtigungen an, wenn sich Informationen ändern.
- not-understood: signalisiert, dass die empfangene Nachricht nicht verstanden wurde.
- Weitere Performative: Dazu gehören cancel, proxy und andere Nachrichtentypen für fortgeschrittenere Kommunikationsmuster.
Eine FIPA-ACL-Nachricht nutzt eine feste Auswahl an Feldern. Das einzige Pflichtfeld ist das Performativ. Die meisten Nachrichten enthalten jedoch zusätzlich Felder wie sender, receiver, content, ontology, language und conversation-id. Eine FIPA-ähnliche Nachricht kann so dargestellt werden:
(performative INFORM
:sender Agent1
:receiver Agent2
:ontology WeatherOntology
:language JSON
:content "{ 'forecast': 'sunny' }"
:conversation-id conv123)
Dieses Format ähnelt einer strukturierten geschäftlichen E-Mail oder einem formalen Brief. Es enthält Sender, Empfänger, Nachrichtentyp, Inhalt und optionale Referenzen wie eine Thread-ID. Das Feld ontology definiert das Vokabular oder den Kontext des Nachrichteninhalts. Das Feld language legt das Inhaltsformat fest, etwa logische Syntax, Klartext oder JSON.
Aufbau einer Agentennachricht
Die durch klassische Agentenkommunikationssprachen entwickelte Nachrichtenstruktur ist weiterhin wichtig, weil dasselbe Muster in vielen modernen Protokollen wieder auftaucht, auch wenn das Format heute häufig aus JSON-Feldern oder API-Schemas besteht. Die wichtigsten Elemente einer Agentenkommunikationsnachricht sind:
- Performativ: Das Performativ definiert den kommunikativen Akt. Es erklärt, warum die Nachricht gesendet wird, und teilt dem Empfänger mit, wie sie verarbeitet werden soll. Eine Nachricht kann eine Aufforderung zu einer Aktion, eine Tatsachenmitteilung oder ein Vertragsvorschlag sein. In FIPA ACL ist das Performativ verpflichtend und steht am Anfang.
- Inhalt: Der Inhalt ist die eigentliche Nutzlast der Nachricht. Er kann einen Vorschlag, eine Frage, einen Befehl oder domänenspezifische Daten enthalten. Er könnte beispielsweise mitteilen, dass die Temperatur 20 °C beträgt, fragen, ob die Temperatur über 30 liegt, oder verlangen, dass ein Thermostat auf 25 erhöht wird.
- Ontologie: Eine Ontologie ist in der Agentenkommunikation das Vokabular oder Wissensschema, das festlegt, wie der Inhalt verstanden werden soll. Agenten, die über Reisen sprechen, können etwa eine Reiseontologie nutzen, die Begriffe wie Flüge, Preise und Buchungsobjekte definiert.
- Sprache oder Kodierung: Das Sprachfeld definiert die Syntax oder Kodierung des Inhalts. Der Inhalt kann natürliche Sprache, JSON, eine Prolog-Klausel, XML oder eine andere Darstellung sein. Durch die Angabe der Inhaltssprache teilt der Sender dem Empfänger mit, wie die Nachricht geparst werden soll.
- Teilnehmer: Jede Nachricht enthält Informationen darüber, wer sie sendet und wer sie empfangen soll. Bei Eins-zu-eins-Kommunikation gibt es einen Sender und einen Empfänger. Bei Broadcast- oder Multicast-Kommunikation kann das Protokoll mehrere Empfänger oder eine Gruppenkennung unterstützen.
- Protokoll: Manche Nachrichten gehören zu einem vordefinierten Interaktionsprotokoll, etwa einer Contract-Net-Verhandlung oder einer Auktion. Ein Protokollfeld identifiziert den Kontext der Nachricht, damit der Empfänger sie korrekt einordnen kann.
- Konversationsverfolgung: Mehrstufige Gespräche benötigen Kennungen, die Nachrichten zu Threads verbinden. Felder wie conversation-id und reply-to helfen Agenten, Antworten der richtigen Anfrage zuzuordnen, insbesondere wenn mehrere Gespräche gleichzeitig stattfinden.
Moderne Entwicklung: LLM-Agenten und JSON-Verträge
Große Sprachmodelle wie GPT-4 und Claude haben natürlichsprachliche Agenten in die moderne Softwareentwicklung gebracht. Aktuelle Agentenframeworks integrieren LLMs in mehrstufige Workflows und benötigen eine zuverlässige Möglichkeit, Aufgaben aus natürlichsprachlichen Anfragen darzustellen und auszuführen. Tool- oder Function Calling bildet dabei die Brücke. Statt ausschließlich Klartext zurückzugeben, kann das LLM strukturiertes JSON erzeugen, das einen Funktionsaufruf beschreibt. Wenn das Modell ein Tool auswählt, erstellt es ein JSON-Objekt mit Funktionsname und Argumenten.
Der Ablauf ist einfach: Eine Benutzeranfrage wird von einem LLM-Agenten verarbeitet. Der Agent kann entweder eine Textantwort erzeugen oder ein externes Tool aufrufen. Ein Funktionsaufruf wird als JSON-Dokument ausgegeben, das ein bestimmtes Tool und ein Wörterbuch aus Schlüssel-Wert-Argumenten enthält, etwa ein get_weather-Tool mit einem Stadtwert wie Paris. Die Tool-Laufzeitumgebung autorisiert den Aufruf, leitet ihn an die registrierte Funktion weiter und erhält ein strukturiertes Ergebnis, zum Beispiel ein JSON-Objekt mit Temperatur und Wetterbedingungen. Dieses Ergebnis wird an den Agenten zurückgegeben, der es anschließend für weitere Planung oder eine Antwort nutzt.
JSON-Verträge trennen das Reasoning eines LLM von der Ausführungsumgebung. Das LLM entscheidet, wann ein Tool aufgerufen werden soll, während externer Code Ausführung, Authentifizierung, Fehlerbehandlung und Protokollierung übernimmt. Das strukturierte Format kann Injection-Risiken reduzieren und macht Nachrichten leichter auswertbar. Im Vergleich zur abstrakten Syntax von FIPA ist JSON in vielen Programmiersprachen breit unterstützt und passt natürlich zu Web-APIs.
Dieses Modell lässt performative Semantik jedoch häufig implizit. Die Absicht oder der Nachrichtentyp wird also nicht immer so klar angegeben wie in Agentenkommunikationssprachen wie KQML oder FIPA ACL. JSON-Vertragsmuster sind deshalb sehr nützlich für moderne LLM-Workflows, tauschen explizite kommunikative Akte aber teilweise gegen natürlichsprachlich gesteuerte Kontrolle ein.
Wie MCP, das Model Context Protocol, hineinpasst
MCP, das Model Context Protocol, kann als offener Standardansatz verstanden werden, um KI-Agenten, insbesondere LLM-basierte Agenten, strukturiert mit Tools, externen Datenquellen und anderen Agenten zu verbinden. Verschiedene Organisationen unterstützen vergleichbare Standardisierungsbemühungen, um eine gemeinsame Interoperabilitätsschicht für KI-Systeme zu schaffen.
Technisch basiert MCP auf JSON-RPC 2.0, einem schlanken Remote-Procedure-Call-Protokoll auf JSON-Basis. Vereinfacht gesagt definiert MCP vereinbarte Nachrichtenformate, mit denen ein KI-Modell eine Anfrage wie „Rufe Tool X mit diesen Parametern auf“ senden und eine vorhersehbare JSON-Antwort erhalten kann, unabhängig davon, welches konkrete Tool oder welche Organisation dahintersteht.
Angenommen, ein KI-Agent benötigt Wetterinformationen. Ohne standardisiertes Protokoll müsste ein Entwickler eventuell eine individuelle Anweisung formulieren, etwa: „Rufe die Wetter-API mit key=ABC auf, um das Wetter für London abzurufen“, und anschließend eigenen Code schreiben, der das Ergebnis auswertet.
Mit MCP könnte der Agent stattdessen eine JSON-RPC-Anfrage an einen Wetter-Tool-Endpunkt senden, der von einem MCP-Server bereitgestellt wird. Die Anfrage könnte so aussehen:
{“jsonrpc”: “2.0”, “method”: “getWeather”, “params”: {“city”: “London”}, “id”: 1}
Der MCP-Server weiß, wie er die Anfrage verarbeitet, wahrscheinlich indem er im Hintergrund eine reale Wetter-API aufruft. Anschließend gibt er ein JSON-Ergebnis zurück. Der Agent erhält dieses Ergebnis in einer vorhersehbaren Struktur.
MCP spielt eine wichtige Rolle in moderner Agentenkommunikation, weil es viele Vorteile traditioneller Agentenkommunikationssprachen, etwa Standardisierung und definiertes Verhalten, in die heutige Umgebung von KI-Tools und LLM-Workflows überträgt. Obwohl MCP vor allem die Kommunikation zwischen Agenten und Tools fokussiert, standardisiert es einen großen Teil praktischer Agenteninteraktion.
Wo Agentenkommunikationsprotokolle eingesetzt werden
Agentenkommunikationsprotokolle klingen abstrakt, werden heute aber in vielen fortgeschrittenen KI- und Automatisierungssystemen genutzt. Die folgenden Beispiele zeigen typische Szenarien, in denen strukturierte Kommunikation zwischen Agenten hilfreich oder notwendig ist:
| Bereich oder Szenario | Wie Agentenkommunikation genutzt wird | Beispiele |
|---|---|---|
| Industrielle Automatisierung und Robotik | Mehrere Agenten, etwa Roboter oder Maschinen, koordinieren Aufgaben, verhandeln Verantwortlichkeiten und tauschen Statusinformationen aus. Standardprotokolle ermöglichen herstellerübergreifende Interoperabilität in Fabriken und Infrastruktursystemen. | FIPA ACL auf Plattformen wie JADE; industrielles Prozessmanagement; Smart-Grid- und Smart-City-Koordination; Überblick: |
| Verteilte KI und Webservices | Frühe Webservice-Orchestrierung nutzte Agentenkommunikationssprachen, damit intelligente Agenten Dienste semantisch entdecken und aufrufen konnten, statt nur rohe API-Aufrufe zu verwenden. | Registries wie UDDI, SOAP, REST und JSON |
| Kollaborative Multi-Agenten-Systeme | Agententeams koordinieren Rollen und Strategien über Nachrichtentypen, etwa indem sie andere über den Weltzustand informieren oder konkrete Aktionen für gemeinsame Entscheidungen anfordern. | RoboCup Soccer Simulation; dezentrales Verkehrsmanagement mit Fahrzeugen und Ampeln als Agenten |
| Moderne LLM-Agenten-Orchestrierung | Ein Agent kann planen, während ein anderer ausführt. Textbasierte Protokolle oder strukturierte Aufrufe übergeben Aufgaben und Ergebnisse zwischen Agenten. Tool-Nutzung wird über standardisierte Nachrichtenformate wie MCP gesteuert. | AutoGPT, GPT-Engineer, AutoGen |
| Agentenframeworks in Produkten | Produktive Assistenten können Verantwortlichkeiten auf interne Agenten verteilen, etwa Dialog-, Kalender- oder E-Mail-Agenten. Diese tauschen strukturierte Aktionsnachrichten aus, die von der Laufzeitumgebung ausgeführt werden. | LangChain Agents, LangGraph, JSON-ähnliche Action- und Observation-Formate |
| Plattformübergreifende Zusammenarbeit von KI-Agenten | Agenten verschiedener Anbieter können über gemeinsame Protokolle zusammenarbeiten, Aufgaben delegieren und individuelle Integrationslogik vermeiden. | Model Context Protocol für die Kommunikation mit externen Tools und anderen Agenten |
| Forschungssimulationen und Spiele | Agenten verhandeln, planen oder koordinieren sich innerhalb von Simulationen und Spielen. Natürlichsprachlicher Dialog kann mit internem Protokoll und Zustandsverfolgung kombiniert werden. | Meta CICERO, ein KI-Agent für Diplomacy, der natürlichsprachlichen Dialog mit interner Planung und Zustandsmanagement verbindet |
| Swarm AI und Multi-LLM-Schwärme | Viele leichtgewichtige Agenten tauschen einfache Signale aus. Strukturierte Gesprächsreihenfolgen und gemeinsamer Kontext können emergentes Verhalten erzeugen und Brainstorming oder Orchestrierung unterstützen. | OpenAI Swarm; Open-Source-Swarm-Frameworks für produktive Orchestrierung |
Herausforderungen von Agentenkommunikationsprotokollen
Agentenkommunikationsprotokolle schaffen Struktur, bringen aber auch Herausforderungen mit sich. Die folgende Tabelle verbindet typische Probleme mit praktischen Gestaltungsansätzen:
| Herausforderung | Warum sie wichtig ist | Gegenmaßnahmen und Designpraktiken |
|---|---|---|
| Fehlausrichtung und Semantik | Klassische Annahmen, etwa wahrheitsgemäßes oder rationales Verhalten in FIPA ACL, gelten in offenen Systemen oft nicht. Agenten können versehentlich oder absichtlich falsche oder irreführende Informationen senden, wodurch Absicht und Wahrheit schwer überprüfbar werden. | Agentenfähigkeiten einschränken; Tools über Berechtigungen absichern; menschliche Freigabe für kritische Aktionen verlangen; Verifikationsschritte wie Belege, Gegenprüfungen, Reputationswerte und Konsensprotokolle nutzen, bevor Fakten vertraut wird. |
| Sicherheit | Agenten können Aktionen anfordern. Ein bösartiger oder fehlerhafter Agent könnte schädliche Operationen auslösen, einschließlich prompt-injection-bezogener Effekte. Verteilte Umgebungen benötigen Authentifizierung, Autorisierung und sichere Übertragung. MCP kann Tool-Sichtbarkeit einschränken und ausdrückliche Nutzerfreigaben verlangen. | Sender authentifizieren; rollenbasierte Autorisierung anwenden; Kommunikationskanäle verschlüsseln; Agenten sandboxen; Nachrichten validieren und rate-limitieren; Größe und Form der Nutzlast prüfen, um Missbrauch wie Denial-of-Service durch übergroße Inhalte zu verhindern. |
| Overhead und Effizienz | Strukturierte Protokolle, etwa CFP zu propose zu accept zu inform, erhöhen Nachrichtenmenge und Latenz. Multi-Agenten-Systeme können deutlich mehr Tokens verbrauchen als Single-Turn-Ansätze. | Austauschgranularität optimieren; Nachrichten bündeln; Inhalte komprimieren; gemeinsamen Speicher statt wiederholtem Kontext nutzen; Ergebnisse streamen; Aufgaben parallelisieren, wenn es sicher möglich ist; alten Gesprächszustand bereinigen oder ablaufen lassen. |
| Komplexität und Fehlerbehandlung | Lange Gespräche benötigen Zustandsmanagement und Threading. Antworten müssen der richtigen Anfrage zugeordnet werden. Verpasste Nachrichten oder nicht spezifikationskonforme LLM-Ausgaben können die Koordination stören. | Conversation-IDs, in-reply-to-Felder und Deadlines verwenden; Wiederholungen, Backoff-Strategien und Alternativpläne implementieren; explizite Fehler- und Ausnahme-Nachrichten definieren; Wächterkomponenten hinzufügen, die nicht konforme Ausgaben sicher normalisieren oder weiterleiten. |
| Standardisierung versus Flexibilität | Universelle Protokolle können starr oder unnötig komplex wirken. Fachbereiche bevorzugen manchmal einfachere individuelle Formate. Fragmentierung zwischen Frameworks wie LangChain, AutoGen und Swarm bleibt ein Thema, und eine künftige Konvergenz ist nicht sicher. | Wo sinnvoll, einen Kernstandard wie JSON-Schemas oder MCP einsetzen und domänenspezifische Erweiterungen zulassen; Adapter und Brücken bereitstellen; Verträge versionieren; Ontologien dokumentieren; alte Formate schrittweise ablösen. |
| Beobachtbarkeit und Debugging | Wenn viele Agenten zahlreiche Nachrichten austauschen, werden Fehler schwer nachvollziehbar. Es kann unklar sein, welcher Agent nicht reagiert hat oder welche Nachricht das Problem verursacht hat. Strukturierte Protokolle erleichtern Instrumentierung, und MCP-Logs können Replay unterstützen. Einige Frameworks bieten außerdem Dashboards. | Jede Nachricht mit IDs und Zeitstempeln protokollieren; Tracing und visuelle Gesprächsverläufe ergänzen; Tool-Call-Transkripte erfassen; Kennzahlen wie Latenz und Fehlerrate pro Agent bereitstellen; Replay und Time-Travel-Debugging ermöglichen. |
| Sicherheit und Vertrauen zwischen Agenten | Agenten verschiedener Parteien benötigen möglicherweise Echtheitsprüfungen und Garantien zur Inhaltssicherheit. LLM-zu-LLM-Interaktionen können anfällig für Injection oder Täuschung sein. Vertrauen muss daher aufgebaut und erhalten werden. | Kryptografische Signaturen und Verifikation nutzen; Content-Filter und Constraint-Prompts anwenden; Zero-Trust-Standards verwenden; Informationen über mehrere Quellen validieren; Reputation oder Attestierung für Agenten nutzen; bei kritischen Fakten und Aktionen Quorum oder Konsens einsetzen. |
Beispiel für einen Nachrichtenaustausch zwischen Agenten
Um die bisher erläuterten Konzepte zusammenzuführen, betrachten wir ein einfaches Szenario mit zwei Agenten. Agent A agiert als Client, während Agent B Informationen bereitstellen kann. Agent A möchte die aktuelle Temperatur in Paris wissen, und Agent B ist in der Lage, diese Information zu liefern.
Mit einem traditionellen Kommunikationsprotokoll könnte Agent A eine Nachricht senden, deren Performativ auf request gesetzt ist und deren Inhalt sinngemäß „Temperatur für Paris bereitstellen“ lautet. Nach Empfang der Nachricht prüft Agent B, ob er die Anfrage erfüllen kann. Wenn ja, könnte er mit einem Performativ inform antworten und als Inhalt etwa „Temperatur in Paris beträgt 18 °C“ senden.
In einer FIPA-ACL-Darstellung könnte der Nachrichtenaustausch so aussehen:
Agent A → B: (request :sender A :receiver B :content “query-temperature(Paris)” :ontology Weather)
Agent B → A: (inform :sender B :receiver A :content “temperature(Paris,18)” :ontology Weather)
Dieses Beispiel zeigt die strukturierte Natur der Agentenkommunikation. Agent A sendet eine Anfrage und macht damit deutlich, dass eine Aktion erwartet wird. Agent B antwortet mit einer inform-Nachricht und signalisiert klar, dass die Nachricht eine Information enthält und keine Ablehnung, Frage oder alternative Antwort ist.
Verwendung von JSON-RPC und MCP
In einem modernen JSON-RPC-basierten Workflow mit MCP könnte Agent A ein Tool aufrufen, statt eine klassische ACL-Nachricht zu senden. Die Interaktion könnte so aussehen:
{“method”: “get_temperature”, “params”: {“city”: “Paris”}, “id”: 123}
Der MCP-Server, der praktisch die Rolle von Agent B übernimmt, verarbeitet die Anfrage und antwortet mit:
{“id”: 123, “result”: 18}
Agent A kann den zurückgegebenen Wert anschließend in seinen eigenen Denkprozess oder in eine nutzerorientierte Antwort einbeziehen. Obwohl sich der Kommunikationsmechanismus von ACL-basierter Nachrichtenübermittlung unterscheidet, bleibt das konzeptionelle Muster gleich: Eine Anfrage wird gestellt und eine Information wird zurückgegeben. Der Unterschied besteht darin, dass die Information als strukturierter RPC-Result-Wert eintrifft und nicht als explizites inform-Performativ.
Verwendung natürlicher Sprache zwischen LLM-Agenten
Kommunikation kann auch ohne formales Protokoll stattfinden. Zwei LLM-basierte Agenten können ausschließlich über natürliche Sprache interagieren. Zum Beispiel:
Agent A: “Do you know the current temperature in Paris?”
Agent B: “The temperature in Paris is approximately 18°C.”
Dieser Austausch ist für Menschen leicht verständlich und funktioniert, weil beide Modelle auf natürliche Sprache trainiert wurden. Anders als bei formalen Kommunikationsprotokollen gibt es jedoch keine expliziten Hinweise auf die Nachrichtenabsicht. Die Interpretation hängt vollständig von impliziter Semantik ab.
In strukturierten Kommunikationssystemen wird nichts dem Zufall oder der Andeutung überlassen. Nachrichtentypen, Erwartungen und Interaktionsregeln werden ausdrücklich festgelegt. Diese Klarheit wird mit zunehmender Komplexität der Systeme immer wichtiger.
Auch wenn diese Beispiele bewusst einfach gehalten sind, zeigen sie die verschiedenen Möglichkeiten, wie Agenten Informationen austauschen können. Sobald Systeme auf Dutzende zusammenarbeitende Agenten, komplexe Workflows und anspruchsvolle Tool-Integrationen erweitert werden, gewinnen Kommunikationsprotokolle deutlich an Bedeutung, um Zuverlässigkeit, Vorhersagbarkeit und Interoperabilität sicherzustellen.
Fazit
Agentenkommunikation ist zu einem grundlegenden Bestandteil moderner KI-Ökosysteme geworden. Sie ermöglicht autonomen Systemen, Informationen auszutauschen, Aktionen zu koordinieren und effektiv zusammenzuarbeiten. Ein erfolgreicher Ansatz kombiniert in der Regel strukturierte Nachrichtenformate wie JSON-Verträge oder MCP mit klar definierten Absichtsfeldern, die eine ähnliche Rolle erfüllen wie traditionelle FIPA-Performative.
Sicherheit und Zugriffskontrolle sollten von Beginn an Teil jeder Agentenarchitektur sein. Ebenso wichtig ist Beobachtbarkeit, einschließlich Nachrichtenkennungen, Tracing-Funktionen, Replay-Mechanismen und detaillierter Protokollierung. Diese Funktionen helfen Entwicklern zu verstehen, wie Agenten interagieren, und erleichtern die Diagnose von Fehlern.
Obwohl die ursprünglichen Konzepte aus Multi-Agenten-Systemen, KQML und FIPA ACL die Kommunikationssemantik weiterhin prägen, bieten moderne Frameworks wie LangGraph, AutoGen und Swarm praktische Möglichkeiten, diese Konzepte skalierbar umzusetzen.
Für Teams, die heute agentenbasierte Systeme entwickeln, empfiehlt sich ein pragmatischer Einstieg mit einer minimalen Struktur, die Eingaben, Ausgaben, Kennungen und Timeouts definiert. Darauf aufbauend kann die Kommunikation schrittweise zu strukturierteren Tool-Aufrufen und standardisierten Semantiken weiterentwickelt werden, die Interoperabilität zwischen autonomen Komponenten unterstützen.
Außerdem ist es wichtig, Kommunikationsaufwand wie Tokenverbrauch und Latenz zu messen und gleichzeitig Schutzmaßnahmen wie Sandboxing und Zugriffsbeschränkungen für potenziell unsichere Aktionen umzusetzen. Mit der Zeit können Systeme weiter verfeinert werden, um Randfälle, Fehlerszenarien und wachsende Komplexität besser zu bewältigen.
Ein Kommunikationsprotokoll muss nicht von Beginn an perfekt sein. Entscheidend ist, dass es autonomen Komponenten zuverlässig ermöglicht, zusammenzuarbeiten, Informationen effektiv auszutauschen und ihre Aktionen vorhersehbar zu koordinieren.


