Übersicht über das MCP-Tool

Wichtig

Windows 365 für Agents befindet sich in der öffentlichen Vorschauphase. Das Feature befindet sich in der aktiven Entwicklung und kann sich vor der allgemeinen Verfügbarkeit ändern.

Windows 365 für Agents macht Funktionen über zwei sich ergänzende Oberflächen verfügbar, die dem Lebenszyklus der Agentsitzung zugeordnet sind:

  • Microsoft Graph-APIs für die Verwaltung und Sitzungsverwaltung. IT-Administratoren, Agent-Entwickler und Partneranwendungen verwenden diese APIs, um die Kapazität zu steuern.
  • MCP-Tools (Model Context Protocol) für sitzungsinterne Vorgänge. KI-Agents rufen diese Tools während einer Livesitzung auf. Für die Bildschirmfreigabe ruft eine Partner-App sie im Namen eines Menschen auf.

Zusammen decken diese Oberflächen die Bereitstellung des Pools, den Erwerb eines Cloud-PCs, die Ausführung von Arbeiten und das Beobachten oder Unterstützen bei Bedarf ab.

Aufseiten von Microsoft Graph-API verwendet die Computer-Create die W365A-Graph-API und das W365-Verwaltungsportal. Über diese Oberflächen können Administratoren und unabhängige Softwarehersteller (INDEPENDENT Software Vendors, ISVs) folgende Möglichkeiten haben:

  • Bereitstellen von Cloud-PC-Agent-Pools.
  • Konfigurieren sie Richtlinien und Images.
  • Vertrauenswürdige Partneranrufer registrieren.
  • Anzahl von Skalierungspools.
  • Fügen Sie die Messung über die MAC-Abrechnung an.

Die Computer-Get-Ebene ist eine kleine Laufzeitsteuerungsoberfläche für Partneranwendungen:

  • Ein Checkout-Aufruf reserviert einen Cloud-PC und gibt die Sitzungsidentität und die Verbindungs-URLs zurück.
  • Ein Checkin-Aufruf gibt die Sitzung frei und gibt den Cloud-PC an den Pool zurück.

Das Auschecken ist idempotent, sodass Wiederholungen keine doppelten Sitzungen zuordnen.

Nachdem die Partneranwendung einen Cloud-PC erworben hat, verwenden Agents MCP-Tools, um ihn zu betreiben. Diese Tools folgen dem offenen Modellkontextprotokoll, sodass jeder Agent, der das Protokoll unterstützt, Tools ohne benutzerdefinierte Integration ermitteln und aufrufen kann.

Computer-Do ist die primäre Ebene für sitzungsinterne Arbeit. Der Agent ruft eine Reihe integrierter Tools auf, um den Cloud-PC zu steuern. Diese Tools decken Folgendes ab:

  • Desktopinteraktion, einschließlich Maus, Tastatur und Screenshotaufnahme.
  • Fensterverwaltung.
  • Befehlsausführung.

Es sind weitere Funktionen zur Browserautomatisierung und zur Barrierefreiheit der Benutzeroberfläche verfügbar oder geplant, die das, was ein Agent innerhalb der Sitzung zuverlässig tun kann, erweitern.

Für die menschliche Überwachung verwendet die Partneranwendung Computer-See, um die gleiche Cloud-PC-Sitzung, die der Agent verwendet, zu beobachten und optional gemeinsam zu steuern. Die Bildschirmfreigabe unterstützt das Starten und Beenden einer Echtzeitfreigabe, das Übergeben der Maus- und Tastatursteuerung an einen Menschen und das Zurückgeben der Steuerung an den Agent.

Medien- und Geräteumleitung über den Remotedesktopstapel: Azure Virtual Desktop und Remotedesktopprotokoll (RDP) mit IC3-Medien. Dieser Stapel bietet eine Anzeige- und Steuerungserfahrung, die mit einer Standardmäßigen Remotedesktopsitzung vergleichbar ist, während der Agent weiterhin im gleichen Sitzungskontext ausgeführt wird.

Surface Ebene Endpunkte Aufgerufen von Zweck
Graph-API Computer-Create W365A-Graph-API und W365-Verwaltungsportal IT-Administrator oder ISV Strukturieren und Verwalten des Pools.
Graph-API Computer-Get Sitzungen (Auschecken) Partneranwendung Reservieren sie einen Cloud-PC.
Graph-API Computer-Get {sessionId} (Einchecken) Partneranwendung Geben Sie den Cloud-PC frei.
MCP Computer-Do MCP KI-Agent Betreiben sie den Cloud-PC.
MCP Computer-See, Computer-TakeControl screenshare (Start, Stop, TakeControl, ReleaseControl) Partner-App im Namen eines Menschen Beobachten und gemeinsam fahren.

Wie sie zusammenpassen

Die beiden Oberflächen funktionieren nacheinander, mit einer klaren Übergabe zwischen den Anrufern:

  1. Administratoren und Agent-Ersteller verwenden Computer-Create, um den Pool bereitzustellen.
  2. Die Partneranwendung ruft Checkout auf Computer-Get auf, um einen Cloud-PC für eine bestimmte Agent-Arbeit zu reservieren.
  3. Der KI-Agent steuert den Cloud-PC über die Windows 365 Computer-Use MCP-Tools. Die meisten Aufrufe durchlaufen diese Ebene.
  4. Bei Bedarf öffnet die Partneranwendung Computer-See im Namen eines Menschen, der beobachtet oder übernommen werden kann.
  5. Die Partneranwendung ruft Checkin auf Computer-Get auf, um den Cloud-PC freizugeben, wenn die Arbeit abgeschlossen ist.

Nächste Schritte