Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El SDK de agentes de Microsoft 365 es un marco de desarrollo para crear agentes conversacionales. Los agentes conversacionales son software que pueden recibir mensajes de los usuarios, procesarlos y responder. Piense en ella como la capa de fontanería entre un usuario que envía un mensaje (ya sea en Teams, un sitio web, Slack o en otro lugar) y cualquier lógica que haya creado para responder a ese mensaje.
El SDK controla la mecánica de recibir y enviar mensajes a través de diferentes superficies, por lo que los desarrolladores pueden centrarse en lo que realmente hace el agente en lugar de en protocolos de comunicación de bajo nivel.
Idiomas compatibles
El SDK de agentes admite:
- C# mediante el SDK de .NET 8.0
- JavaScript con Node.js versión 18 y posteriores
- Python usando las versiones 3.9 a 3.11
Tres problemas que resuelve el SDK de agentes
El agente debe trabajar en más de un lugar. Los usuarios no se comunican a través del mismo canal. Algunos usan Microsoft Teams, algunos usan Microsoft 365 Copilot, algunos usan un sitio web de la empresa y algunos usan herramientas que no Microsoft como Slack o Facebook Messenger. Sin un marco, un desarrollador debe escribir código de integración independiente para cada una de esas superficies, cada una con su propio formato de mensaje, esquema de autenticación y protocolo de conexión.
El SDK proporciona una capa de abstracción de canal. La lógica del agente se escribe una vez y el SDK traduce los mensajes entrantes y salientes al formato que espera cada canal. Agregar un nuevo canal no requiere volver a escribir el comportamiento principal del agente.
No quiere quedar atrapado en un solo servicio de inteligencia artificial. La elección de qué servicio de inteligencia artificial impulsa a un agente, tanto si es Fundición de IA de Azure, OpenAI, Kernel semántico o algo más completamente, cambia con frecuencia a medida que evoluciona el panorama y a medida que surgen diferentes casos de uso. Un framework de agente que integra un proveedor específico de inteligencia artificial obliga a los desarrolladores a reescribir grandes partes de su código cuando esa elección cambia.
El SDK es independiente de la inteligencia artificial por diseño. Proporciona la estructura para recibir mensajes, administrar el estado y enrutar eventos, pero no hace suposiciones sobre qué genera la respuesta. Los desarrolladores conectan cualquier servicio de inteligencia artificial o bibliotecas de orquestación que prefieran. El SDK no interfiere en esa elección.
Manejar el estado de la conversación es complicado. Las conversaciones no son sin estado. Un usuario puede formular una pregunta de seguimiento, hacer referencia a algo que se ha dicho hace dos turnos, o abandonar una conversación y reanudarla más adelante. Administrar ese contexto, incluido el seguimiento de lo que ha ocurrido, dónde se almacena y cómo fluye entre los mensajes, es tedioso y propenso a errores para compilar desde cero.
El SDK proporciona administración de almacenamiento y estado integrada. Presenta el concepto de un turno (una sola unidad de trabajo en una conversación) y realiza un seguimiento del estado en turnos sin necesidad de que los desarrolladores conecten su propia capa de persistencia. Esto significa menos código reutilizable y menos errores en la lógica de flujo de conversación.
Cómo encaja entre sí
En su núcleo, el SDK realiza tres cosas cuando llega un mensaje:
Recibe el mensaje de cualquier canal enviado (Teams, chat web, Slack, etc.) y lo normaliza en un formato común denominado
Activity.Enruta la actividad al controlador adecuado en el código del agente. Por ejemplo, una actividad de mensaje desencadena un controlador, un usuario que se une a una conversación desencadena otro.
Devuelve la respuesta a través del mismo canal, lo que convierte la respuesta en el formato que espera ese canal.
Los desarrolladores escriben controladores para los tipos de actividad que les importan. El SDK controla todo lo demás, incluida la autenticación, la traducción de formato de mensaje y la conectividad del canal.
Lo que no es el SDK de agentes
El SDK de agentes no es un modelo de IA, un sistema de orquestación ni una plataforma sin código. El SDK de agentes no decide lo que dice un agente. Estos elementos son el trabajo de cualquier servicio de inteligencia artificial o lógica de negocios que el desarrollador conecte al agente. El SDK de Agentes es la plataforma que lleva mensajes hacia y desde esa lógica de forma confiable, a través de canales, con el estado conversacional intacto.
Pasos siguientes
- Más información sobre el protocolo de actividad
- Más información sobre AgentApplication
- Inicio rápido: Creación y prueba de un agente básico