Comparación y combinación de estrategias de optimización
Sugerencia
Consulte la pestaña Texto e imágenes para obtener más detalles.
Ahora que ha explorado por separado la ingeniería de solicitudes, la RAG y el ajuste preciso, veamos cómo se relacionan entre sí. Estas estrategias no son mutuamente excluyentes; son métodos complementarios que puede combinar para cumplir diferentes objetivos de optimización.
Descripción del espectro de optimización
Las tres estrategias de optimización abordan diferentes dimensiones del rendimiento del modelo:
- Optimizar para contexto: cuando el modelo carece de conocimientos específicos del dominio y desea maximizar la precisión de las respuestas. RAG soluciona esto recuperando datos relevantes de orígenes externos.
- Optimizar el modelo: si desea mejorar el formato de respuesta, el estilo o el tono maximizando la coherencia del comportamiento. El ajuste preciso aborda esto mediante el entrenamiento del modelo en ejemplos que muestran la salida deseada.
La ingeniería de solicitudes es la base que sostiene ambas direcciones. Usted usa la ingeniería de solicitudes para enseñar al modelo cómo comportarse y en qué centrarse, y, a continuación, la RAG o el ajuste preciso cuando la ingeniería de solicitudes por sí sola no es suficiente.
Comparación de estrategias
Cada estrategia tiene diferencias en términos de tiempo de implementación, complejidad, costo y lo que mejor hace:
| Estrategia | Tiempo de implementación | Complejidad | Cost | Más adecuado para |
|---|---|---|---|---|
| Ingeniería de las solicitudes | Low | Low | Bajo (solo por token) | Tono de guía, formato y comportamiento; iteración rápida; proporcionar instrucciones y ejemplos |
| RAG | Media | Media | Medio (infraestructura de búsqueda + almacenamiento + por token) | Precisión fáctica, conocimiento específico del dominio, datos dinámicos o que cambian con frecuencia |
| Ajuste preciso | Alto | Alto | Alto (cómputo de entrenamiento + alojamiento de modelos + coste por token) | Coherencia del comportamiento, aplicación de estilo, reducción de la longitud del mensaje, destilación del modelo |
Ventajas y desventajas de la ingeniería de solicitudes
La ingeniería de solicitudes es la estrategia de optimización más rápida y menos costosa. Puede iniciarse inmediatamente sin cambios en la infraestructura. Sin embargo, los mensajes más largos consumen más tokens por solicitud y es posible que el modelo no siempre siga instrucciones complejas de forma coherente. La ingeniería de solicitudes tampoco puede proporcionar al modelo acceso a la información en la que no se ha entrenado.
Desventajas de RAG
RAG proporciona al modelo datos actualizados y relevantes en el momento de realizar la consulta, lo que mejora significativamente la exactitud de los hechos. Sin embargo, requiere configurar un servicio de búsqueda, crear y mantener un índice y procesar embeddings. La calidad de las respuestas RAG depende de la calidad del índice de búsqueda y del nivel de fragmentación e indexación de los datos.
Ventajas y desventajas del ajuste preciso
El ajuste preciso produce un comportamiento más coherente del modelo porque los patrones deseados se integran en los pesos del modelo. También puede reducir los costos por solicitud acortando las indicaciones. Sin embargo, el ajuste preciso tiene la mayor inversión inicial: debe preparar los datos de entrenamiento, pagar por la computación para el entrenamiento y hospedar el modelo personalizado. Es posible que el modelo optimizado también tenga que volver a entrenarse cuando se actualice el modelo base o cuando cambien los requisitos.
Combinación de estrategias para obtener mejores resultados
Las aplicaciones de inteligencia artificial generativas más eficaces suelen usar varias estrategias juntas. Estas son combinaciones comunes:
Ingeniería de solicitudes + RAG
Esta es la combinación más común. Use la ingeniería rápida para definir el comportamiento del modelo (a través de mensajes del sistema e instrucciones) y RAG para proporcionar el contexto fáctico necesario para respuestas precisas. Por ejemplo:
- El mensaje del sistema indica al modelo que actúe como asesor de viajes y dé formato a las respuestas de forma específica.
- RAG recupera los detalles del catálogo de hoteles para que el modelo pueda responder con los nombres y precios reales de los hoteles.
Esta combinación aborda tanto cómo debe actuar el modelo como lo que el modelo necesita saber.
ingeniería de las solicitudes + ajuste preciso
Use esta combinación cuando necesite que el modelo siga de forma coherente un estilo o formato específicos. El modelo optimizado controla el comportamiento de línea base y el mensaje del sistema proporciona contexto adicional por conversación. Por ejemplo:
- El modelo con ajuste preciso está entrenado para responder siempre con el tono de voz de la marca de la agencia de viajes.
- El mensaje del sistema agrega instrucciones específicas de la sesión, como dar prioridad a una promoción estacional.
RAG + ajuste preciso
Combine estas estrategias cuando necesite un comportamiento coherente y de base fáctico. El modelo ajustado garantiza que el estilo de respuesta sea confiable, mientras que RAG proporciona los datos actuales específicos del dominio. Por ejemplo:
- El modelo ajustado genera respuestas en la voz de la marca de la agencia y en formato estructurado.
- RAG recupera precios y disponibilidad actualizados de hoteles del catálogo.
Las tres estrategias juntas
Para las aplicaciones más exigentes, puede usar la ingeniería de solicitudes, la RAG y un modelo de ajuste preciso en combinación. Cada capa controla una preocupación diferente:
- El ajuste preciso garantiza un estilo y un formato coherentes.
- RAG proporciona conocimientos actualizados y precisos del dominio.
- La ingeniería de solicitudes añade instrucciones y límites de protección específicos de la conversación.
Aplicación de un marco de decisión
Al decidir qué estrategias usar, inicie simple y agregue complejidad solo cuando sea necesario:
- Comience con la ingeniería de avisos: pruebe los mensajes del sistema, algunos ejemplos de capturas y el ajuste de parámetros. Evalúe si los resultados cumplen sus requisitos.
- Agregar RAG si la precisión es importante: si el modelo necesita access a datos específicos, actuales o privados para responder correctamente, implemente RAG con Búsqueda de Azure AI.
- Agregue ajuste preciso si la coherencia es importante: si el modelo no mantiene de forma confiable el estilo deseado, el tono o el formato a pesar de las indicaciones detalladas, ajuste el modelo con ejemplos representativos.
- Combinar según sea necesario: estrategias de capa basadas en los requisitos específicos de la aplicación. No todas las aplicaciones necesitan las tres.
Este enfoque incremental le ayuda a evitar costos y complejidad innecesarios, a la vez que garantiza que logra el nivel de optimización que requiere la aplicación.