Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Solo se aplica a:portal Foundry (clásico). Este artículo no está disponible para el nuevo portal de Foundry.
Obtenga más información sobre el nuevo portal.
Nota
Los vínculos de este artículo pueden abrir contenido en la nueva documentación de Microsoft Foundry en lugar de la documentación de Foundry (clásico) que está viendo ahora.
Importante
Los elementos marcados (versión preliminar) de este artículo se encuentran actualmente en versión preliminar pública. Esta versión preliminar se proporciona sin un contrato de nivel de servicio y no se recomienda para cargas de trabajo de producción. Es posible que algunas características no se admitan o que tengan funcionalidades restringidas. Para obtener más información, vea Supplemental Terms of Use for Microsoft Azure Previews.
Aprenda a ajustar finamente e implementar modelos utilizando computación gestionada en Microsoft Foundry. Ajuste los parámetros de entrenamiento (velocidad de aprendizaje, tamaño de lote y épocas) para optimizar el rendimiento.
Ajustar un modelo entrenado previamente para una tarea relacionada es más eficaz que entrenar un nuevo modelo desde cero.
Utiliza la configuración de ajuste fino en el portal para configurar datos, computación e hiperparámetros. Una vez completado el entrenamiento, puede evaluar e implementar el modelo resultante.
En este artículo, aprenderá a:
- Seleccione un modelo de base.
- Configure las divisiones de proceso y de datos.
- Ajuste los hiperparámetros de forma segura.
- Envíe y supervise un trabajo de ajuste.
- Evalúe e implemente el modelo optimizado.
Requisitos previos
Importante
En este artículo se proporciona soporte heredado para proyectos basados en concentradores. No funcionará para proyectos de Foundry. Vea ¿Cómo sé qué tipo de proyecto tengo?
SDK nota de compatibilidad: Los ejemplos de código requieren una versión específica del SDK de Microsoft Foundry. Si encuentra problemas de compatibilidad, considere migrar de un proyecto basado en hub a un proyecto Foundry.
- Una cuenta de Azure con una suscripción activa. Si no tiene una, cree una cuenta de free Azure, que incluye una suscripción de evaluación gratuita.
- Si no tiene uno, cree un proyecto basado en hub.
- Los controles de acceso basados en roles de Azure (Azure RBAC) se utilizan para conceder acceso a las operaciones en el portal de Foundry. Para realizar los pasos descritos en este artículo, se debe asignar a la cuenta de usuario el rol owner o contributor para la suscripción de Azure. Para obtener más información sobre los permisos, consulte Control de acceso basado en roles en el portal de Foundry.
Ajuste fino de un modelo fundacional mediante cómputo administrado
Propina
Dado que puede customizar el panel izquierdo en el portal de Microsoft Foundry, es posible que vea elementos diferentes de los que se muestran en estos pasos. Si no ve lo que busca, seleccione ... Más en la parte inferior del panel izquierdo.
-
Inicie sesión en Microsoft Foundry. Asegúrese de que el interruptor New Foundry está desactivado. Estos pasos hacen referencia a Foundry (clásico).
Si aún no estás en tu proyecto, selecciónalo.
Seleccione Ajuste preciso en el panel izquierdo.
- Seleccione Ajustar un modelo y agregue el modelo que desea ajustar. En este artículo se usa Phi-3-mini-4k-instruct para la ilustración.
- Seleccione Siguiente para ver las opciones de ajuste disponibles. Algunos modelos fundamentales solo admiten la opción Proceso administrado .
Como alternativa, puede seleccionar Catálogo de modelos en la barra lateral izquierda del proyecto y buscar la tarjeta de modelo del modelo de base que desea ajustar.
- Seleccione Ajustar en la tarjeta de modelo para ver las opciones de ajuste disponibles. Algunos modelos fundamentales solo admiten la opción Proceso administrado .
Seleccione Computación gestionada. Se abrirá Configuración básica.
Configuración de opciones de ajuste
En esta sección, se describen los pasos para ajustar finamente su modelo utilizando una computación gestionada.
Proporcione un nombre de modelo (por ejemplo,
phi3mini-faq-v1). Seleccione Siguiente para el Calcular.Seleccione un tamaño de máquina virtual de GPU. Asegúrese de la cuota de la SKU elegida.
Seleccione Siguiente para Datos de entrenamiento. El tipo de tarea puede ser preestablecido (por ejemplo, Finalización del chat).
Proporcione datos de entrenamiento (cargue JSONL/CSV/TSV o seleccione un conjunto de datos registrado). Ejemplos de equilibrio para reducir el sesgo.
Seleccione Siguiente para Datos de validación. Mantenga división automática o proporcione un conjunto de datos independiente.
Seleccione Siguiente para parámetros de tarea. Ajuste las épocas, la velocidad de aprendizaje y el tamaño del lote. Comienza de manera conservadora; itera según las métricas de validación.
Seleccione Siguiente para Revisar. Confirme recuentos y parámetros.
Seleccione Enviar para iniciar el trabajo.
Supervisión y evaluación
- Realice un seguimiento del estado del trabajo en la lista de trabajos de ajuste.
- Revise los registros para ver si hay problemas de preprocesamiento o asignación.
- Después de la finalización, vea las métricas de evaluación generadas (si están habilitadas) o ejecute una evaluación independiente que compare el modelo base frente a un modelo optimizado.
Implementación del modelo optimizado
Implemente desde el resumen del trabajo. Use un nombre de implementación como faq-v1. Registre la versión del modelo y el hash del conjunto de datos para la reproducibilidad. Agregue seguimiento para supervisar las solicitudes reales.
Solución de problemas
| Problema | Causa | Acción |
|---|---|---|
| Bloqueado en cola | Capacidad insuficiente de GPU | Pruebe una SKU o región alternativa. |
| Sobreajuste rápido | Demasiadas épocas o conjuntos de datos pequeños | Reducción de épocas o expansión de datos |
| Ninguna mejora de métricas | Ruido del conjunto de datos o objetivo desalineado | Refinar la selección de etiquetas o métricas |
| Mayor latencia después de la implementación | Mayor tamaño del modelo base / sobrecarga de adaptador | Considere la posibilidad de un modelo base más pequeño o ajuste del tamaño del lote |