Uso de la herramienta file_search
Sugerencia
Consulte la pestaña Texto e imágenes para obtener más detalles.
La herramienta file_search permite al modelo recuperar información relevante de sus propios documentos cargados durante una respuesta.
¿Cuál es la herramienta file_search?
La herramienta file_search ayuda a un modelo a responder preguntas mediante archivos privados o específicos del dominio, como documentos de directivas, manuales, contratos y bases de conocimiento internas. En lugar de confiar solo en datos de entrenamiento generales, el modelo puede buscar contenido de archivo indexado y devolver respuestas con base.
Esto resulta especialmente útil cuando se necesitan respuestas precisas de documentos internos de confianza.
Entre las características clave se incluyen:
- Respuestas basadas en documentos: las respuestas se basan en los archivos cargados.
- Recuperación semántica : busca pasajes relevantes por significado, no solo coincidencias exactas de palabra clave
- Integración del almacén de vectores : búsqueda en una o varias colecciones de documentos indexadas
- Citas y transparencia : incluir resultados coincidentes para la depuración y la rastreabilidad
- Mejor relevancia empresarial : uso de conocimientos específicos de la organización en las salidas del modelo
Casos de uso comunes
| Caso de uso | Ejemplo |
|---|---|
| Preguntas y respuestas sobre la política | Responder a preguntas de empleados sobre archivos PDF de políticas de RR. HH. |
| Asistentes de soporte técnico | Recuperar procedimiento de productos en las guías de solución de problemas internas |
| Revisión legal | Búsqueda de cláusulas específicas en documentos de contrato |
| Detección de conocimiento | Resumir respuestas de conjuntos de documentación técnica |
Un ejemplo sencillo
Este es un ejemplo mediante la API de respuestas de OpenAI con file_search habilitado:
from openai import OpenAI
client = OpenAI(
base_url={openai_endpoint},
api_key={auth_key_or_token}
)
# Create vector store and upload a file
vector_store = client.vector_stores.create(name="policy-docs")
client.vector_stores.files.upload_and_poll(
vector_store_id=vector_store.id,
file=open("expenses_policy.pdf", "rb")
)
# Get response using the file_search tool
response = client.responses.create(
model=model_deployment,
instructions="You are an AI assistant that provides information from HR policy documents.",
input="What's the maximum amount I can claim for a taxi ride?",
tools=[{
"type": "file_search",
"vector_store_ids": [vector_store.id]
}],
include=["file_search_call.results"]
)
print(response.output_text)
En este flujo, el modelo busca en el archivo de directiva indexada y usa los pasajes recuperados para generar una respuesta con base.
Funcionamiento de la herramienta file_search
El proceso general para usar la herramienta file_search es:
- Prepara archivos - Carga documentos en un almacén de vectores.
- Envías una solicitud - Incluye file_search en la matriz de herramientas con los identificadores de almacén de vectores.
- El modelo realiza la recuperación : busca fragmentos indexados para obtener contenido relevante.
- Se insertan resultados : los pasajes coincidentes se proporcionan al modelo.
- Respuesta generada - El modelo genera respuestas utilizando el contexto del documento recuperado.
procedimientos recomendados
- Uso de archivos de origen de alta calidad – Los documentos limpios y actuales mejoran la precisión de la recuperación
- Escribir avisos centrados : formular preguntas específicas para reducir las coincidencias ambiguas
- Delimitar con precisión el acceso de almacenes de vectores: separe dominios (RR.HH., asuntos jurídicos, finanzas) cuando le sea útil
- Incluir los datos recuperador en la fase de desarrollo: use parámetros de inclusión de respuestas para solucionar problemas
- Revisión de respuestas para flujos de trabajo críticos : mantener la validación humana en escenarios de alto riesgo
Limitaciones sobre las que conocer
- La calidad de la respuesta depende de la calidad, la cobertura y la relevancia de los fragmentos de documentos.
- Los almacenes de dominios muy grandes o mixtos pueden devolver un contexto menos centrado
- Es posible que los archivos de origen actualizados requieran volver a indexar antes de que se pueda buscar contenido nuevo.
- La recuperación mejora el contexto, pero no reemplaza la revisión humana para tomar decisiones delicadas.
Si se utiliza correctamente, file_search convierte un modelo de uso general en un asistente con reconocimiento de dominio que puede responder utilizando los documentos que el equipo realmente utiliza.
Note
La herramienta file_search es una excelente manera de establecer un modelo en un conjunto específico de documentos o archivos de datos. Sin embargo, para los agentes a escala empresarial que necesitan acceder a grandes cantidades de datos en varios almacenes de datos, debe considerar el uso de la solución foundry IQ knowledge store con un agente de Microsoft Foundry. Para más información, consulte Creación de agentes de inteligencia artificial mejorados con Foundry IQ.