Uso de la herramienta file_search

5 minutos

Sugerencia

Consulte la pestaña Texto e imágenes para obtener más detalles.

La herramienta file_search permite al modelo recuperar información relevante de sus propios documentos cargados durante una respuesta.

¿Cuál es la herramienta file_search?

La herramienta file_search ayuda a un modelo a responder preguntas mediante archivos privados o específicos del dominio, como documentos de directivas, manuales, contratos y bases de conocimiento internas. En lugar de confiar solo en datos de entrenamiento generales, el modelo puede buscar contenido de archivo indexado y devolver respuestas con base.

Esto resulta especialmente útil cuando se necesitan respuestas precisas de documentos internos de confianza.

Entre las características clave se incluyen:

Respuestas basadas en documentos: las respuestas se basan en los archivos cargados.
Recuperación semántica : busca pasajes relevantes por significado, no solo coincidencias exactas de palabra clave
Integración del almacén de vectores : búsqueda en una o varias colecciones de documentos indexadas
Citas y transparencia : incluir resultados coincidentes para la depuración y la rastreabilidad
Mejor relevancia empresarial : uso de conocimientos específicos de la organización en las salidas del modelo

Casos de uso comunes

Caso de uso	Ejemplo
Preguntas y respuestas sobre la política	Responder a preguntas de empleados sobre archivos PDF de políticas de RR. HH.
Asistentes de soporte técnico	Recuperar procedimiento de productos en las guías de solución de problemas internas
Revisión legal	Búsqueda de cláusulas específicas en documentos de contrato
Detección de conocimiento	Resumir respuestas de conjuntos de documentación técnica

Un ejemplo sencillo

Este es un ejemplo mediante la API de respuestas de OpenAI con file_search habilitado:

from openai import OpenAI

client = OpenAI(
    base_url={openai_endpoint},
    api_key={auth_key_or_token}
)

# Create vector store and upload a file
vector_store = client.vector_stores.create(name="policy-docs")
client.vector_stores.files.upload_and_poll(
    vector_store_id=vector_store.id,
    file=open("expenses_policy.pdf", "rb")
)

# Get response using the file_search tool
response = client.responses.create(
    model=model_deployment,
    instructions="You are an AI assistant that provides information from HR policy documents.",
    input="What's the maximum amount I can claim for a taxi ride?",
    tools=[{
        "type": "file_search",
        "vector_store_ids": [vector_store.id]
    }],
    include=["file_search_call.results"]
)
print(response.output_text)

En este flujo, el modelo busca en el archivo de directiva indexada y usa los pasajes recuperados para generar una respuesta con base.

Funcionamiento de la herramienta file_search

El proceso general para usar la herramienta file_search es:

Prepara archivos - Carga documentos en un almacén de vectores.
Envías una solicitud - Incluye file_search en la matriz de herramientas con los identificadores de almacén de vectores.
El modelo realiza la recuperación : busca fragmentos indexados para obtener contenido relevante.
Se insertan resultados : los pasajes coincidentes se proporcionan al modelo.
Respuesta generada - El modelo genera respuestas utilizando el contexto del documento recuperado.

procedimientos recomendados

Uso de archivos de origen de alta calidad – Los documentos limpios y actuales mejoran la precisión de la recuperación
Escribir avisos centrados : formular preguntas específicas para reducir las coincidencias ambiguas
Delimitar con precisión el acceso de almacenes de vectores: separe dominios (RR.HH., asuntos jurídicos, finanzas) cuando le sea útil
Incluir los datos recuperador en la fase de desarrollo: use parámetros de inclusión de respuestas para solucionar problemas
Revisión de respuestas para flujos de trabajo críticos : mantener la validación humana en escenarios de alto riesgo

Limitaciones sobre las que conocer

La calidad de la respuesta depende de la calidad, la cobertura y la relevancia de los fragmentos de documentos.
Los almacenes de dominios muy grandes o mixtos pueden devolver un contexto menos centrado
Es posible que los archivos de origen actualizados requieran volver a indexar antes de que se pueda buscar contenido nuevo.
La recuperación mejora el contexto, pero no reemplaza la revisión humana para tomar decisiones delicadas.

Si se utiliza correctamente, file_search convierte un modelo de uso general en un asistente con reconocimiento de dominio que puede responder utilizando los documentos que el equipo realmente utiliza.

Note

La herramienta file_search es una excelente manera de establecer un modelo en un conjunto específico de documentos o archivos de datos. Sin embargo, para los agentes a escala empresarial que necesitan acceder a grandes cantidades de datos en varios almacenes de datos, debe considerar el uso de la solución foundry IQ knowledge store con un agente de Microsoft Foundry. Para más información, consulte Creación de agentes de inteligencia artificial mejorados con Foundry IQ.

Comentarios

¿Le ha resultado útil esta página?