Configuración de orígenes de datos para bases de conocimiento

Completado

La base de conocimiento solo es tan buena como los datos que contiene. Foundry IQ le permite conectarse a varios orígenes de datos, lo que permite al agente de inteligencia artificial acceder a la información que necesita para responder a preguntas con precisión. Estos orígenes se configuran al configurar la base de conocimiento, lo que garantiza que el agente tenga el contexto adecuado para su caso de uso específico.

Comprender qué origen de datos usar depende de dónde residen los datos y de cómo necesita acceder a ellos. Foundry IQ admite seis tipos de origen de datos principales:

Origen de datos Tipo de acceso Mejor para
Índice de Azure AI Search .Indexado Búsqueda empresarial con canalizaciones personalizadas
Azure Blob Storage (Servicio de almacenamiento de blobs de Azure) Directo Archivos de documento en Azure Storage
La web Tiempo real Información pública actual a través de Bing
SharePoint (remoto) Tiempo real Contenido de Live SharePoint con gobernanza de Microsoft 365
SharePoint (indexado) .Indexado Búsqueda avanzada en SharePoint con canalizaciones personalizadas
OneLake Directo Datos no estructurados en Microsoft Fabric

Con las fuentes en tiempo real, obtiene información actual. Con orígenes de datos internos como SharePoint o OneLake, mantiene la seguridad y la gobernanza al tiempo que proporciona al agente acceso a conocimientos propietarios.

Índice de Azure AI Search

Azure AI Search Index proporciona funcionalidades de búsqueda a escala empresarial para la base de conocimiento de Foundry IQ. Esta opción es ideal cuando ya ha invertido en Azure AI Search y quiere usar índices de búsqueda existentes.

Con este origen, se conecta directamente al índice de Azure AI Search, que puede contener datos de varios orígenes que ya ha procesado e indexado. Esto resulta especialmente importante cuando necesita funcionalidades de búsqueda sofisticadas, como la clasificación semántica, los filtros o los perfiles de puntuación personalizados que proporciona Azure AI Search.

Sugerencia

Obtenga más información sobre Azure AI Search y cómo crear y administrar índices de búsqueda para las bases de conocimiento.

El agente puede consultar este índice para recuperar información relevante en función de las preguntas del usuario. Entre las ventajas clave se incluyen las siguientes:

  • Clasificación semántica : busca resultados contextualmente relevantes, no solo coincidencias de palabras clave
  • Puntuación personalizada : prioriza los resultados en función de la lógica de negocios.
  • Navegación por facetas : filtra los resultados por categorías o atributos
  • Compatibilidad con varios idiomas : controla el contenido en diferentes idiomas

Azure Blob Storage (Servicio de almacenamiento de blobs de Azure)

Azure Blob Storage permite recuperar documentos y archivos directamente desde los contenedores de blobs. Seleccione contenedores o blobs específicos y Foundry IQ procesa el contenido para que esté disponible para el agente.

Este origen funciona bien al almacenar documentos en Azure Blob Storage. Entre los tipos de archivo comunes se incluyen:

  • Documentos PDF
  • Archivos de Microsoft Word (.docx)
  • Archivos de texto (.txt)
  • Archivos Markdown (.md)
  • Archivos HTML

Nota:

A diferencia de Azure AI Search, que requiere compilar y mantener un índice, Blob Storage proporciona una ruta de acceso más directa desde los archivos a la base de conocimiento.

Basándose en este concepto, puede organizar los blobs en contenedores en función de temas o niveles de acceso, lo que facilita la administración de la información a la que puede acceder el agente. Esta organización ayuda a mantener la gobernanza de datos mientras mantiene la base de conocimiento actualizada.

La web

El acceso web proporciona a su agente contenido en tiempo real desde internet a través de Bing. En lugar de confiar solo en datos estáticos e internos, el agente puede buscar información actual al responder a preguntas.

Esto se vuelve especialmente importante cuando los usuarios preguntan sobre:

  • Recientes eventos o noticias
  • Precios o disponibilidad actuales
  • Información que cambia con frecuencia
  • Temas fuera de la base de conocimiento interna

Importante

Con el soporte en la web, te basas en los resultados de búsqueda de Bing, lo que significa menos control sobre las fuentes específicas a las que tu agente hace referencia. Cuando la precisión y la comprobación de origen son críticas, considere la posibilidad de usar orígenes de datos indexados y controlados en su lugar.

Sugerencia

Puede combinar la fundamentación web con fuentes de datos internas, utilizando el acceso web como fuente complementaria cuando el conocimiento interno no proporcione una respuesta.

Opciones de Microsoft SharePoint

Foundry IQ proporciona dos maneras de conectarse a SharePoint, cada una con ventajas distintas. En la tabla siguiente se comparan estos enfoques:

Característica Remote .Indexado
Método de acceso Consultas en tiempo real Índice preprocesado
Tiempo de respuesta Depende de SharePoint Más rápido
Mantenimiento No hay índice que mantener Requiere actualizaciones de índice
Búsqueda avanzada Limitado Funcionalidades completas de Azure AI Search
Actualización de datos Siempre actual Depende de la programación de indexación
Control de permisos Respeta los permisos de SharePoint Configurado durante la indexación

SharePoint Remote

SharePoint Remote proporciona funcionalidades de búsqueda con gobernanza de Microsoft 365, recuperando contenido directamente desde SharePoint sin indizar previamente. El agente busca en sitios y bibliotecas de SharePoint en tiempo real cuando los usuarios hacen preguntas.

Ventajas clave del acceso remoto:

  • No se requiere mantenimiento de índices
  • Siempre tiene acceso al contenido actual de SharePoint
  • Respeta automáticamente los permisos existentes de SharePoint
  • Configuración y configuración más sencillas

Sugerencia

Use SharePoint Remote cuando necesite la ruta de acceso más sencilla a los datos de SharePoint y no requiera características de búsqueda avanzadas.

SharePoint Indexado

SharePoint Indexed toma un enfoque diferente mediante la indexación de contenido de SharePoint en Azure AI Search para canalizaciones personalizadas. A diferencia del acceso remoto, que consulta SharePoint en tiempo real, la indexación procesa el contenido de SharePoint de antemano.

Este preprocesamiento significa tiempos de respuesta más rápidos y funcionalidades de búsqueda más sofisticadas. Con el contenido indexado, puede hacer lo siguiente:

  1. Aplicación de analizadores personalizados para terminología especializada
  2. Creación de canalizaciones de enriquecimiento con servicios de INTELIGENCIA ARTIFICIAL
  3. Combinar datos de SharePoint con otros orígenes
  4. Creación de experiencias de búsqueda especializadas

Nota:

SharePoint indexado funciona mejor cuando se necesitan características de búsqueda avanzadas o cuando se integran datos de SharePoint con otros orígenes en el índice de Azure AI Search.

Microsoft OneLake

Microsoft OneLake proporciona acceso a datos no estructurados almacenados en su instancia de Data Lakehouse de Microsoft Fabric. Se conecta a OneLake para recuperar archivos y documentos almacenados en lakehouse, lo que hace que estos datos estén disponibles para la base de conocimiento.

Sugerencia

Obtenga más información sobre Microsoft Fabric OneLake y cómo actúa como un lago de datos unificado para su organización.

Esta opción es importante cuando su organización usa Microsoft Fabric para el análisis de datos y el almacenamiento. Entre los casos de uso comunes se incluyen:

  • Informes de Business Intelligence : hacer referencia a los resultados analíticos en las respuestas del agente
  • Documentación de datos : proporcionar contexto sobre conjuntos de datos y métricas
  • Conclusiones analíticas : compartir información del trabajo de ciencia de datos
  • Resultados de investigación : hacer que la investigación sea accesible a través de la inteligencia artificial conversacional

Con esta conexión, el agente puede hacer referencia a esta información al responder a preguntas empresariales, proporcionando respuestas controladas por datos basadas en el trabajo analítico de la organización.

Elección del origen de datos correcto

La selección del origen de datos adecuado depende de varios factores. Use esta guía de decisión:

Si los datos son... Y necesitas... Elija...
En SharePoint Configuración sencilla, siempre actual SharePoint Remote
En SharePoint Búsqueda avanzada, canalizaciones personalizadas SharePoint Indexado
Archivos en Azure Acceso directo a archivos Azure Blob Storage (Servicio de almacenamiento de blobs de Azure)
En Microsoft Fabric Contenido de Data Lakehouse OneLake
Ya indizado Inversión existente en Azure AI Search Índice de Azure AI Search
Información pública y actual Contenido web en tiempo real La web

Importante

Puede combinar varios orígenes en una sola base de conocimiento. Por ejemplo, use datos internos de SharePoint como base de conocimiento principal al habilitar la base de conocimiento web para eventos actuales o información complementaria.