Konfigurieren von Datenquellen für Wissensdatenbanken

Abgeschlossen

Ihre Wissensdatenbank ist nur so gut wie die darin enthaltenen Daten. Foundry IQ ermöglicht Es Ihnen, eine Verbindung mit mehreren Datenquellen herzustellen, sodass Ihr KI-Agent auf die Benötigten Informationen zugreifen kann, um Fragen genau zu beantworten. Sie konfigurieren diese Quellen, wenn Sie Ihre Knowledge Base einrichten, um sicherzustellen, dass Ihr Agent über den richtigen Kontext für Ihren spezifischen Anwendungsfall verfügt.

Das Verständnis der zu verwendenden Datenquelle hängt davon ab, wo Sich Ihre Daten befinden und wie Sie darauf zugreifen müssen. Foundry IQ unterstützt sechs primäre Datenquellentypen:

Datenquelle Zugriffstyp Am besten geeignet für
Azure AI Search-Index Indiziert Unternehmenssuche mit benutzerdefinierten Pipelines
Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten) Direkt Dokumentdateien in Azure Storage
das Internet Echtzeit Aktuelle, öffentliche Informationen über Bing
SharePoint (Remote) Echtzeit Live-SharePoint-Inhalte mit Microsoft 365-Governance
SharePoint (Indexiert) Indiziert Erweiterte Suche in SharePoint mit benutzerdefinierten Pipelines
OneLake Direkt Unstrukturierte Daten in Microsoft Fabric

Mit Echtzeitquellen erhalten Sie aktuelle Informationen. Mit internen Datenquellen wie SharePoint oder OneLake verwalten Sie Sicherheit und Governance, während Sie Ihrem Agent Zugriff auf proprietäre Kenntnisse gewähren.

Azure AI Search-Index

Der Azure AI Search-Index bietet Suchfunktionen im Unternehmensmaßstab für Ihre Findry IQ-Wissensbasis. Diese Option ist ideal, wenn Sie bereits in Azure AI Search investiert und vorhandene Suchindizes verwenden möchten.

Mit dieser Quelle stellen Sie eine direkte Verbindung mit Ihrem Azure AI Search-Index her, der Daten aus mehreren Ursprüngen enthalten kann, die Sie bereits verarbeitet und indiziert haben. Dies ist besonders wichtig, wenn Sie anspruchsvolle Suchfunktionen wie semantische Rangfolge, Filter oder benutzerdefinierte Bewertungsprofile benötigen, die Azure AI Search bereitstellt.

Tipp

Erfahren Sie mehr über Azure AI Search und wie Sie Suchindizes für Ihre Wissensdatenbanken erstellen und verwalten.

Ihr Agent kann diesen Index abfragen, um relevante Informationen basierend auf Benutzerfragen abzurufen. Zu den wichtigsten Vorteilen gehören:

  • Semantische Rangfolge – findet kontextbezogene Ergebnisse, nicht nur Stichwort-Übereinstimmungen
  • Benutzerdefinierte Bewertung – Priorisiert Ergebnisse basierend auf Ihrer Geschäftslogik
  • Faceted navigation – Filtert Ergebnisse nach Kategorien oder Attributen
  • Unterstützung für mehrere Sprachen – Behandelt Inhalte in verschiedenen Sprachen

Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten)

Mit Azure Blob Storage können Sie Dokumente und Dateien direkt aus Ihren BLOB-Containern abrufen. Sie wählen bestimmte Container oder Blobs aus, und Foundry IQ verarbeitet den Inhalt, um ihn Ihrem Agenten zur Verfügung zu stellen.

Diese Quelle funktioniert gut, wenn Sie Dokumente in Azure Blob Storage speichern. Zu den allgemeinen Dateitypen gehören:

  • PDF-Dokumente
  • Microsoft Word-Dateien (.docx)
  • Textdateien (.txt)
  • Markdowndateien (.md)
  • HTML-Dateien

Hinweis

Im Gegensatz zu Azure AI Search, das erfordert, dass Sie einen Index erstellen und verwalten müssen, bietet Blob Storage einen direkteren Pfad von Ihren Dateien zu Ihrer Wissensdatenbank.

Basierend auf diesem Konzept können Sie Ihre Blobs basierend auf Themen oder Zugriffsebenen in Containern organisieren, sodass sie einfacher verwalten können, auf welche Informationen Ihr Agent zugreifen kann. Diese Organisation trägt dazu bei, Die Datengovernance aufrechtzuerhalten und gleichzeitig Ihre Wissensbasis aktuell zu halten.

das Internet

Der Webzugriff versorgt Ihren Agenten mit Echtzeit-Inhalten aus dem Internet über Bing. Anstatt sich nur auf statische, interne Daten zu verlassen, kann Ihr Agent bei der Beantwortung von Fragen nach aktuellen Informationen suchen.

Dies wird besonders wichtig, wenn Benutzer fragen:

  • Aktuelle Ereignisse oder Nachrichten
  • Aktuelle Preise oder Verfügbarkeit
  • Häufig ändernde Informationen
  • Themen außerhalb Ihrer internen Wissensbasis

Von Bedeutung

Mit Web-Grounding verlassen Sie sich auf die Suchergebnisse von Bing, was bedeutet, dass Sie weniger Kontrolle über die spezifischen Quellen haben, die Ihr Agent verwendet. Wenn Genauigkeit und Quellüberprüfung von kritischer Bedeutung sind, ziehen Sie in Betracht, stattdessen indizierte und kontrollierte Datenquellen zu verwenden.

Tipp

Sie können Web-Grounding mit internen Datenquellen kombinieren, indem Sie den Webzugriff als zusätzliche Quelle verwenden, wenn internes Wissen keine Antwort liefert.

Microsoft SharePoint-Optionen

Foundry IQ bietet zwei Möglichkeiten, eine Verbindung mit SharePoint herzustellen, die jeweils mit unterschiedlichen Vorteilen verbunden sind. In der folgenden Tabelle werden die folgenden Ansätze verglichen:

Merkmal Remote Indiziert
Zugriffsmethode Echtzeitabfragen Vorverarbeiteter Index
Antwortzeit Hängt von SharePoint ab Schneller
Instandhaltung Kein Index, der beibehalten werden soll Erfordert Indexaktualisierungen
Erweiterte Suche Begrenzt Vollständige Azure AI Search-Funktionen
Aktualität der Daten Immer aktuell Hängt vom Indizierungszeitplan ab
Berechtigungsverarbeitung Respektiert SharePoint-Berechtigungen Konfiguriert während der Indizierung

SharePoint Remotezugriff

SharePoint Remote bietet Suchfunktionen mit Microsoft 365-Governance, das direkte Abrufen von Inhalten aus SharePoint ohne Vorindizierung. Ihr Agent durchsucht SharePoint-Websites und -Bibliotheken in Echtzeit, wenn Benutzer Fragen stellen.

Wichtige Vorteile des Remotezugriffs:

  • Keine Indexwartung erforderlich
  • Greift immer auf aktuelle SharePoint-Inhalte zu
  • Berücksichtigt automatisch vorhandene SharePoint-Berechtigungen
  • Einfachere Einrichtung und Konfiguration

Tipp

Verwenden Sie SharePoint Remote, wenn Sie den einfachsten Pfad zu SharePoint-Daten benötigen und keine erweiterten Suchfunktionen benötigen.

SharePoint indiziert

SharePoint Indexed verfolgt einen anderen Ansatz, indem SharePoint-Inhalte in Azure AI Search für benutzerdefinierte Pipelines indiziert werden. Im Gegensatz zum Remotezugriff, der SharePoint in Echtzeit abfragt, verarbeitet die Indizierung Ihre SharePoint-Inhalte im Voraus.

Diese Vorverarbeitung bedeutet schnellere Reaktionszeiten und komplexere Suchfunktionen. Mit indizierten Inhalten können Sie:

  1. Anwenden von benutzerdefinierten Analysegeräten für spezielle Terminologie
  2. Erstellen von Anreicherungspipelines mit KI-Diensten
  3. Kombinieren von SharePoint-Daten mit anderen Quellen
  4. Erstellen spezialisierter Sucherlebnisse

Hinweis

Indiziertes SharePoint funktioniert am besten, wenn Sie erweiterte Suchfunktionen benötigen oder Wenn Sie SharePoint-Daten in andere Quellen in Ihren Azure AI Search-Index integrieren.

Microsoft OneLake

Microsoft OneLake bietet Zugriff auf unstrukturierte Daten, die in Ihrem Microsoft Fabric-Datenseehouse gespeichert sind. Sie stellen eine Verbindung mit OneLake her, um Dateien und Dokumente abzurufen, die in Ihrem Seehaus gespeichert sind und diese Daten Ihrer Wissensdatenbank zur Verfügung stellen.

Tipp

Erfahren Sie mehr über Microsoft Fabric OneLake und wie sie als einheitlicher Datensee für Ihre Organisation dient.

Diese Option ist wichtig, wenn Ihre Organisation Microsoft Fabric für Datenanalysen und -speicher verwendet. Zu den gängigen Anwendungsfällen gehören:

  • Business Intelligence-Berichte – Referenzanalyseergebnisse in Agentantworten
  • Datendokumentation – Bereitstellen von Kontext zu Datasets und Metriken
  • Analytische Erkenntnisse – Teilen von Erkenntnissen aus der Data Science-Arbeit
  • Forschungsergebnisse – Machen Sie Forschung durch unterhaltungsbasierte KI zugänglich

Mit dieser Verbindung kann Ihr Agent bei der Beantwortung von Geschäftsfragen auf diese Informationen verweisen und datengesteuerte Antworten bereitstellen, die in der Analytischen Arbeit Ihrer Organisation geerdet sind.

Auswählen der richtigen Datenquelle

Die Auswahl der geeigneten Datenquelle hängt von mehreren Faktoren ab. Verwenden Sie diesen Entscheidungsleitfaden:

Wenn Ihre Daten... Und Sie brauchen... Wählen...
In SharePoint Einfache Einrichtung, immer aktuell SharePoint Remotezugriff
In SharePoint Erweiterte Suche, benutzerdefinierte Pipelines SharePoint indiziert
Dateien in Azure Direkter Dateizugriff Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten)
In Microsoft Fabric Data Lakehouse-Inhalt OneLake
Bereits indiziert Bestehende Investition in Azure AI Search Azure AI Search-Index
Öffentliche, aktuelle Informationen Webinhalte in Echtzeit das Internet

Von Bedeutung

Sie können mehrere Quellen in einer einzigen Wissensbasis kombinieren. Verwenden Sie z. B. interne SharePoint-Daten als primäre Wissensbasis, während Web-Grounding für aktuelle Ereignisse oder ergänzende Informationen aktiviert wird.