Konfigurieren von Datenquellen für Wissensdatenbanken
Ihre Wissensdatenbank ist nur so gut wie die darin enthaltenen Daten. Foundry IQ ermöglicht Es Ihnen, eine Verbindung mit mehreren Datenquellen herzustellen, sodass Ihr KI-Agent auf die Benötigten Informationen zugreifen kann, um Fragen genau zu beantworten. Sie konfigurieren diese Quellen, wenn Sie Ihre Knowledge Base einrichten, um sicherzustellen, dass Ihr Agent über den richtigen Kontext für Ihren spezifischen Anwendungsfall verfügt.
Das Verständnis der zu verwendenden Datenquelle hängt davon ab, wo Sich Ihre Daten befinden und wie Sie darauf zugreifen müssen. Foundry IQ unterstützt sechs primäre Datenquellentypen:
| Datenquelle | Zugriffstyp | Am besten geeignet für |
|---|---|---|
| Azure AI Search-Index | Indiziert | Unternehmenssuche mit benutzerdefinierten Pipelines |
| Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten) | Direkt | Dokumentdateien in Azure Storage |
| das Internet | Echtzeit | Aktuelle, öffentliche Informationen über Bing |
| SharePoint (Remote) | Echtzeit | Live-SharePoint-Inhalte mit Microsoft 365-Governance |
| SharePoint (Indexiert) | Indiziert | Erweiterte Suche in SharePoint mit benutzerdefinierten Pipelines |
| OneLake | Direkt | Unstrukturierte Daten in Microsoft Fabric |
Mit Echtzeitquellen erhalten Sie aktuelle Informationen. Mit internen Datenquellen wie SharePoint oder OneLake verwalten Sie Sicherheit und Governance, während Sie Ihrem Agent Zugriff auf proprietäre Kenntnisse gewähren.
Azure AI Search-Index
Der Azure AI Search-Index bietet Suchfunktionen im Unternehmensmaßstab für Ihre Findry IQ-Wissensbasis. Diese Option ist ideal, wenn Sie bereits in Azure AI Search investiert und vorhandene Suchindizes verwenden möchten.
Mit dieser Quelle stellen Sie eine direkte Verbindung mit Ihrem Azure AI Search-Index her, der Daten aus mehreren Ursprüngen enthalten kann, die Sie bereits verarbeitet und indiziert haben. Dies ist besonders wichtig, wenn Sie anspruchsvolle Suchfunktionen wie semantische Rangfolge, Filter oder benutzerdefinierte Bewertungsprofile benötigen, die Azure AI Search bereitstellt.
Tipp
Erfahren Sie mehr über Azure AI Search und wie Sie Suchindizes für Ihre Wissensdatenbanken erstellen und verwalten.
Ihr Agent kann diesen Index abfragen, um relevante Informationen basierend auf Benutzerfragen abzurufen. Zu den wichtigsten Vorteilen gehören:
- Semantische Rangfolge – findet kontextbezogene Ergebnisse, nicht nur Stichwort-Übereinstimmungen
- Benutzerdefinierte Bewertung – Priorisiert Ergebnisse basierend auf Ihrer Geschäftslogik
- Faceted navigation – Filtert Ergebnisse nach Kategorien oder Attributen
- Unterstützung für mehrere Sprachen – Behandelt Inhalte in verschiedenen Sprachen
Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten)
Mit Azure Blob Storage können Sie Dokumente und Dateien direkt aus Ihren BLOB-Containern abrufen. Sie wählen bestimmte Container oder Blobs aus, und Foundry IQ verarbeitet den Inhalt, um ihn Ihrem Agenten zur Verfügung zu stellen.
Diese Quelle funktioniert gut, wenn Sie Dokumente in Azure Blob Storage speichern. Zu den allgemeinen Dateitypen gehören:
- PDF-Dokumente
- Microsoft Word-Dateien (.docx)
- Textdateien (.txt)
- Markdowndateien (.md)
- HTML-Dateien
Hinweis
Im Gegensatz zu Azure AI Search, das erfordert, dass Sie einen Index erstellen und verwalten müssen, bietet Blob Storage einen direkteren Pfad von Ihren Dateien zu Ihrer Wissensdatenbank.
Basierend auf diesem Konzept können Sie Ihre Blobs basierend auf Themen oder Zugriffsebenen in Containern organisieren, sodass sie einfacher verwalten können, auf welche Informationen Ihr Agent zugreifen kann. Diese Organisation trägt dazu bei, Die Datengovernance aufrechtzuerhalten und gleichzeitig Ihre Wissensbasis aktuell zu halten.
das Internet
Der Webzugriff versorgt Ihren Agenten mit Echtzeit-Inhalten aus dem Internet über Bing. Anstatt sich nur auf statische, interne Daten zu verlassen, kann Ihr Agent bei der Beantwortung von Fragen nach aktuellen Informationen suchen.
Dies wird besonders wichtig, wenn Benutzer fragen:
- Aktuelle Ereignisse oder Nachrichten
- Aktuelle Preise oder Verfügbarkeit
- Häufig ändernde Informationen
- Themen außerhalb Ihrer internen Wissensbasis
Von Bedeutung
Mit Web-Grounding verlassen Sie sich auf die Suchergebnisse von Bing, was bedeutet, dass Sie weniger Kontrolle über die spezifischen Quellen haben, die Ihr Agent verwendet. Wenn Genauigkeit und Quellüberprüfung von kritischer Bedeutung sind, ziehen Sie in Betracht, stattdessen indizierte und kontrollierte Datenquellen zu verwenden.
Tipp
Sie können Web-Grounding mit internen Datenquellen kombinieren, indem Sie den Webzugriff als zusätzliche Quelle verwenden, wenn internes Wissen keine Antwort liefert.
Microsoft SharePoint-Optionen
Foundry IQ bietet zwei Möglichkeiten, eine Verbindung mit SharePoint herzustellen, die jeweils mit unterschiedlichen Vorteilen verbunden sind. In der folgenden Tabelle werden die folgenden Ansätze verglichen:
| Merkmal | Remote | Indiziert |
|---|---|---|
| Zugriffsmethode | Echtzeitabfragen | Vorverarbeiteter Index |
| Antwortzeit | Hängt von SharePoint ab | Schneller |
| Instandhaltung | Kein Index, der beibehalten werden soll | Erfordert Indexaktualisierungen |
| Erweiterte Suche | Begrenzt | Vollständige Azure AI Search-Funktionen |
| Aktualität der Daten | Immer aktuell | Hängt vom Indizierungszeitplan ab |
| Berechtigungsverarbeitung | Respektiert SharePoint-Berechtigungen | Konfiguriert während der Indizierung |
SharePoint Remotezugriff
SharePoint Remote bietet Suchfunktionen mit Microsoft 365-Governance, das direkte Abrufen von Inhalten aus SharePoint ohne Vorindizierung. Ihr Agent durchsucht SharePoint-Websites und -Bibliotheken in Echtzeit, wenn Benutzer Fragen stellen.
Wichtige Vorteile des Remotezugriffs:
- Keine Indexwartung erforderlich
- Greift immer auf aktuelle SharePoint-Inhalte zu
- Berücksichtigt automatisch vorhandene SharePoint-Berechtigungen
- Einfachere Einrichtung und Konfiguration
Tipp
Verwenden Sie SharePoint Remote, wenn Sie den einfachsten Pfad zu SharePoint-Daten benötigen und keine erweiterten Suchfunktionen benötigen.
SharePoint indiziert
SharePoint Indexed verfolgt einen anderen Ansatz, indem SharePoint-Inhalte in Azure AI Search für benutzerdefinierte Pipelines indiziert werden. Im Gegensatz zum Remotezugriff, der SharePoint in Echtzeit abfragt, verarbeitet die Indizierung Ihre SharePoint-Inhalte im Voraus.
Diese Vorverarbeitung bedeutet schnellere Reaktionszeiten und komplexere Suchfunktionen. Mit indizierten Inhalten können Sie:
- Anwenden von benutzerdefinierten Analysegeräten für spezielle Terminologie
- Erstellen von Anreicherungspipelines mit KI-Diensten
- Kombinieren von SharePoint-Daten mit anderen Quellen
- Erstellen spezialisierter Sucherlebnisse
Hinweis
Indiziertes SharePoint funktioniert am besten, wenn Sie erweiterte Suchfunktionen benötigen oder Wenn Sie SharePoint-Daten in andere Quellen in Ihren Azure AI Search-Index integrieren.
Microsoft OneLake
Microsoft OneLake bietet Zugriff auf unstrukturierte Daten, die in Ihrem Microsoft Fabric-Datenseehouse gespeichert sind. Sie stellen eine Verbindung mit OneLake her, um Dateien und Dokumente abzurufen, die in Ihrem Seehaus gespeichert sind und diese Daten Ihrer Wissensdatenbank zur Verfügung stellen.
Tipp
Erfahren Sie mehr über Microsoft Fabric OneLake und wie sie als einheitlicher Datensee für Ihre Organisation dient.
Diese Option ist wichtig, wenn Ihre Organisation Microsoft Fabric für Datenanalysen und -speicher verwendet. Zu den gängigen Anwendungsfällen gehören:
- Business Intelligence-Berichte – Referenzanalyseergebnisse in Agentantworten
- Datendokumentation – Bereitstellen von Kontext zu Datasets und Metriken
- Analytische Erkenntnisse – Teilen von Erkenntnissen aus der Data Science-Arbeit
- Forschungsergebnisse – Machen Sie Forschung durch unterhaltungsbasierte KI zugänglich
Mit dieser Verbindung kann Ihr Agent bei der Beantwortung von Geschäftsfragen auf diese Informationen verweisen und datengesteuerte Antworten bereitstellen, die in der Analytischen Arbeit Ihrer Organisation geerdet sind.
Auswählen der richtigen Datenquelle
Die Auswahl der geeigneten Datenquelle hängt von mehreren Faktoren ab. Verwenden Sie diesen Entscheidungsleitfaden:
| Wenn Ihre Daten... | Und Sie brauchen... | Wählen... |
|---|---|---|
| In SharePoint | Einfache Einrichtung, immer aktuell | SharePoint Remotezugriff |
| In SharePoint | Erweiterte Suche, benutzerdefinierte Pipelines | SharePoint indiziert |
| Dateien in Azure | Direkter Dateizugriff | Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten) |
| In Microsoft Fabric | Data Lakehouse-Inhalt | OneLake |
| Bereits indiziert | Bestehende Investition in Azure AI Search | Azure AI Search-Index |
| Öffentliche, aktuelle Informationen | Webinhalte in Echtzeit | das Internet |
Von Bedeutung
Sie können mehrere Quellen in einer einzigen Wissensbasis kombinieren. Verwenden Sie z. B. interne SharePoint-Daten als primäre Wissensbasis, während Web-Grounding für aktuelle Ereignisse oder ergänzende Informationen aktiviert wird.