Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Lokale Datenquellendatenqualität bezieht sich auf die Möglichkeit, die Qualität von Daten zu bewerten, zu überwachen, zu bewerten und zu verbessern, die sich innerhalb einer unternehmenseigenen Infrastruktur befinden, z. B. lokale SQL Server und lokale Oracle-Instanzen. Diese Datasets werden in der privaten Netzwerkumgebung eines Kunden und nicht auf Cloudplattformen gespeichert.
Voraussetzungen
Lokale Datenbanken werden in der lokalen Infrastruktur überprüft, um sicherzustellen, dass die Daten nicht über die Kundenumgebung hinaus verschoben werden. Sie müssen einen Kubernetes-Cluster einrichten, um die Runtime zu hosten, die diese Datenbanken überprüft. Bevor Sie Microsoft Purview Data Quality für lokale Datenquellen verwenden:
- Erstellen Sie einen Kubernetes-Cluster.
- Laden Sie die Datenintegrationslaufzeit herunter.
- Registrieren Sie sie bei Microsoft Purview.
Informationen zu Voraussetzungen, Installation und Einrichtung finden Sie unter:
- Einrichten des DIRCTL-Tools für die selbstgehostete Integration Runtime (Vorschau)
- Von Kubernetes unterstützte selbstgehostete Datenintegrationslaufzeit für lokale Datenquellen (Vorschau)
Bevor Sie eine Datenqualitätsüberprüfung ausführen, müssen Sie die Ressourcen über einen Data Map-Scan überprüfen. Für die Data Map-Überprüfung müssen Sie eine selbstgehostete Integration Runtime installieren und konfigurieren.
Einrichten einer Verbindung mit Ihren lokalen Datenbanken
Erstellen Sie Verbindungen für lokale Datenquellen auf die gleiche Weise wie Verbindungen für andere Datenquellentypen. Wählen Sie in Unified Catalog Die Option Integritätsverwaltung und dann Datenqualität aus. Wählen Sie die Governancedomäne aus, in der Sie Ihr Datenprodukt mit der lokalen Datenressource erstellt haben. Wählen Sie Verwalten und dann Verbindung aus, um eine Verbindung für Ihre lokalen Datenbanken einzurichten. Unterstützte lokale Datenquellen sind:
- Oracle
- SQL Server
Erstellen Sie Verbindungen, indem Sie sie einer Datenintegrationslaufzeit instance zuordnen. In SQL Server kann eine einzelne Datenbank Tabellen enthalten, die zu mehreren Schemas gehören. Sie können also eine einzelne Verbindung verwenden, um alle Schemas in einer einzelnen Datenbank zu überprüfen. Daher akzeptiert eine Verbindung nur Datenbankinformationen, aber kein Schema. Für eine Oracle-Datenbank können Sie die Verbindung auf Schema- oder Datenbankebene erstellen. Wenn Sie die Verbindung auf die Schemaebene beschränken möchten, fügen Sie den Schemanamen auf der Verbindungskonfigurationsseite hinzu.
Hinweis
- Eine Oracle-Datenbank sollte nur über eine Verbindung auf Datenbankebene verfügen, aber sie kann viele Verbindungen auf Schemaebene für Schema 1, Schema 2 und Schema 3 aufweisen.
- Jede Verbindung auf Schemaebene wird als separate Verbindung verwendet, da es sich um separate Schemas handelt.
- Wenn eine Oracle-Datenbank sowohl Verbindungen auf Schemaebene als auch Verbindungen auf Datenbankebene aufweist, verwendet das System nur die Verbindung auf Schemaebene.
- Wenn eine Oracle-Datenbank über zwei Verbindungen auf Datenbankebene verfügt, verwendet das System nur die erste Verbindung.
Datenqualitätsüberprüfung
Nachdem Sie die Verbindungseinrichtung abgeschlossen haben, folgen Sie der Dokumentation zur Überprüfung der Datenqualität, um die Datenqualität von Oracle und SQL Server lokalen Datenquellen zu messen und zu überwachen.
- Übersicht über die Datenqualität
- Unterstützte Datenquellen
- Einrichten einer Datenquellenverbindung
- Überprüfung der Qualität der Datenprodukte
- Überprüfung der Datenassetqualität
- Inkrementelle Datenqualitätsüberprüfung
Begrenzungen
- Die Profilerstellung für lokale Datenquellen wird nicht unterstützt.
- Tabellensuchregeln werden nicht unterstützt, wenn Sie die Tabellen nicht als Datenressourcen veröffentlichen oder wenn die Datenbanken der Verweistabellen nicht auf demselben Server ausgeführt werden oder gehostet werden.
- Die Aktualitätsregel wird für SQL Server Datenbank nicht unterstützt.
- Benutzerdefinierte Ausdrücke, die für Cloudquellen unterstützt werden, werden für SQL Server Datenbank nicht unterstützt, aber Benutzerdefiniertes SQL wird unterstützt.
- RegEx-Regeln werden nicht unterstützt, LIKE wird jedoch unterstützt.
Beheben häufiger Fehler
-
Fehler: Der Wert darf nicht NULL sein. (Parameter 'Password property is missing'). Dieser Fehler tritt auf, wenn das Schlüsseltresorgeheimnis nicht gefunden wird. Die tatsächliche Fehlermeldung im Kubernetes-Protokoll lautet: "Ein Geheimnis mit
(name/id)KVSecretsOfficers-purview wurde in diesem Schlüsseltresor nicht gefunden."