Inzicht in zoekonderdelen

Voltooid

Een AI Search-oplossing bestaat uit meerdere onderdelen die elk een belangrijk onderdeel spelen in het proces van het extraheren, verrijken, indexeren en doorzoeken van gegevens.

Gegevensbron

Een diagram met een conceptuele illustratie van een gegevensbron.

De meeste zoekoplossingen beginnen met een gegevensbron met de gegevens die u wilt doorzoeken. Azure AI Search ondersteunt meerdere typen gegevensbronnen, waaronder:

  • Ongestructureerde bestanden in Azure Blob Storage-containers.
  • Tabellen in Azure SQL Database.
  • Documenten in Cosmos DB.

Azure AI Search kan gegevens ophalen uit deze gegevensbronnen voor indexering.

Toepassingen kunnen JSON-gegevens ook rechtstreeks naar een index pushen zonder deze op te halen uit een bestaand gegevensarchief.

Vaardighedenset

Een diagram met een conceptuele illustratie van een vaardighedenset.

In een eenvoudige zoekoplossing kunt u de gegevens indexeren die zijn geëxtraheerd uit de gegevensbron. De informatie die kan worden geëxtraheerd, is afhankelijk van de gegevensbron. Wanneer u bijvoorbeeld gegevens in een database indexeert, kunnen de velden in de databasetabellen worden geëxtraheerd; of wanneer u een set documenten indexeert, kunnen bestandsmetagegevens, zoals bestandsnaam, gewijzigde datum, grootte en auteur, samen met de tekstinhoud van het document worden geëxtraheerd.

Hoewel een eenvoudige zoekoplossing die gegevenswaarden indexeert die rechtstreeks uit de gegevensbron zijn geëxtraheerd, nuttig kan zijn, hebben de verwachtingen van moderne toepassingsgebruikers een behoefte aan uitgebreidere inzichten in de gegevens. In Azure AI Search kunt u ai-vaardigheden (kunstmatige intelligentie) toepassen als onderdeel van het indexeringsproces om de brongegevens te verrijken met nieuwe informatie, die kan worden toegewezen aan indexvelden. De vaardigheden die door een indexeerfunctie worden gebruikt, worden ingekapseld in een vaardighedenset die een verrijkingspijplijn definieert waarin elke stap de brongegevens verbetert met inzichten die zijn verkregen door een specifieke AI-vaardigheid. Voorbeelden van het soort informatie dat kan worden geëxtraheerd door een AI-vaardigheid zijn:

  • De taal waarin een document wordt geschreven.
  • Sleuteltermen die kunnen helpen bij het bepalen van de hoofdthema's of onderwerpen die in een document worden besproken.
  • Een gevoelsscore die kwantificeert hoe positief of negatief een document is.
  • Specifieke locaties, personen, organisaties of oriëntatiepunten die in de inhoud worden vermeld.
  • Door AI gegenereerde beschrijvingen van afbeeldingen of afbeeldingstekst geëxtraheerd door optische tekenherkenning.
  • Aangepaste vaardigheden die u ontwikkelt om te voldoen aan specifieke vereisten.

Indexeerfunctie

Een diagram met een conceputale illustratie van een indexeerfunctie.

De indexeerfunctie is de engine die het algehele indexeringsproces aanstuurt. De uitvoer wordt geëxtraheerd met behulp van de vaardigheden in de vaardighedenset, samen met de gegevens- en metagegevenswaarden die zijn geëxtraheerd uit de oorspronkelijke gegevensbron en worden toegewezen aan velden in de index.

Een indexeerfunctie wordt automatisch uitgevoerd wanneer deze wordt gemaakt en kan worden gepland om regelmatig uit te voeren of op aanvraag uit te voeren om meer documenten aan de index toe te voegen. In sommige gevallen, bijvoorbeeld wanneer u nieuwe velden toevoegt aan een index of nieuwe vaardigheden aan een vaardighedenset, moet u de index mogelijk opnieuw instellen voordat u de indexeerfunctie opnieuw uitvoert.

Index

Een diagram met een conceputale illustratie van een index.

De index is het doorzoekbare resultaat van het indexeringsproces. Het bestaat uit een verzameling JSON-documenten, met velden die de waarden bevatten die zijn geëxtraheerd tijdens het indexeren. Clienttoepassingen kunnen query's uitvoeren op de index om informatie op te halen, te filteren en te sorteren.

Elk indexveld kan worden geconfigureerd met de volgende kenmerken:

  • sleutel: Velden die een unieke sleutel definiëren voor indexrecords.
  • doorzoekbaar: velden waarop query's kunnen worden uitgevoerd met behulp van zoekopdrachten in volledige tekst.
  • filterbaar: velden die kunnen worden opgenomen in filterexpressies om alleen documenten te retourneren die overeenkomen met opgegeven beperkingen.
  • sorteerbaar: Velden die kunnen worden gebruikt om de resultaten te ordenen.
  • facetable: Velden die kunnen worden gebruikt om waarden voor facetten te bepalen (gebruikersinterface-elementen die worden gebruikt om de resultaten te filteren op basis van een lijst met bekende veldwaarden).
  • ophaalbaar: Velden die kunnen worden opgenomen in zoekresultaten (standaard zijn alle velden ophaalbaar, tenzij dit kenmerk expliciet wordt verwijderd).