Filteren en ingesteren naar Azure Synapse SQL met behulp van de Stream Analytics no-code-editor

In dit artikel wordt beschreven hoe u de code-editor zonder code kunt gebruiken om eenvoudig een Stream Analytics-taak te maken. Het leest continu vanuit uw Event Hubs, filtert de binnenkomende gegevens en schrijft vervolgens de resultaten continu naar de Synapse SQL-tabel.

Vereisten

  • Uw Azure Event Hubs-resources moeten openbaar toegankelijk zijn en kunnen zich niet achter een firewall bevinden of zijn beveiligd in een virtueel Azure-netwerk.
  • De gegevens in uw Event Hubs moeten worden geserialiseerd in JSON-, CSV- of Avro-indeling.

Een Stream Analytics-taak ontwikkelen om gegevens te filteren en op te nemen

Gebruik de volgende stappen om een Stream Analytics-taak te ontwikkelen om realtime gegevens te filteren en op te nemen in een Synapse SQL-tabel.

  1. Zoek en selecteer uw Azure Event Hubs-exemplaar in Azure Portal.

  2. Selecteer Kenmerken>Procesgegevens, en selecteer Start op de kaart Filter en opnemen in Synapse SQL.
    Schermopname die de startkaarten voor het verwerken van Event Hubs-gegevens toont.

  3. Voer een naam in om uw Stream Analytics-taak te identificeren en selecteer Aanmaken.
    Schermopname van het venster Nieuwe Stream Analytics-taak waarin u de taaknaam invoert.

  4. Geef het serialisatietype van uw gegevens op in het Event Hubs-venster en de verificatiemethode die door de taak wordt gebruikt om verbinding te maken met de Event Hubs. Selecteer vervolgens Connect.
    Schermopname van de configuratie van de Event Hubs-verbinding.

  5. Wanneer de verbinding tot stand is gebracht en er gegevensstromen naar uw Event Hubs-exemplaar stromen, ziet u onmiddellijk twee dingen:

    • Velden die aanwezig zijn in de invoergegevens. U kunt Veld toevoegen kiezen of het driepuntsymbool naast een veld selecteren om het te verwijderen, de naam te wijzigen of het type aan te passen.
      Schermopname van de lijst met Event Hubs-velden waar u het veldtype kunt verwijderen, een andere naam kunt geven of wijzigen.
    • Een livevoorbeeld van binnenkomende gegevens in de tabel Gegevensvoorbeeld onder de diagramweergave. Het wordt automatisch periodiek vernieuwd. U kunt Pauzeren streamingvoorbeeld selecteren om een statische weergave van de voorbeeldinvoergegevens te bekijken.
      Schermopname van voorbeeldgegevens onder Gegevensvoorbeeld.
  6. Selecteer in het filtergebied een veld om de binnenkomende gegevens met een voorwaarde te filteren.
    Schermopname van het filtergebied waar u binnenkomende gegevens met een voorwaarde kunt filteren.

  7. Selecteer de Synapse SQL-tabel om gefilterde gegevens te verzenden:

    1. Selecteer het abonnement, de database (naam van de toegewezen SQL-pool) en de verificatiemethode in de vervolgkeuzelijst.
    2. Voer de tabelnaam in waarin de gefilterde gegevens worden opgenomen. Selecteer Verbinding maken.
      Schermopname van verbindingsdetails van Synapse SQL-tabel.

    Notitie

    Het tabelschema moet exact overeenkomen met het aantal velden en de typen die uw gegevensvoorbeeld genereert.

  8. Optioneel selecteren Statische preview ophalen/Statische preview vernieuwen om het gegevensvoorbeeld te zien dat wordt opgenomen in de geselecteerde Synapse SQL-tabel.
    Schermopname van de optie Statische preview ophalen/Statische preview vernieuwen.

  9. Selecteer Opslaan en selecteer vervolgens De Stream Analytics-taak starten.
    Schermopname met de opties Opslaan en Starten.

  10. Geef het volgende op om de taak te starten:

    • Het aantal streaming-eenheden (RU's) waarmee de taak wordt uitgevoerd. SUs vertegenwoordigt de hoeveelheid rekenkracht en geheugen die aan de taak is toegewezen. We raden u aan om met drie te beginnen en vervolgens naar behoefte aan te passen.
    • Verwerking van uitvoergegevensfouten : hiermee kunt u het gewenste gedrag opgeven wanneer de uitvoer van een taak naar uw bestemming mislukt vanwege gegevensfouten. Uw taak wordt standaard opnieuw uitgevoerd totdat de schrijfbewerking is voltooid. U kunt er ook voor kiezen om dergelijke uitvoer gebeurtenissen te verwijderen.
      Schermopname van de opties voor de Stream Analytics-taak starten, waar u de uitvoertijd kunt wijzigen, het aantal streaming-eenheden kunt instellen en de opties voor het verwerken van uitvoergegevensfouten kunt selecteren.
  11. Nadat u Start hebt geselecteerd, wordt de taak binnen twee minuten uitgevoerd en worden de metrische gegevens geopend in de sectie met tabbladen hieronder.

    U kunt de taak ook zien onder de sectie Procesgegevens op het tabblad Stream Analytics-taken . Selecteer Metrische gegevens openen om deze te bewaken of te stoppen en opnieuw op te starten, indien nodig.

    Schermopname van het tabblad Stream Analytics-taken waarin u de status van de actieve taken bekijkt.

Overwegingen bij het gebruik van de functie Geo-replicatie van Event Hubs

Azure Event Hubs heeft onlangs de functie Geo-replicatie gelanceerd in de openbare preview. Deze functie verschilt van de functie Geo Disaster Recovery van Azure Event Hubs.

Wanneer het failovertype Geforceerd en de replicatieconsistentie Asynchroon is, garandeert de Stream Analytics-job geen exacte enkelvoudige uitvoer naar een Azure Event Hubs-output.

Azure Stream Analytics, als producent met een Event Hub als uitvoer, kan de watermerkvertraging in de taak observeren tijdens de failoverperiode en tijdens beperking door Event Hubs, in het geval dat de replicatievertraging tussen de primaire en secundaire de maximaal geconfigureerde vertraging bereikt.

Azure Stream Analytics, als consument met Event Hubs als invoer, kan tijdens de failover mogelijk een watermark delay in de taak waarnemen en mogelijk gegevens overslaan of dubbele gegevens vinden nadat de failover is voltooid.

Als gevolg van deze opmerkingen start u de Stream Analytics-taak opnieuw op met de juiste begintijd direct nadat de Failover van Event Hubs is voltooid. Aangezien de functie Geo-replicatie van Event Hubs in openbare preview is, gebruikt u dit patroon op dit moment niet voor productie Stream Analytics-taken. Het huidige gedrag van Stream Analytics wordt verbeterd voordat de Geo-replicatiefunctie van Event Hubs algemeen beschikbaar is en kan worden gebruikt in Stream Analytics-productietaken.

Volgende stappen

Meer informatie over Azure Stream Analytics en het bewaken van de taak die u hebt gemaakt.