Innføring

Fullført

Apache Spark er et parallelt behandlingsrammeverk med åpen kildekode for databehandling og analyse i stor skala. Spark har blitt populær i «big data»-behandlingsscenarioer, og er tilgjengelig i flere plattformimplementeringer. inkludert Azure HDInsight, Azure Synapse Analytics og Microsoft Fabric.

Denne modulen utforsker hvordan du kan bruke Spark i Microsoft Fabric til å innta, behandle og analysere data i et lakehouse. Selv om kjerneteknikkene og koden som er beskrevet i denne modulen, er felles for alle Spark-implementeringer, gjør de integrerte verktøyene og muligheten til å arbeide med Spark i samme miljø som andre datatjenester i Microsoft Fabric det enklere å innlemme Spark-basert databehandling i den generelle dataanalyseløsningen.