Overzicht van LightGBM in SynapseML

LightGBM is een open-source, gedistribueerd, hoogwaardig framework voor gradient boosting (GBDT, GBRT, GBM of MART). Dit framework is gespecialiseerd in het maken van hoogwaardige en GPU-geoptimaliseerde beslissingsboomalgoritmen voor rangschikking, classificatie en vele andere machine learning-taken. LightGBM maakt deel uit van het DMTK-project van Microsoft.

Voordelen van LightGBM

  • Samenstelbaarheid: LightGBM-modellen kunnen worden opgenomen in bestaande SparkML-pijplijnen en worden gebruikt voor batch-, streaming- en serverworkloads.
  • Prestaties: LightGBM op Spark is 10-30% sneller dan SparkML in de Higgs-gegevensset en bereikt een toename van 15% in AUC. Parallelle experimenten hebben gecontroleerd of LightGBM een lineaire snelheid kan bereiken door meerdere machines te gebruiken voor training in specifieke instellingen.
  • Functionaliteit: LightGBM biedt een breed scala aan instelbare parameters die u kunt gebruiken om uw beslissingsboomsysteem aan te passen. LightGBM op Spark ondersteunt ook nieuwe typen problemen, zoals kwantielregressie.
  • Platformoverschrijdend: LightGBM op Spark is beschikbaar op Spark, PySpark en SparklyR.

LightGBM-gebruik

  • LightGBMClassifier: Wordt gebruikt voor het bouwen van classificatiemodellen. Om bijvoorbeeld te voorspellen of een bedrijf failliet gaat of niet, kunnen we een binair classificatiemodel bouwen met LightGBMClassifier.
  • LightGBMRegressor: wordt gebruikt voor het bouwen van regressiemodellen. Om bijvoorbeeld de huizenprijzen te voorspellen, kunnen we een regressiemodel bouwen met LightGBMRegressor.
  • LightGBMRanker: Wordt gebruikt voor het bouwen van classificatiemodellen. Om bijvoorbeeld de relevantie van zoekresultaten van websites te voorspellen, kunnen we een classificatiemodel maken met LightGBMRanker.