Del via


Oversikt over LightGBM i SynapseML

LightGBM er et rammeverk med åpen kildekode, distribuert gradering med høy ytelse (GBDT, GBRT, GBM eller MART). Dette rammeverket spesialiserer seg på å opprette algoritmer av høy kvalitet og GPU-aktiverte beslutningstre for rangering, klassifisering og mange andre maskinlæringsoppgaver. LightGBM er en del av Microsofts DMTK-prosjekt .

Fordeler med LightGBM

  • Komponerbarhet: LightGBM-modeller kan innlemmes i eksisterende SparkML-datasamlebånd og brukes til batch, strømming og servering av arbeidsbelastninger.
  • Ytelse: LightGBM på Spark er 10–30 % raskere enn SparkML på Higgs-datasettet og oppnår en økning på 15 % i AUC. Parallelle eksperimenter har bekreftet at LightGBM kan oppnå en lineær hastighet ved hjelp av flere maskiner for opplæring i bestemte innstillinger.
  • Funksjonalitet: LightGBM tilbyr et bredt spekter av justerbare parametere som man kan bruke for å tilpasse beslutningstresystemet sitt. LightGBM på Spark støtter også nye typer problemer, for eksempel quantile regresjon.
  • Kryssplattform: LightGBM på Spark er tilgjengelig på Spark, PySpark og SparklyR.

LightGBM-bruk

  • LightGBMClassifier: Brukes til å bygge klassifiseringsmodeller. For eksempel, for å forutsi om et selskap vil gå konkurs eller ikke, kan vi bygge en binær klassifiseringsmodell med LightGBMClassifier.
  • LightGBMRegressor: Brukes til å bygge regresjonsmodeller. For eksempel, for å forutsi boligpriser, kan vi bygge en regresjonsmodell med LightGBMRegressor.
  • LightGBMRanker: Brukes til å bygge rangeringsmodeller. Hvis du for eksempel vil forutsi relevansen av søkeresultatene for nettstedet, kan vi bygge en rangeringsmodell med LightGBMRanker.