Jaa


LightGBM:n yleiskatsaus SynapseML:ssä

LightGBM on avoimen lähdekoodin hajautettu, suorituskykyinen liukuvärin tehoste (GBDT, GBRT, GBM tai MART) -kehys. Tämä kehys on erikoistunut laadukkaiden ja suoritinkäyttöisten päätöspuu-algoritmien luomiseen luokittelua, luokittelua ja monia muita koneoppimistehtäviä varten. LightGBM on osa Microsoftin DMTK-projektia.

LightGBM:n edut

  • Yhdistettävyys: LightGBM-mallit voidaan sisällyttää olemassa oleviin SparkML-putkiin ja käyttää erä-, suoratoisto- ja tarjoilukuormituksille.
  • Suorituskyky: LightGBM On Spark on 10-30 % nopeampi kuin SparkML Higgs-tietojoukossa ja sen AUC-arvo kasvaa 15 %. Rinnakkaiset kokeet ovat varmistaneet, että LightGBM voi nopeuttaa lineaarista nopeutta käyttämällä useita koneita tiettyjen asetusten harjoittamiseen.
  • Toiminnallisuus: LightGBM tarjoaa laajan valikoiman säädettäviä parametreja , joiden avulla voi räätälöidä päätöspuujärjestelmänsä. LightGBM on Spark tukee myös uudenlaisia ongelmia, kuten määrällista regressiota.
  • Eri ympäristö: LightGBM on Spark on saatavilla Sparkissä, PySparkissa ja SparklyR:ssä.

LightGBM-käyttö

  • LightGBMClassifier: Käytetään luokittelumallien rakentamiseen. Esimerkiksi ennustaaksemme, meneekö yritys konkurssiin vai ei, voisimme rakentaa binääriluokittelumallin, jossa LightGBMClassifieron .
  • LightGBMRegressor: Käytetään regressiomallien rakentamiseen. Esimerkiksi asuntojen hintojen ennustamiseksi voisimme rakentaa regressiomallin, jossa LightGBMRegressor.
  • LightGBMRanker: Käytetään ranking-mallien rakentamiseen. Esimerkiksi verkkosivuston hakutulosten merkityksen ennustamiseksi voimme luoda sijoitusmallin kohteen avulla LightGBMRanker.