Jaa


Reaaliaikaisten ennusteiden tarjoaminen koneoppimismallin päätepisteiden avulla (esikatselu)

Important

Tämä ominaisuus on esikatselutilassa.

Microsoft Fabric antaa sinun tarjota reaaliaikaisia ennusteita koneoppimismalleista turvallisilla, skaalautuvilla ja helppokäyttöisillä verkkopäätelaitteilla. Nämä päätepisteet ovat saatavilla useimpien Fabric-mallien sisäänrakennettuina ominaisuuksina—eikä niiden käyttöönotto vaadi mitään asetuksia täysin hallittujen reaaliaikaisten käyttöönottojen käynnistämiseksi.

Voit aktivoida, määrittää ja tehdä kyselyjä mallin päätepisteistä julkisella REST-ohjelmointirajapinnalla. Voit myös aloittaa suoraan Fabric-käyttöliittymästä, käyttäen low-code-kokemusta mallin päätepisteiden aktivoimiseen ja ennusteiden esikatseluun välittömästi.

Screenshot, jossa ML-malli Fabric:ssa on sisäänrakennettu päätepisteominaisuus reaaliaikaisten ennusteiden palvelukseen.

Prerequisites

Limitations

  • Päätepisteet ovat tällä hetkellä saatavilla rajoitetulle määrälle koneoppimismallin makuja, kuten Keras, LightGBM, Sklearn ja XGBoost.
  • Päätepisteet eivät ole tällä hetkellä käytettävissä malleissa, joissa on tensoripohjaisia rakenteita tai ei rakenteita.

Note

Tammikuusta 2026 lähtien koneoppimisen päätepisteet tukevat nyt AutoML-koulutettuja malleja. Tämä aiempi rajoitus on poistettu.

Aloita mallin päätepisteiden käyttäminen

Fabric-koneoppimismallit tulevat valmiiksi rakennettuina, joissa on verkkopäätepisteitä, joita voidaan käyttää reaaliaikaisten ennusteiden tarjoamiseen. Jokaisella rekisteröidyllä malliversiolla on oma päätepisteen URL, joka löytyy Fabric-rajapinnan "Endpoint details" -otsikon alta. Tämän URL-osoitteen lopussa on alipolku, joka määrittää tietyn version (esimerkiksi /versions/1/score).

Näyttökuva, jossa näkyvät koneoppimismallin päätepisteen ominaisuudet, joita voidaan käyttää reaaliaikaisten ennusteiden palvelemiseen.

Mallin päätepisteillä on seuraavat ominaisuudet:

Property Description Default
Oletusversio Tämä ominaisuus (Yes tai No) ilmaisee, onko versio määritetty mallin oletukseksi reaaliennusteiden palvelemiselle. Voit mukauttaa oletusversiota mallin asetuksissa. No
Status Tämä ominaisuus ilmaisee, onko päätepiste valmis tekemään ennusteita. Tila voi olla Inactive, , ActivatingActive, Deactivating, tai Failed. Vain aktiiviset päätepisteet voivat palvella ennusteita. Inactive
Automaattinen lepotila Tämä ominaisuus (On tai Off) ilmaisee, tuleeko aktiivisena olevan päätepisteen skaalata kapasiteetin käyttö nollaan ilman liikennettä. Jos automaattinen uni on käytössä, päätepisteeseen tulee käyttämättömyystila viiden minuutin kuluttua ilman saapuvia pyyntöjä. Ensimmäinen kutsu, joka herättää tyhjän päätepisteen, sisältää lyhyen viiveen. On

Aktivoi mallin päätepisteet

Voit aktivoida mallin päätepisteet suoraan Fabric-rajapinnasta. Siirry versioon, johon haluat näyttää reaaliaikaiset ennusteet, ja valitse nauhasta "Aktivoi version päätepiste".

Screenshot, jossa näytetään, miten ML-mallin päätepiste aktivoidaan Fabric-rajapinnasta.

Toast-viesti kertoo, että Fabric valmistaa päätepisteesi palvelemaan ennusteita, ja päätepisteen tila muuttuu "Aktivoituu"-tilaksi. Kulissien takana Fabric käynnistää taustalla olevan konttiinfrastruktuurin mallisi isännöintiä varten. Päätepiste on valmis ennakoimaan ennusteita muutaman minuutin kuluessa.

Näyttökuva, jossa näkyy koneoppimismallin päätepiste, joka aktivoi nyt.

Jokaisella päätepisteellä on tila, joka osoittaa, onko se valmis reaaliaikaisiin ennusteisiin:

Status Description
Inactive Päätepiste ei ole aktivoitu palvelemaan reaaliaikaisia ennusteita, eikä se kuluta Fabric-kapasiteettia.
Activating Päätepistettä määritetään palvelemaan reaaliaikaisia ennusteita. Kulissien takana Fabric asettaa taustalla olevan konttiinfrastruktuurin mallin isännöintiin. Päätepiste on aktiivinen muutaman minuutin kuluessa.
Active Päätepiste on valmis reaaliaikaisten ennusteiden palvelemiseen. Kulissien takana Fabric hallinnoi taustalla olevaa infrastruktuuria, laajentaen resurssien käyttöä saapuvan liikenteen perusteella. Suurempi liikenne johtaa suurempaan Fabric-kapasiteetin käyttöön.
Deactivating Päätepiste deaktivoidaan, joten se ei enää palvele reaaliaikaisia ennusteita tai kuluta Fabric-kapasiteettia. Kulissien takana Fabric purkaa alla olevan konttiinfrastruktuurin.

Note

Koneoppimismallit voivat tukea aktiivisia päätepisteitä enintään viidelle versiolle kerralla. Jotta voit antaa ennusteita kuudennesta versiosta, aktiivisen päätepisteen aktivointi on ensin poistettava.

Mallien päätepisteiden hallinta

Saat yleiskatsauksen mallisi aktiivisista päätepisteistä valitsemalla Päätepisteiden hallinta -vaihtoehdon käyttöliittymän valintanauhasta. Jokaisella mallilla on mukautettava oletuspäätepiste, joka lähettää ennusteita valitsemastasi versiosta. Voit päivittää oletusversion asetukset-ruudun avattavan valikon valitsimella.

Näyttökuva, jossa näkyy koneoppimismallin oletusarvoinen päätepisteen URL-osoite, jonka voit määrittää palvelemaan tietyn version ennusteita.

Important

Muista määrittää oletusominaisuudeksi aktiivinen versio, jos aiot käyttää sitä. Jos oletusominaisuutta ei ole määritetty tai jos se on määritetty passiiviseksi versioksi, kutsut oletuspäätepisteeseen epäonnistuvat.

Kaikki versiot, joissa on aktiiviset päätepisteet, on listattu mallin pääteasetuksissa. Voit muokata kunkin päätepisteen automaattista lepotilaominaisuutta vaihtamalla valitsimen arvoksi "On" tai "Off".

Näyttökuva, jossa näytetään, miten voit muuttaa automaattianalyysipalveluiden mallin päätepisteiden automaattista lepotilaominaisuutta.

Tip

Aktiiviset päätepisteet, joissa automaattinen lepotila on käytössä, muuttuvat käyttämättömyystilaksi viiden minuutin kuluttua ilman liikennettä, ja ensimmäinen kutsu, joka herättää ne, aiheuttaa lyhyen viiveen. Haluat ehkä poistaa tämän ominaisuuden käytöstä tuotannon päätepisteissä.

Kyselymallin päätepisteistä reaaliaikaisia ennusteita varten

Mallipäätepisteet ovat saatavilla välittömään testaukseen low-code-kokemuksella Fabric-muodossa. Siirry aktiivisen päätepisteen sisältävään versioon ja valitse käyttöliittymän valintanauhasta Esikatsele ennusteita. Voit lähettää näytepyyntöjä päätepisteelle – ja saada näyteennusteita reaaliajassa – käyttämällä lomakekenttiä, jotka vastaavat mallin syöteallekirjoitusta.

Näyttökuva, jossa näkyy sisäinen esikatselukokemus malliennusteiden hankkimiseksi aktiivisesta koneoppimismallin päätepisteestä.

Jos haluat täyttää lomakekentät satunnaisilla malliarvoilla, valitse "Automaattinen täyttö". Voit lisätä lomakearvojoukkoja testataksesi päätepistettä useilla syötteillä. Lähetä mallipyyntösi päätepiste valitsemalla Hae ennusteet.

Näyttökuva, jossa näkyy lomakepohjainen näkymä mallipyyntöjen lähettämiseksi aktiiviseen koneoppimismallin päätepisteeseen.

Jos haluat muotoilla mallipyyntöjä JSON-hyötykuormiksi, vaihda näkymää avattavan valikon valitsimella.

Näyttökuva, jossa näkyy JSON-pohjainen näkymä mallipyyntöjen lähettämiseksi aktiiviseen koneoppimismallin päätepisteeseen.

Mallin päätepisteiden aktivoinnin poistaminen

Voit deaktivoida mallin päätepisteet suoraan Fabric-rajapinnasta. Siirry versioon, jonka reaaliaikaisia ennusteita ei enää tarvitse antaa, ja valitse käyttöliittymän valintanauhasta Poista version päätepiste käytöstä.

Screenshot, joka näyttää, miten ML-mallin päätepiste deaktivoidaan Fabric-rajapinnasta.

Toast-viesti näyttää, että Fabric purkaa aktiivisen käyttöönottoasi, ja päätepisteen tila muuttuu "Deaktivointiin". Päätepiste ei enää pysty palvelemaan reaaliaikaisia ennusteita, ellei sitä aktivoida uudelleen.

Näyttökuva, jossa näkyy koneoppimismallin päätepiste, joka poistaa nyt käytöstä.

Voit deaktivoida päätepisteet useille versioille samanaikaisesti mallin asetuksista. Valitse käyttöliittymän valintanauhasta Päätepisteiden hallinta ja valitse vähintään yksi aktiivinen päätepiste, jonka aktivoinnin voi poistaa.

Screenshot, joka näyttää, miten useat ML-mallin päätepisteet deaktivoidaan samanaikaisesti Fabric-rajapinnasta.

Kulutusaste

Aktiivisten mallipäätepisteiden isännöinti kuluttaa Fabric Capacity Units (CU) -yksiköitä. Päätepisteet suoritetaan laskentasolmuissa ja voivat skaalata automaattisesti jopa kolmeen solmuun saapuvan liikenteen perusteella. Laskutus lasketaan solmukohtaisesti, kun päätepiste on aktiivinen. Alla oleva taulukko näyttää aktiivisen Automaattianalyysipalvelut -mallin päätepisteen CU-kulutuksen.

Toiminto Operaation mittayksikkö Kulutusaste
Mallin päätepiste 1 mallin päätepiste (versio) sekunnissa solmua kohden 5 CU-sekuntia

Alla olevassa taulukossa on esimerkkiskenaarioita ja niitä vastaavia kulutusnopeuksia ja tuntikustannuksia.

Skenaario Description Kulutusaste Tuntikohtainen kustannus
Mallit, joissa on passiivisia päätepisteitä Näissä malleissa ei ole aktiivisia versiopäätepisteitä eikä niihin liittyvää resurssien käyttöä. Niistä ei aiheudu lisäkustannuksia. 0 CU-sekuntia 0 CU-tunti
Mallit, joissa on aktiiviset mutta käyttämättömät päätepisteet Näissä malleissa on yksi tai useampi aktiivisen version päätepiste, mutta ilman säännöllistä liikennettä kaikki ovat skaalautuneet nollaan, mikä vähentää kustannuksia automaattisesti. 5 CU-sekuntia 0.42 CU-tuntia
Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva alhainen liikenne Näissä malleissa on vain 1 aktiivinen version päätepiste, joka palvelee ennusteita, mutta ei tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. Yksi solmu voi palvella kaikkea liikennettä. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. 5 CU-sekuntia 5 CU-tuntia
Mallit, joissa on 1 aktiivinen päätepiste ja jatkuva suuri liikenne Näissä malleissa on vain 1 aktiivisen version päätepiste, joka palvelee ennusteita, ja liikennettä riittää käynnistämään täyden skaalauksen. Muut version päätepisteet voivat olla passiivisia tai käyttämättömiä. 15 CU-sekuntia 15 CU-tuntia
Mallit, joissa on 5 aktiivista päätepistettä ja jatkuva suuri liikenne Näissä malleissa on 5 aktiivisen version päätepistettä (nykyinen raja), jotka palvelevat ennusteita, joista jokaisella on tarpeeksi liikennettä täyden skaalauksen käynnistämiseksi. 75 CU-sekuntia 75 CU-tuntia

Fabric Capacity Metrics -sovellus näyttää mallin päätepisteoperaatioiden kokonaiskapasiteetin käytön nimellä "Model Endpoint". Lisäksi käyttäjät voivat tarkastella yhteenvetoa mallin päätepisteen käytön laskutusmaksuistaan laskutuskohdassa "ML Model Endpoint Capacity Usage CU".

Mallin päätepistetoiminto luokitellaan taustatoiminnoiksi.

Kulutusluvut voivat muuttua milloin tahansa. Microsoft käyttää kohtuullisia ponnistuksia ilmoittaakseen ilmoituksen sähköpostitse tai tuotteen sisäisen ilmoituksen kautta. Muutokset astuvat voimaan Microsoft Release Notesissa tai Microsoft Fabric Blogissa ilmoitettuna päivänä. Jos Fabric Consumption Rate -mallin päätepisteen muutos kasvattaa merkittävästi käytettävän kapasiteetin yksiköiden (CU) määrää, asiakkaat voivat käyttää valitun maksutavan peruutusvaihtoehtoja.