Käytä ai.classifya pandojen kanssa

Toiminto ai.classify luokittelee syötetyn tekstin generatiivisen tekoälyn avulla valitsemiesi mukautettujen tunnisteiden mukaan yhdellä koodirivillä.

Note

Yleiskuvaus

Toiminto ai.classifylaajentaa pandas-sarjan luokkaa. Jos haluat määrittää käyttäjän antamat otsikot kullekin syöteriville, kutsu funktiota pandas DataFrame -tekstisarakkeessa.

Funktio palauttaa pandas-sarjan, joka sisältää luokitusotsikoita ja jotka voidaan tallentaa uuteen DataFrame-sarakkeeseen.

Vihje

Suosittelemme käyttämään ai.classify-funktiota, jossa on vähintään kaksi syötetunnistetta.

Syntaksi

df["classification"] = df["input"].ai.classify("category1", "category2", "category3")

Parametrit

Nimi Kuvaus
labels
Pakollinen
Yksi tai useampi merkkijono , joka edustaa syöttötekstiarvoja vastaavia luokitusotsikoiden joukkoa.

Palautukset

Funktio palauttaa pandas-sarjan , joka sisältää luokitusotsikon kullekin syötetekstiriville. Jos tekstiarvoa ei voi luokitella, vastaava selite on null.

Esimerkki

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])

df["category"] = df['descriptions'].ai.classify("kitchen", "bedroom", "garage", "other")
display(df)

Tämä esimerkkikoodisolu tarjoaa seuraavan tulosteen:

Kuvakaappaus tietokehyksestä, jossa on

Multimodaalinen syöttö

Toiminto ai.classify tukee tiedostopohjaista multimodaalista syötettä. Voit luokitella kuvia, PDF-tiedostoja ja tekstitiedostoja asettamalla column_type="path" , milloin sarakkeesi sisältää tiedostopolkumerkkijonoja. Tuettuja tiedostotyyppejä column_type="path" ovat JPG/JPEG, PNG, GIF, WebP (kuvat), PDF (asiakirjat) sekä yleiset tekstimuodot kuten MD, TXT, CSV, JSON ja XML. Lisätietoja tuetuista tiedostotyypeistä ja asetuksista löytyy kohdasta Use multimodal input with AI functions.

# This code uses AI. Always review output for mistakes.

file_path_series = aifunc.list_file_paths("/lakehouse/default/Files")
custom_df = pd.DataFrame({"file_path": file_path_series})

custom_df["highest_degree"] = custom_df["file_path"].ai.classify(
    "Master", "PhD", "Bachelor", "Other",
)
display(custom_df)

Note

Kun luot tiedostopolun sarakkeen aifunc.list_file_paths() , palautetut yarl.URL objektit tunnistetaan automaattisesti tiedostopoluiksi. Sinun tarvitsee vain määrittää column_type="path" , milloin sarakkeessasi on pelkiä merkkijono-URL-osoitteita.

Voit myös käyttää aifunc.load tiedostojen vastaanottoon kansiosta DataFrameen ja luokitella tuloksena olevan tiedostopolkusarakkeen:

# This code uses AI. Always review output for mistakes.

df, schema = aifunc.load("/lakehouse/default/Files")
df["category"] = df["file_path"].ai.classify("Master", "PhD", "Bachelor", "Other")
display(df)

Kun käytät aifunc.load, tiedostopolkusarakkeessa on yarl.URL automaattisesti havaittavia objekteja. Tavallisille merkkijono-URL-osoitteille aseta column_type="path".

Vihje

Tekoälyfunktioiden edistymispalkin kustannuslaskuri voidaan konfiguroida tiloilla kuten basic, , tai disable tarjota reaaliaikaisia token- ja kapasiteetinkulutusarvioita kannettavassa ai.classifystatskäytössä. Lisätietoja löytyy kohdasta Määritä tekoälyfunktiot.