Zusammenfassung

1 Minute

In diesem Modul haben Sie mehr über visionsfähige generative KI-Modelle und die Implementierung von Chatlösungen gelernt, die bildbasierte Eingaben enthalten.

Mit visionsfähigen Modellen können Sie KI-Lösungen erstellen, die Bilder verstehen und auf verwandte Fragen oder Anweisungen reagieren können. Neben dem Identifizieren von Objekten in Bildern können einige Modelle auch basierend auf dem, was sie sehen, Gründe verwenden. Beispielsweise können sie ein Diagramm interpretieren oder bewerten, ob ein Objekt beschädigt ist.

Tipp

Weitere Informationen zum Analysieren von Bildern mit der OpenAI-Antwort-API finden Sie im OpenAI-Entwicklerhandbuch unter "Images and vision ".

Feedback

War diese Seite hilfreich?