Einleitung

Abgeschlossen

Computervision ist ein Bereich der KI, mit dem Computer visuelle Informationen aus der Welt interpretieren und verstehen können , z. B. Bilder, Videos und Livekamerafeeds. Fähigkeiten der Computer Vision werden durch KI-Modelle angetrieben und unterstützen die Automatisierung aller Arten von zeitintensiven Aufgaben.

In diesem Modul werden KI-Modelle erläutert, die Objekte identifizieren und analysieren, Muster erkennen, Text in Bildern lesen und Szenen ähnlich interpretieren können wie ein Mensch. Das Modul befasst sich auch mit visuellen KI-Modellen, die über die Bildanalyse hinausgehen können, um neue visuelle Inhalte zu generieren. Zusammen ermöglichen diese Funktionen eine breite Palette von Anwendungen von der Bildsuche und Dokumentanalyse bis hin zu kreativen Tools und interaktiven KI-Erfahrungen, indem Systeme sowohl visuelle Informationen anzeigen als auch erstellen können.

Berücksichtigen Sie diese Anwendungen der Computervision:

  • Fehlererkennung in der Fertigung: KI-Vision-Systeme prüfen Produkte in Montagelinien in Echtzeit. Sie erkennen Oberflächenfehler, Fehlausrichtungen oder fehlende Komponenten mithilfe der Objekterkennung und Bildsegmentierung, verringern den Abfall und verbessern die Qualitätskontrolle.

  • Medizinische Bildgebungsanalyse: Die Computervision hilft Radiologen bei der Analyse von Röntgenstrahlen, MRIs und CT-Scans. KI-Modelle können Anomalien wie Tumoren oder Frakturen hervorheben, bei der frühen Diagnose helfen und den menschlichen Fehler reduzieren.

  • Regalüberwachung im Einzelhandel: Einzelhändler verwenden KI-Vision, um Regale zu überwachen. Kameras erkennen, wann Produkte nicht mehr vorrätig sind oder falsch platziert sind, wodurch Echtzeit-Bestandsupdates ermöglicht und die Kundenerfahrung verbessert wird.

  • Autonome Fahrzeuge: Selbstfahrende Autos setzen auf computergestützte Vision, um Straßenschilder, Spurmarkierungen, Fußgänger und andere Fahrzeuge zu erkennen. Dies ermöglicht eine sichere Navigation und Entscheidungsfindung in dynamischen Umgebungen.

Erkunden Sie als Nächstes multimodale Modelle in Microsoft Foundry, dem einheitlichen Plattform-as-a-Service-Angebot von Microsoft für Unternehmen für KI-Vorgänge und Anwendungsentwicklung in Azure für Unternehmen.

Hinweis

Wir erkennen, dass verschiedene Menschen gerne auf unterschiedliche Weise lernen. Sie können dieses Modul im videobasierten Format abschließen oder den Inhalt als Text und Bilder lesen. Der Text enthält größere Details als die Videos. In einigen Fällen sollten Sie also auf den Text als ergänzendes Material für die Videopräsentation verweisen.