Introdução
A pesquisa visual computacional é um campo da IA que permite que os computadores interpretem e entendam informações visuais do mundo, como imagens, vídeos e feeds de câmera ao vivo. Os recursos de pesquisa visual computacional são alimentados por modelos de IA e dão suporte à automação de todos os tipos de tarefas com uso intensivo de tempo.
Este módulo discutirá modelos de IA que podem identificar e analisar objetos, reconhecer padrões, ler texto em imagens e interpretar cenas como um humano faria. O módulo também aborda modelos de IA visual que podem ir além da análise de imagem para gerar novo conteúdo visual. Juntos, esses recursos permitem uma ampla variedade de aplicativos, desde a pesquisa de imagens e análise de documentos, até ferramentas criativas e experiências interativas de IA, permitindo que os sistemas vejam e criem informações visuais.
Considere estes aplicativos de pesquisa visual computacional:
Detecção de defeitos na fabricação: os sistemas de visão de IA inspecionam produtos em linhas de assembly em tempo real. Eles detectam defeitos de superfície, desalinhamentos ou componentes ausentes usando a detecção de objetos e a segmentação de imagem, reduzindo o desperdício e melhorando o controle de qualidade.
Análise de imagens médicas: a pesquisa visual computacional ajuda os radiologistas a analisar raios-X, ressonâncias magnéticas e tomografias. Os modelos de IA podem destacar anomalias como tumores ou fraturas, auxiliar no diagnóstico precoce e reduzir o erro humano.
Monitoramento de prateleira no varejo: os varejistas usam a visão de IA para monitorar as prateleiras das lojas. As câmeras detectam quando os produtos estão sem estoque ou perdidos, permitindo atualizações de inventário em tempo real e melhorando a experiência do cliente.
Veículos autônomos: os carros autônomos dependem da visão computacional para reconhecer placas de trânsito, marcas de pista, pedestres e outros veículos. Isso permite a navegação segura e a tomada de decisões em ambientes dinâmicos.
Em seguida, explore modelos multimodal no Microsoft Foundry, a oferta unificada de plataforma como serviço da Microsoft no Azure para operações de IA corporativa e desenvolvimento de aplicativos.
Observação
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Você pode optar por concluir este módulo em formato baseado em vídeo ou ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, talvez você queira se referir a ele como material complementar à apresentação de vídeo.