Microsoft Foundry ポータルでビジョン対応モデルを使用する

3 分

画像を含むプロンプトを処理するには、 マルチモーダル 生成 AI モデル (つまり、テキストベースの入力だけでなく、画像ベース (場合によってはオーディオベース) の入力もサポートするモデル) をデプロイする必要があります。 Microsoft Foundry で使用できるマルチモーダルモデルには、次のようなものがあります。

マイクロソフト Phi-4-マルチモーダル-インストラクト
OpenAI gpt-4.1
OpenAI gpt-4.1-mini

ヒント

Microsoft Foundry で使用可能なモデルの詳細については、Microsoft Foundry ドキュメントの Microsoft Foundry モデルの概要 に関する記事を参照してください。

イメージベースのプロンプトを使用したマルチモーダルモデルのテスト

マルチモーダルモデルをデプロイした後は、Microsoft Foundry ポータルのチャットプレイグラウンドでテストできます。

画像ベースのプロンプトが表示されたチャットプレイグラウンドのスクリーンショット。

チャットプレイグラウンドでは、ローカルファイルから画像をアップロードし、メッセージにテキストを追加して、マルチモーダルモデルからの応答を引き出すことができます。

フィードバック

このページはお役に立ちましたか?

Microsoft Foundry ポータルでビジョン対応モデルを使用する

イメージ ベースのプロンプトを使用したマルチモーダル モデルのテスト

フィードバック

イメージベースのプロンプトを使用したマルチモーダルモデルのテスト