Microsoft Foundry のインスタントモデル (プレビュー)

インスタントモデルを使用すると、サポートされているモデルを名前で呼び出し、デプロイは必要ありません。 Foundry プロジェクトを作成し、コーディングを開始し、使用可能なモデルをすぐに使用します。

Prerequisites

Azure サブスクリプション。無料で作成できます。
Microsoft Foundry にサインインします。 「New Foundry」トグルがオンになっていることを確認してください。 これらの手順は Foundry (新規) を参照します。
米国西部 3 の Foundry プロジェクト (プレビュー期間中にインスタントモデルでサポートされている唯一のリージョン)。プロジェクトを作成する必要がある場合は、「プロジェクトの作成」を参照してください。
プロジェクトまたはアカウント上の Foundry ユーザー ロール。

Important

Foundry RBAC ロールの名前が最近変更されました。 Foundry User, Foundry Owner, Foundry Account Owner、および Foundry Project Manager は、以前は、AZURE AI ユーザー、Azure AI 所有者、Azure AI アカウント所有者、および AZURE AI Project Manager という名前でした。名前の変更がロールアウトされている間、以前の名前が表示される場合があります。ロール ID とコアアクセス許可は、名前の変更によって変更されません。

モデルの使用をすぐに開始する

インスタントモデルでは、ワークフローは単純であり、コードでサポートされているインスタントモデル名を使用します。デプロイは必要ありません。デプロイに既に使用しているのと同じ API、SDK、およびクライアントは、インスタントモデルで動作します。 2 つ目の SDK、個別のクライアント、構成の変更はありません。

デプロイベースのコードからの唯一の変更は、 model パラメーターです。次のコードでは、 "gpt-5-mini" を任意のインスタントモデルの名前に置き換えます。

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

using Azure.Identity;
using Azure.AI.Projects;
using Azure.AI.Extensions.OpenAI;
using OpenAI.Responses;

#pragma warning disable OPENAI001

// Format: "https://resource_name.ai.azure.com/api/projects/project_name"
var ProjectEndpoint = "your_project_endpoint";

// Create project client to call Foundry API
AIProjectClient projectClient = new(
    endpoint: new Uri(ProjectEndpoint),
    tokenProvider: new DefaultAzureCredential());

// Run a responses API call
ProjectResponsesClient responseClient = projectClient.ProjectOpenAIClient.GetProjectResponsesClientForModel("gpt-5-mini"); 
ResponseResult response = await responseClient.CreateResponseAsync(
    "What is the size of France in square miles?");
Console.WriteLine(response.GetOutputText());

import { DefaultAzureCredential } from "@azure/identity";
import { AIProjectClient } from "@azure/ai-projects";

// Format: "https://resource_name.ai.azure.com/api/projects/project_name"
const PROJECT_ENDPOINT = "your_project_endpoint";

async function main(): Promise<void> {
    // Create project and openai clients to call Foundry API
    const project = new AIProjectClient(PROJECT_ENDPOINT, new DefaultAzureCredential());
    const openai = project.getOpenAIClient();

    // Run a responses API call
    const response = await openai.responses.create({
        model: "gpt-5-mini",
        input: "What is the size of France in square miles?",
    });
    console.log(`Response output: ${response.output_text}`);
}

main().catch(console.error);

package com.azure.ai.agents;

import com.azure.identity.DefaultAzureCredentialBuilder;
import com.openai.models.responses.Response;
import com.openai.models.responses.ResponseCreateParams;

public class CreateResponse {
    public static void main(String[] args) {
        // Format: "https://resource_name.ai.azure.com/api/projects/project_name"
        String ProjectEndpoint = "your_project_endpoint";

        // Create responses client to call Foundry API
        ResponsesClient responsesClient = new AgentsClientBuilder()
                .credential(new DefaultAzureCredentialBuilder().build())
                .endpoint(ProjectEndpoint)
                .buildResponsesClient();

        // Run a responses API call
        ResponseCreateParams responseRequest = new ResponseCreateParams.Builder()
                .input("What is the size of France in square miles?")
                .model("gpt-5-mini")
                .build();
        Response response = responsesClient.getResponseService().create(responseRequest);
        System.out.println(response.output());
    }
}

デプロイベースのコードからの唯一の変更は、 model パラメーターです。次のコードでは、 "gpt-5-mini" を任意のインスタントモデルの名前に置き換えます。また、 YOUR-FOUNDRY-RESOURCE-NAME を実際の値に置き換えます。

curl -X POST https://YOUR-FOUNDRY-RESOURCE-NAME.services.ai.azure.com/api/projects/YOUR-PROJECT-NAME/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_AI_AUTH_TOKEN" \
-d '{
        "model": "gpt-5.1-mini",
        "input": "What is the size of France in square miles?"
}'

インスタントモデルが重要な理由

1 つの文字列を変更してモデルを切り替えます 。デプロイを作成または削除することなく、 model= 行でインスタントモデル名を使用します。
同じ API と SDK — インスタントモデルとデプロイの両方で同じ呼び出しが機能します。
開発ツールと連携します 。インスタントモデルは、デプロイと同じように Foundry CLI、VS Code、CI/CD パイプラインと統合されます。

デプロイがなくなることはありません。予約済みのスループット、カスタムコンテンツフィルター、データ所在地、または高度なエンタープライズ構成が必要な場合は、適切な選択肢のままです。インスタントモデルは、使い始めやすくすることで、デプロイを、モデルを使う前に必ず越えなければならない関門ではなく、習熟に応じて進む次のステップにします。

サポートされているモデル

新しいモデルでは、リリース時に既定でインスタントアクセスがサポートされます。追加モデルのサポートは、顧客の需要に基づいて考慮されます。

インスタントアクセスをサポートするすべてのモデルを表示するには:

新しい Foundry エクスペリエンスで 、米国西部 3 でプロジェクトを開きます。
右上のナビゲーションで [検出 ] を選択し、左側のウィンドウで [モデル ] を選択します。
モデルカタログで、[開発オプション] で [インスタント] を選択して、使用可能なインスタントモデルを表示します。

インスタントモデルをプログラムで一覧表示することもできます。

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

Note

プレビュー期間中、インスタントモデルは 米国西部 3 のプロジェクトでのみ使用できます。

サブスクリプションにクォータがない場合でも、一部のインスタントモデルが一覧に表示されることがあります。詳細については、「 Foundry モデルのクォータと制限」を参照してください。

インスタントモデルとデプロイを使用するタイミング

Scenario	推奨される方法
作業の開始、プロトタイプ作成、または実験	インスタントモデル
リリース直後の最新モデルの使用	インスタントモデル
予約容量または予測可能なスループットが必要	デプロイメント
プロビジョニング済みスループット (PTU) が必要	デプロイメント
特定のリージョンにデータ所在地が必要	デプロイメント
モデルごとのカスタムコンテンツフィルタリングポリシー	デプロイメント
モデルごとのカスタムガードレール	デプロイメント
エンドポイント固有の構成 (エンドポイントごとのバージョンロックなど)	デプロイメント
チーム間でのきめ細かなクォータのパーティション分割	デプロイメント
微調整されたモデル	デプロイメント

インスタントモデルとデプロイは、同じプロジェクト内で共存できます。インスタントモデルから始めて、要件の進化に合わせてデプロイを後で作成できます。

モデルのバージョン

既定では、インスタントモデルは最新の常緑バージョンのモデルにルーティングされます。特定のバージョンにピン留めするには、モデル名にバージョン日付をハイフネーション付きのサフィックスとして追加します。

として渡す内容 `model`	Behavior
`model-name`	最新バージョンへのルート
`model-name-2025-04-01`	その特定のバージョンへのルート

バージョンのピン留めはオプトインです。アプリケーションで安定性が必要な場合は、バージョンサフィックスを含めます。それ以外の場合は、常に最新バージョンが自動的に取得されます。

クォータの消費方法

インスタントモデルは、サブスクリプションに割り当てられたモデルごとの グローバルクォータ プールから引き出されます。このクォータは、標準デプロイで使用されるリージョンクォータとは別です。

グローバルクォータの割り当てやパーティション分割は行いません。サブスクリプション内のすべてのインスタントモデルの使用状況にわたって自動的に共有されます。
グローバル標準デプロイでは、グローバルクォータの一部が予約されます。インスタントモデルでは、残っている容量が使用されます。
その他のデプロイの種類 (リージョン標準、プロビジョニング済み) では、個別のリージョンクォータが使用され、インスタントモデルの容量には影響しません。
インスタントモデルのリクエストがスロットルされる場合は、クォータの引き上げを申請するか、予約済み容量を持つデプロイを作成できます。

グローバルクォータとリージョンクォータの相互作用の詳細については、「クォータの管理と増加」を参照してください。

エンタープライズコントロール

能力	どのように機能するのか
特定のモデルまたはプロバイダーをブロックする	Azure Policy定義は、デプロイに適用するのと同じ方法でインスタントモデルに適用されます
モデルバージョンにピン留めする	モデル名にバージョンサフィックスを追加します ( モデルのバージョンを参照)
インスタントモデルを完全に無効にする	管理者は、Azure Policyを通じてサブスクリプションレベルでインスタントモデルをオフにすることができます

アカウントからインスタントモデルを削除するには、Bicepまたは ARM REST を使用して設定を構成します。

REST API
Bicep

アカウントを次の方法で更新します。

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

この要求本文を使用して、インスタントモデルアクセスを効果的にシャットダウンします。

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

instant ブロックを使用して既存のアカウントリソースを更新します。

resource account 'Microsoft.CognitiveServices/accounts@2026-01-15-preview' = {
  name: accountName
  location: location
  kind: 'AIServices'
  sku: {
    name: 'S0'
  }
  // Keep your existing account properties and add instant settings.
  properties: {
    instant: {
      raiPolicyName: 'Microsoft.DefaultV2'
      modelAllowList: []
    }
  }
}

Important

すべてのインスタントモデルでは、既定のガードレールとコンテンツフィルターが使用されます。ただし、インスタントモデルのモデルごとにカスタムガードレールまたは責任ある AI (RAI) ポリシーを構成することはできません。 API を使用してアカウントレベルで既定の RAI ポリシーを設定できますが、そのポリシーはすべてのインスタントモデルに一様に適用されます。個々のモデルに対して異なるコンテンツフィルタリングポリシーが必要な場合は、デプロイを使用します。

デプロイメント名の衝突

新しいデプロイでは、既存のモデル名と一致する名前を使用できません。名前がモデル名と競合する既存のデプロイがある場合、そのデプロイが優先され、そのプロジェクトではそのモデル名に対するインスタントモデルアクセスは使用できません。

プレビュー期間中の制限事項

米国西部 3 でのみ使用できます。
微調整されたモデルはサポートされていません。微調整されたモデルを使用するには、デプロイを作成します。
ガードレール、カスタム RAI ポリシー、およびコンテンツフィルターは、インスタントモデルでは構成できません。
対象となるのは、サポートされているモデルに記載されているモデルのみです。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-06-03

Microsoft Foundry のインスタント モデル (プレビュー)