インスタント モデルを使用すると、サポートされているモデルを名前で呼び出し、デプロイは必要ありません。 Foundry プロジェクトを作成し、コーディングを開始し、使用可能なモデルをすぐに使用します。
Prerequisites
- Azure サブスクリプション。 無料で作成できます。
-
Microsoft Foundry にサインインします。
「New Foundry」トグルがオンになっていることを確認してください。 これらの手順は Foundry (新規) を参照します。
- 米国西部 3 の Foundry プロジェクト (プレビュー期間中にインスタント モデルでサポートされている唯一のリージョン)。 プロジェクトを作成する必要がある場合は、「プロジェクトの 作成」を参照してください。
- プロジェクトまたはアカウント上の Foundry ユーザー ロール。
Important
Foundry RBAC ロールの名前が最近変更されました。 Foundry User, Foundry Owner, Foundry Account Owner、および Foundry Project Manager は、以前は、AZURE AI ユーザー、Azure AI 所有者、Azure AI アカウント所有者、および AZURE AI Project Manager という名前でした。 名前の変更がロールアウトされている間、以前の名前が表示される場合があります。ロール ID とコア アクセス許可は、名前の変更によって変更されません。
モデルの使用をすぐに開始する
インスタント モデルでは、ワークフローは単純であり、コードでサポートされているインスタント モデル名を使用します。 デプロイは必要ありません。 デプロイに既に使用しているのと同じ API、SDK、およびクライアントは、インスタント モデルで動作します。 2 つ目の SDK、個別のクライアント、構成の変更はありません。
デプロイ ベースのコードからの唯一の変更は、 model パラメーターです。 次のコードでは、 "gpt-5-mini" を任意のインスタント モデルの名前に置き換えます。
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient
# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"
# Create project and openai clients to call Foundry API
project = AIProjectClient(
endpoint=PROJECT_ENDPOINT,
credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()
# Run a responses API call
response = openai.responses.create(
model="gpt-5-mini",
input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")
インスタント モデルが重要な理由
-
1 つの文字列を変更してモデルを切り替えます 。デプロイを作成または削除することなく、
model=行でインスタント モデル名を使用します。 - 同じ API と SDK — インスタント モデルとデプロイの両方で同じ呼び出しが機能します。
- 開発ツールと連携します 。インスタント モデルは、デプロイと同じように Foundry CLI、VS Code、CI/CD パイプラインと統合されます。
デプロイがなくなることはありません。 予約済みのスループット、カスタム コンテンツ フィルター、データ所在地、または高度なエンタープライズ構成が必要な場合は、適切な選択肢のままです。 インスタントモデルは、使い始めやすくすることで、デプロイを、モデルを使う前に必ず越えなければならない関門ではなく、習熟に応じて進む次のステップにします。
サポートされているモデル
新しいモデルでは、リリース時に既定でインスタント アクセスがサポートされます。 追加モデルのサポートは、顧客の需要に基づいて考慮されます。
インスタント アクセスをサポートするすべてのモデルを表示するには:
- 新しい Foundry エクスペリエンスで 、米国西部 3 でプロジェクトを開きます。
- 右上のナビゲーションで [検出 ] を選択し、左側のウィンドウで [モデル ] を選択します。
- モデル カタログで、[開発オプション] で [インスタント] を選択して、使用可能なインスタント モデルを表示します。
インスタント モデルをプログラムで一覧表示することもできます。
SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"
az rest --method get \
--url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
--output json \
| jq -r '(.value // .models // .)[]
| select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
| .model.name' \
| sort -u
Note
プレビュー期間中、インスタント モデルは 米国西部 3 のプロジェクトでのみ使用できます。
サブスクリプションにクォータがない場合でも、一部のインスタント モデルが一覧に表示されることがあります。 詳細については、「 Foundry モデルのクォータと制限」を参照してください。
インスタント モデルとデプロイを使用するタイミング
| Scenario | 推奨される方法 |
|---|---|
| 作業の開始、プロトタイプ作成、または実験 | インスタント モデル |
| リリース直後の最新モデルの使用 | インスタント モデル |
| 予約容量または予測可能なスループットが必要 | デプロイメント |
| プロビジョニング済みスループット (PTU) が必要 | デプロイメント |
| 特定のリージョンに データ所在地 が必要 | デプロイメント |
| モデルごとのカスタム コンテンツ フィルタリング ポリシー | デプロイメント |
| モデルごとのカスタム ガードレール | デプロイメント |
| エンドポイント固有の構成 (エンドポイントごとのバージョン ロックなど) | デプロイメント |
| チーム間でのきめ細かな クォータ のパーティション分割 | デプロイメント |
| 微調整されたモデル | デプロイメント |
インスタント モデルとデプロイは、同じプロジェクト内で共存できます。 インスタント モデルから始めて、要件の進化に合わせてデプロイを後で作成できます。
モデルのバージョン
既定では、インスタント モデルは最新の常緑バージョンのモデルにルーティングされます。 特定のバージョンにピン留めするには、モデル名にバージョン日付をハイフネーション付きのサフィックスとして追加します。
として渡す内容 model |
Behavior |
|---|---|
model-name |
最新バージョンへのルート |
model-name-2025-04-01 |
その特定のバージョンへのルート |
バージョンのピン留めはオプトインです。 アプリケーションで安定性が必要な場合は、バージョン サフィックスを含めます。 それ以外の場合は、常に最新バージョンが自動的に取得されます。
クォータの消費方法
インスタント モデルは、サブスクリプションに割り当てられたモデルごとの グローバル クォータ プールから引き出されます。 このクォータは、標準デプロイで使用されるリージョン クォータとは別です。
- グローバル クォータの割り当てやパーティション分割は行いません。サブスクリプション内のすべてのインスタント モデルの使用状況にわたって自動的に共有されます。
- グローバル標準デプロイでは、グローバル クォータの一部が予約されます。 インスタント モデルでは、残っている容量が使用されます。
- その他のデプロイの種類 (リージョン標準、プロビジョニング済み) では、個別のリージョン クォータが使用され、インスタント モデルの容量には影響しません。
- インスタント モデルのリクエストがスロットルされる場合は、クォータの引き上げを申請するか、予約済み容量を持つデプロイを作成できます。
グローバル クォータとリージョン クォータの相互作用の詳細については、「クォータの 管理と増加」を参照してください。
エンタープライズ コントロール
| 能力 | どのように機能するのか |
|---|---|
| 特定のモデルまたはプロバイダーをブロックする | Azure Policy定義は、デプロイに適用するのと同じ方法でインスタント モデルに適用されます |
| モデルバージョンにピン留めする | モデル名にバージョン サフィックスを追加します ( モデルのバージョンを参照) |
| インスタント モデルを完全に無効にする | 管理者は、Azure Policyを通じてサブスクリプション レベルでインスタント モデルをオフにすることができます |
アカウントからインスタント モデルを削除するには、Bicepまたは ARM REST を使用して設定を構成します。
アカウントを次の方法で更新します。
PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json
この要求本文を使用して、インスタント モデル アクセスを効果的にシャットダウンします。
{
"properties": {
"instant": {
"raiPolicyName": "Microsoft.DefaultV2",
"modelAllowList": []
}
}
}
Important
すべてのインスタント モデルでは、既定 のガードレール とコンテンツ フィルターが使用されます。 ただし、インスタント モデルのモデルごとにカスタム ガードレールまたは責任ある AI (RAI) ポリシーを構成することはできません。 API を使用してアカウント レベルで既定の RAI ポリシーを設定できますが、そのポリシーはすべてのインスタント モデルに一様に適用されます。 個々のモデルに対して異なるコンテンツ フィルタリング ポリシーが必要な場合は、デプロイを使用します。
デプロイメント名の衝突
新しいデプロイでは、既存のモデル名と一致する名前を使用できません。 名前がモデル名と競合する既存のデプロイがある場合、そのデプロイが優先され、そのプロジェクトではそのモデル名に対するインスタント モデル アクセスは使用できません。
プレビュー期間中の制限事項
- 米国西部 3 でのみ使用できます。
- 微調整されたモデルはサポートされていません。 微調整されたモデルを使用するには、デプロイを作成します。
- ガードレール、カスタム RAI ポリシー、およびコンテンツ フィルターは、インスタント モデルでは構成できません。
- 対象となるのは、 サポートされているモデルに記載されているモデル のみです。