file_search ツールを使用する
ヒント
詳細については、「 テキストと画像 」タブを参照してください。
file_search ツールを使用すると、モデルは、応答中にアップロードされた独自のドキュメントから関連情報を取得できます。
file_search ツールとは
file_search ツールは、ポリシー ドキュメント、マニュアル、コントラクト、内部ナレッジ ベースなど、プライベートまたはドメイン固有のファイルを使用してモデルが質問に回答するのに役立ちます。 モデルでは、一般的なトレーニング データのみに依存するのではなく、インデックス付きファイルの内容を検索し、根拠のある回答を返すことができます。
これは、信頼された内部ドキュメントからの正確な応答が必要な場合に特に便利です。
主な機能は次のとおりです。
- ドキュメントに基づく回答 - 応答はアップロードされたファイルに基づいています
- セマンティック検索 - キーワードの正確な一致だけでなく、意味によって関連する箇所を検索します
- ベクター ストア統合 - 1 つ以上のインデックス付きドキュメント コレクションを検索する
- 引用と透明性 - デバッグと追跡可能性のために一致した結果を含める
- 企業の関連性の向上 - モデル出力で組織固有の知識を使用する
一般的なユース ケース
| ユースケース(事例) | 例 |
|---|---|
| ポリシー Q&A | 人事ポリシー PDF から従業員の質問に回答する |
| サポート アシスタント | 内部トラブルシューティング ガイドから製品ステップを取得する |
| リーガルレビュー | 契約書類間で特定の条項を見つける |
| ナレッジの検出 | 技術ドキュメント セットからの回答を要約する |
簡単な例
file_searchが有効になっている OpenAI Responses API の使用例を次に示します。
from openai import OpenAI
client = OpenAI(
base_url={openai_endpoint},
api_key={auth_key_or_token}
)
# Create vector store and upload a file
vector_store = client.vector_stores.create(name="policy-docs")
client.vector_stores.files.upload_and_poll(
vector_store_id=vector_store.id,
file=open("expenses_policy.pdf", "rb")
)
# Get response using the file_search tool
response = client.responses.create(
model=model_deployment,
instructions="You are an AI assistant that provides information from HR policy documents.",
input="What's the maximum amount I can claim for a taxi ride?",
tools=[{
"type": "file_search",
"vector_store_ids": [vector_store.id]
}],
include=["file_search_call.results"]
)
print(response.output_text)
このフローでは、モデルはインデックス付きポリシー ファイルを検索し、取得した通路を使用して根拠のある回答を生成します。
file_search ツールのしくみ
file_search ツールを使用する一般的なプロセスは次のとおりです。
- ファイルを準備 する - ベクター ストアにドキュメントをアップロードします。
- 要求を送信する - ベクター ストア ID を持つツール配列にfile_searchを含めます。
- モデルが取得を実行する - インデックス付きチャンクを検索して関連するコンテンツを検索します。
- 結果が挿入されます 。一致する通路がモデルに提供されます。
- 応答が生成される - 取得されたドキュメント コンテキストを使用してモデルが回答します。
ベスト プラクティス
- 高品質のソース ファイルを使用 する - 現在のドキュメントをクリーンにして、取得の精度を向上させる
- 絞り込みプロンプトを書く - あいまいな一致を減らすために特定の質問をする
- ベクタトル ストアを慎重にスコーピングする - 必要に応じて、HR、法務、財務のドメインを個別に分ける
- 開発に検索結果を含める - トラブルシューティングには応答に含まれる情報を使用する
- 重要なワークフローの回答を確認 する - 高いリスクのシナリオで人間の検証を維持する
知っておくべき制限事項
- 回答の品質は、ドキュメントの品質、カバレッジ、チャンクの関連性によって異なります
- 非常に大きいまたはドメインが混在するストアは、あまりフォーカスされていないコンテキストを返す可能性があります
- 更新されたソース ファイルでは、新しいコンテンツを検索する前にインデックスの再作成が必要になる場合があります
- 取得は基礎を改善しますが、機密性の高い意思決定のための人間のレビューを置き換えることはありません
上手に使用すると、file_searchは汎用モデルをドメイン対応のアシスタントに変換し、チームが実際に使用するドキュメントから回答を得られるようになります。
Note
file_search ツールは、特定のドキュメントまたはデータ ファイルのセットにモデルを固定する優れた方法です。 ただし、複数のデータ ストア内の大量のデータにアクセスする必要があるエンタープライズ規模のエージェントの場合は、Microsoft Foundry エージェントで Foundry IQ ナレッジ ストア ソリューションを使用することを検討する必要があります。 詳細については、Foundry IQ を使用したナレッジ強化 AI エージェントの構築に関するページを参照してください。