file_search ツールを使用する

5 分

ヒント

詳細については、「 テキストと画像 」タブを参照してください。

file_search ツールを使用すると、モデルは、応答中にアップロードされた独自のドキュメントから関連情報を取得できます。

file_search ツールとは

file_search ツールは、ポリシードキュメント、マニュアル、コントラクト、内部ナレッジベースなど、プライベートまたはドメイン固有のファイルを使用してモデルが質問に回答するのに役立ちます。モデルでは、一般的なトレーニングデータのみに依存するのではなく、インデックス付きファイルの内容を検索し、根拠のある回答を返すことができます。

これは、信頼された内部ドキュメントからの正確な応答が必要な場合に特に便利です。

主な機能は次のとおりです。

ドキュメントに基づく回答 - 応答はアップロードされたファイルに基づいています
セマンティック検索 - キーワードの正確な一致だけでなく、意味によって関連する箇所を検索します
ベクターストア統合 - 1 つ以上のインデックス付きドキュメントコレクションを検索する
引用と透明性 - デバッグと追跡可能性のために一致した結果を含める
企業の関連性の向上 - モデル出力で組織固有の知識を使用する

一般的なユースケース

ユースケース(事例)	例
ポリシー Q&A	人事ポリシー PDF から従業員の質問に回答する
サポートアシスタント	内部トラブルシューティングガイドから製品ステップを取得する
リーガルレビュー	契約書類間で特定の条項を見つける
ナレッジの検出	技術ドキュメントセットからの回答を要約する

簡単な例

file_searchが有効になっている OpenAI Responses API の使用例を次に示します。

from openai import OpenAI

client = OpenAI(
    base_url={openai_endpoint},
    api_key={auth_key_or_token}
)

# Create vector store and upload a file
vector_store = client.vector_stores.create(name="policy-docs")
client.vector_stores.files.upload_and_poll(
    vector_store_id=vector_store.id,
    file=open("expenses_policy.pdf", "rb")
)

# Get response using the file_search tool
response = client.responses.create(
    model=model_deployment,
    instructions="You are an AI assistant that provides information from HR policy documents.",
    input="What's the maximum amount I can claim for a taxi ride?",
    tools=[{
        "type": "file_search",
        "vector_store_ids": [vector_store.id]
    }],
    include=["file_search_call.results"]
)
print(response.output_text)

このフローでは、モデルはインデックス付きポリシーファイルを検索し、取得した通路を使用して根拠のある回答を生成します。

file_search ツールのしくみ

file_search ツールを使用する一般的なプロセスは次のとおりです。

ファイルを準備 する - ベクターストアにドキュメントをアップロードします。
要求を送信する - ベクターストア ID を持つツール配列にfile_searchを含めます。
モデルが取得を実行する - インデックス付きチャンクを検索して関連するコンテンツを検索します。
結果が挿入されます 。一致する通路がモデルに提供されます。
応答が生成される - 取得されたドキュメントコンテキストを使用してモデルが回答します。

ベストプラクティス

高品質のソースファイルを使用 する - 現在のドキュメントをクリーンにして、取得の精度を向上させる
絞り込みプロンプトを書く - あいまいな一致を減らすために特定の質問をする
ベクタトルストアを慎重にスコーピングする - 必要に応じて、HR、法務、財務のドメインを個別に分ける
開発に検索結果を含める - トラブルシューティングには応答に含まれる情報を使用する
重要なワークフローの回答を確認 する - 高いリスクのシナリオで人間の検証を維持する

知っておくべき制限事項

回答の品質は、ドキュメントの品質、カバレッジ、チャンクの関連性によって異なります
非常に大きいまたはドメインが混在するストアは、あまりフォーカスされていないコンテキストを返す可能性があります
更新されたソースファイルでは、新しいコンテンツを検索する前にインデックスの再作成が必要になる場合があります
取得は基礎を改善しますが、機密性の高い意思決定のための人間のレビューを置き換えることはありません

上手に使用すると、file_searchは汎用モデルをドメイン対応のアシスタントに変換し、チームが実際に使用するドキュメントから回答を得られるようになります。

Note

file_search ツールは、特定のドキュメントまたはデータファイルのセットにモデルを固定する優れた方法です。ただし、複数のデータストア内の大量のデータにアクセスする必要があるエンタープライズ規模のエージェントの場合は、Microsoft Foundry エージェントで Foundry IQ ナレッジストアソリューションを使用することを検討する必要があります。詳細については、Foundry IQ を使用したナレッジ強化 AI エージェントの構築に関するページを参照してください。

フィードバック

このページはお役に立ちましたか?