ベクター検索用のバイナリベクターのインデックスを作成する

Azure AI 検索では、Collection(Edm.Byte) パックされたバイナリ型がサポートされ、ベクターデータのストレージとメモリのフットプリントがさらに削減されます。このデータ型は、 Cohere の Embed v3 バイナリ埋め込みモデルや、ベクターをバイナリバイトとして出力する他の埋め込みモデルやプロセスなどのモデルの出力に使用できます。

バイナリベクターのインデックスを構成するには、次の 3 つの手順があります。

二項ベクトル比較のハミング距離を指定するベクター検索アルゴリズムを追加する
アルゴリズムを指すベクタープロファイルを追加する
Collection(Edm.Byte)型のベクトルフィールドを追加し、ハミング距離を割り当てる

この記事では、REST API を使用して説明しますが、Azure SDKまたは Azure ポータルを使用して、バイナリフィールドをインデックスに追加することもできます。バイナリデータ型をフィールドに割り当てるには、インデックス - 作成またはインデックス - REST API の作成または更新を使用します。

ヒント

フットプリントが小さいバイナリベクターのサポートを調査している場合は、Azure AI 検索のベクター量子化機能とストレージ削減機能も検討できます。入力は float32 または float16 埋め込みです。出力は、はるかに小さい形式でデータを格納します。詳細については、「バイナリ量子化またはスカラー量子化を使用した圧縮」および「狭いデータ型の割り当て」を参照してください。

前提条件

インデックスの作成とベクターフィールドの追加に関する知識。
次元あたり 1 ビットのバイナリベクトル。値あたり 8 ビットの uint8 値でパッケージ化されます。これらのベクトルを取得するには、 パッケージ化されたバイナリ ベクトルを直接生成するモデルを使用するか、インデックス作成と取得中にクライアントアプリケーションでベクターをバイナリベクターに量子化します。

制限

Import data ウィザードでのAzure ポータルのサポートはありません。
Microsoft Foundry モデルカタログからのモデルの統合ベクター化に使用される AML スキルのバイナリフィールドはサポートされていません。

ベクター検索アルゴリズムとベクタープロファイルを追加する

ベクター検索アルゴリズムは、インデックス作成中にクエリナビゲーション構造を作成します。二項ベクトル・フィールドの場合、システムはハミング距離メトリックを使用してベクトル比較を実行します。

バイナリベクトルのベクター検索を構成するには:

インデックス - 作成または更新 (REST API) 要求を設定します。
インデックススキーマで、プロファイルとアルゴリズムを指定する vectorSearch セクションを追加します。
の類似性メトリックを使用する 1 つ以上のhammingを追加します。階層ナビゲーション可能小世界 (HNSW) アルゴリズムは一般的ですが、完全な K ニアレストネイバー (KNN) でハミング距離を使用することもできます。
アルゴリズムを指定する 1 つ以上のベクタープロファイルを追加します。

次の例は、基本的な vectorSearch 構成を示しています。

  "vectorSearch": { 
    "profiles": [ 
      { 
        "name": "myHnswProfile", 
        "algorithm": "myHnsw", 
        "compression": null, 
        "vectorizer": null 
      } 
    ], 
    "algorithms": [ 
      { 
        "name": "myHnsw", 
        "kind": "hnsw", 
        "hnswParameters": { 
          "metric": "hamming" 
        } 
      }, 
      { 
        "name": "myExhaustiveKnn", 
        "kind": "exhaustiveKnn", 
        "exhaustiveKnnParameters": { 
          "metric": "hamming" 
        } 
      } 
    ] 
  }

インデックスにバイナリフィールドを追加する

インデックスの fields コレクションには、ドキュメントキー、ベクターフィールド、およびハイブリッド検索シナリオに必要なその他のフィールドのフィールドを含める必要があります。

バイナリフィールドは Collection(Edm.Byte) 型を使用し、パックされた形式の埋め込みを含みます。たとえば、元の埋め込みディメンションが 1024の場合、パックされたバイナリベクターの長さは ceiling(1024 / 8) = 128。パックされたフォームを取得するには、フィールドに vectorEncoding プロパティを設定します。

バイナリベクターフィールドをインデックスに追加するには:

フィールドコレクションにフィールドを追加し、名前を付けます。
データ型を Collection(Edm.Byte) に設定します。
vectorEncodingをバイナリエンコードのpackedBitに設定します。
dimensionsを1024に設定します。元の (アンパックされた) ベクターディメンションを指定します。
vectorSearchProfileは、前の手順で定義したプロファイルに設定します。
searchableをtrueに設定します。

次のフィールド定義は、インデックススキーマのバイナリベクターフィールドの例です。

  "fields": [ 
    . . . 
    { 
      "name": "my-binary-vector-field", 
      "type": "Collection(Edm.Byte)", 
      "vectorEncoding": "packedBit", 
      "dimensions": 1024, 
      "vectorSearchProfile": "myHnswProfile",
      "searchable": true
    },
   . . . 
  ]

azure-search-vector-samples リポジトリで、スキーマ定義、ベクター化、インデックス作成、クエリを含むエンドツーエンドのワークフローを確認します。
C#、Python、JavaScript のベクター検索デモコードを確認します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-30

ベクター検索用のバイナリ ベクターのインデックスを作成する

前提 条件

制限

ベクター検索アルゴリズムとベクター プロファイルを追加する

インデックスにバイナリ フィールドを追加する

関連コンテンツ

フィードバック

その他のリソース

ベクター検索用のバイナリベクターのインデックスを作成する

前提条件

ベクター検索アルゴリズムとベクタープロファイルを追加する

インデックスにバイナリフィールドを追加する