Azure Machine Learning を使用すると、コンピューター上のファイルまたはフォルダー、クラウド ストレージ内の場所、Azure Machine Learning データ資産、Git リポジトリ、または SQL データベースからベクトル インデックスを作成できます。 Azure Machine Learning では、さまざまな種類のドキュメント、コード、およびプレゼンテーション ファイルを処理できます。 完全な一覧については、「 サポートされているファイルの種類」を参照してください。 新しいインデックスを作成する代わりに、既存の Azure AI 検索 (旧称 Cognitive Search) インデックスを再利用することもできます。
ベクトル インデックスを作成すると、Azure Machine Learning はデータをチャンクし、埋め込みを作成し、埋め込みを Faiss インデックスまたはAzure AI 検索 インデックスに保存します。 さらに、Azure Machine Learning は以下を作成します。
データ ソースのテスト データ。
作成したベクトル インデックスを使用するサンプル プロンプト フロー。 サンプル プロンプト フローの機能は次のとおりです:
- 自動的に生成されたプロンプト バリアント。
- 生成されたテスト データを使用した各プロンプト バリアントの評価。
- 実行する最適なバリアントを選択するのに役立つ、各プロンプトバリアントに対するメトリック。
このサンプルを使用すると、プロンプトの開発を続行できます。
重要
現在、この機能はパブリック プレビュー段階にあります。 このプレビュー バージョンはサービス レベル アグリーメントなしで提供されており、運用環境のワークロードに使用することは推奨されません。 特定の機能はサポート対象ではなく、機能が制限されることがあります。
詳しくは、Microsoft Azure プレビューの追加使用条件に関するページをご覧ください。
前提条件
Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、無料アカウントを作成してください。
Microsoft Foundry モデルの Azure OpenAI へのアクセス。
Azure Machine Learning ワークスペースで有効になっているプロンプト フロー。 [プレビュー機能を管理] パネルの [プロンプト フローを使用して AI ソリューションを構築] をオンにすると、プロンプト フローを有効にできます。
Machine Learning Studio を使用してベクトル インデックスを作成する
左側のメニューで [プロンプト フロー] を選択します。
[ベクトル インデックス] タブを選択します。
[作成] を選択します
ベクトル インデックス作成フォームが開いたら、ベクトル インデックスの名前を指定します。
重要
インデックスを Azure AI 検索 に格納する場合、インデックス名は Azure AI 検索 の名前付け規則 (2 ~ 128 文字、小文字、数字、ハイフン (
-)、アンダースコア (_) のみに準拠している必要があります。最初の文字は文字または数字にする必要があります。連続するハイフンやアンダースコアは使用できません。 これらの規則に違反する名前を指定すると、最終的なインデックス作成手順中にジョブが失敗します。これは、長い処理の実行後に発生する可能性があります。データ ソースの種類を選択します。
選択した種類に基づいて、ソースの場所の詳細を指定します。 次に、 [次へ] を選択します。
ベクトル インデックスの詳細を確認し、[作成] ボタンを選択します。
表示される概要ページで、ベクトル インデックスの作成状態を追跡および表示できます。 データのサイズによっては、処理に時間がかかる場合があります。
ベクトル インデックスをプロンプト フローに追加する
ベクトル インデックスを作成したら、それをプロンプト フロー キャンバスからプロンプト フローに追加できます。
既存のプロンプト フローを開きます。
プロンプト フロー デザイナーの上部メニューで、[その他のツール] を選択し、[インデックス参照] を選択します。
インデックス参照ツールがキャンバスに追加されます。 ツールがすぐに表示されない場合は、キャンバスの下部までスクロールします。
ベクトル インデックスの名前を入力します。
[mlindex_content] 値ボックスを選択し、インデックスを選択します。 ツールが、チュートリアルの "ベクトル インデックスを作成する" セクションで作成されたインデックスを検出します。 必要なすべての情報を入力した後、[保存] を選択して生成ドロワーを閉じます。
インデックスに対して実行する queries と query_types を入力します。
この場合に入力できるプレーン文字列は、例えば
How to use SDK V2?'. Here is an example of an embedding as an input:${embed_the_question.output}' です。 プレーン文字列を渡すことは、ベクトル インデックスが、これを作成したワークスペースで使用されている場合にのみ機能します。
サポートされるファイルの種類
ベクター インデックス ジョブを作成するためのサポートされているファイルの種類: .txt、.md、.html、.htm、.py、.pdf、.ppt、.pptx、.doc、.docx、.xls、.xlsx。 その他のファイルの種類は、作成時に無視されます。
次のステップ
- プロンプト フロー サンプル (プレビュー) を使用して RAG の使用を開始 する - コードなしのコンポーネントを使用して RAG パイプラインをビルドします。
- Azure Machine Learning でベクター ストアを使用する (プレビュー) - ベクター ストア オプションとしての Azure AI 検索 と Fais について説明します。