この記事では、外部処理にアクセスするためにスキルセットに含めることができる Azure AI 検索のスキルについて説明します。
スキルは、何らかの方法でコンテンツを変換するアトミック操作です。 多くの場合、テキストを認識または抽出する操作ですが、既存のエンリッチメントを整形するユーティリティ スキルになる場合もあります。 通常、出力はフルテキスト検索で使用するテキストベース、またはベクター 検索 で使用する ベクターです。
スキルは次のカテゴリに分類されます。
組み込みのスキルは、別の Azure リソースへの API 呼び出しをラップします。ここで、入力、出力、および処理の手順がよく理解されます。 組み込みのスキルの中には、課金専用のアタッチされたリソースが必要なスキルもあれば、Azure でホストされているモデルまたはリソースを課金と処理の両方に使用するスキルもあります。
カスタム スキルは、検索サービスの外部で実行されるカスタム コードを提供します。 URI を介してアクセスします。 カスタム コードは、多くの場合 Azure 関数アプリを通じて使用できます。 オープンソースまたはサードパーティーのベクトル化モデルをアタッチするには、カスタム スキルを使用します。
ユーティリティ スキルは Azure AI 検索 の内部にあり、外部リソースや送信接続には依存しません。 ほとんどのユーティリティ スキルは、請求不可です。
Built-in skills
組み込みスキルには、次の 2 種類があります。
- Microsoft Foundry リソースに接続するスキル (課金のみ)
- Azure でホストされるモデルまたはリソースに接続するスキル (課金と処理用)
Foundry resource
このカテゴリのスキルは、Foundry Tools のサブサービスを呼び出します。 処理ではなく請求の場合は、Foundry リソースをスキルセットにアタッチする必要があります。 Azure AI 検索 では、内部リソースを使用してこれらのスキルを実行し、課金目的でのみ Foundry リソースを使用します。
少量の処理は課金できませんが、大量の場合、処理は課金されます。 これらのスキルは、Foundry Tools の事前トレーニング済みモデルに基づいています。つまり、独自のデータを使用してモデルをトレーニングすることはできません。
これらのスキルは Standard レートで課金されます。
| Skill | Description | Metered by |
|---|---|---|
| Azure Vision マルチモーダル 埋め込み | マルチモーダル イメージとテキストのベクター化。 | Foundry Tools (価格) |
| カスタム エンティティ参照 | ユーザーが定義したカスタムの単語と語句のリストからテキストを検索します。 | Azure AI 検索 (価格) |
| Entity Linking | このスキルでは、事前トレーニング済みのモデルを使用し、認識されたエンティティに対して Wikipedia の記事へのリンクを生成します。 | Foundry Tools (価格) |
| Entity Recognition | このスキルでは、トレーニング済みモデルを使用し、"Person"、"Location"、"Organization"、"Quantity"、"DateTime"、"URL"、"Email"、"PersonType"、"Event"、"Product"、"Skill"、"Address"、"Phone Number" および "IP Address"の各フィールドのカテゴリの固定したセットに対してエンティティを確立します。 |
Foundry Tools (価格) |
| Image Analysis | このスキルでは、画像検出アルゴリズムを使用して画像の内容を識別し、テキストの説明を生成します。 | Foundry Tools (価格) |
| キー フレーズ抽出 | このスキルでは、トレーニング済みモデルを使用し、語句の配置、言語規則、他の語句との近さ、ソース データ内での語句の不自然さの程度に基づいて、重要な語句を検出します。 | Foundry Tools (価格) |
| Language Detection | このスキルでは、トレーニング済みモデルを使用し、使用されている言語を検出します (ドキュメントごとに 1 つの言語 ID)。 同じテキスト セグメント内で複数の言語が使用されている場合、出力は、主に使用されている言語の LCID になります。 | Foundry Tools (価格) |
| OCR | 光学式文字認識。 | Foundry Tools (価格) |
| PII Detection | このスキルは、事前トレーニングされたモデルを使用して、特定のテキストから個人情報を抽出します。 また、このスキルには、テキスト内で検出された個人情報エンティティをマスクするためのさまざまなオプションも用意されています。 | Foundry Tools (価格) |
| Sentiment | このスキルでは、トレーニング済みのモデルを使用し、レコードごとに文章とドキュメントレベルでサービスによって検出された最も高い信頼度スコアに基づいて、センチメント ラベル ("ネガティブ"、"中立"、"ポジティブ" など) を割り当てます。 | Foundry Tools (価格) |
| Text Translation | このスキルは、正規化やローカライズのユース ケースにおいて、事前トレーニング済みのモデルを使用して入力テキストをさまざまな言語に翻訳します。 | Foundry Tools (価格) |
Azure でホストされるモデルまたはリソース
このカテゴリのスキルは、課金と処理の両方で所有する Azure でホストされるモデルまたはリソースを呼び出します。 Azure Content Understanding は Foundry Tools の一部ですが、Azure Content Understanding スキルは、課金だけでなく、デプロイされたリソースに接続して処理します。
これらのスキルは Standard レートで課金されます。
| Skill | Description | Metered by |
|---|---|---|
| Azure Content Understanding | 高度なドキュメント分析とセマンティック チャンクのために Azure Content Understanding に接続します。 | Azure Content Understanding (価格) |
| Azure OpenAI Embedding | 統合ベクター化のためにデプロイされた Azure OpenAI 埋め込みモデルに接続します。 | Azure OpenAI (価格) |
| GenAI Prompt | Foundry チャット完了モデルを使用して AI エンリッチメント パイプラインを拡張します。 | Azure OpenAI (価格) |
Custom skills
このカテゴリのスキルは、あなたが設計し、開発し、Webにデプロイするための外部コードをラップします。 その後、スキルセット内からカスタム スキルとしてモジュールを呼び出すことができます。
カスタム スキルの作成ガイダンスについては、カスタム インターフェイスの定義と AI エンリッチメント用のカスタム スキルを作成する方法に関する記事を参照してください。
| Skill | Description | Metered by |
|---|---|---|
| AML | Foundry または Azure Machine Learning モデルを使用して AI エンリッチメント パイプラインを拡張します。 | ソリューションが従量制課金 Azure サービスを使用しない限り、なし。 |
| カスタム エンティティ参照 | ユーザー定義エンティティを検出することで、AI エンリッチメント パイプラインを拡張します。 | ソリューションが従量制課金 Azure サービスを使用しない限り、なし。 |
| Web API | カスタム Web API に HTTP 呼び出しを行うことで、AI エンリッチメント パイプラインを拡張します。 | ソリューションが従量制課金 Azure サービスを使用しない限り、なし。 |
Utility skills
このカテゴリのスキルは、Azure AI 検索 でのみ実行され、主にエンリッチメントキャッシュのノードで処理を繰り返し、ほとんど請求されません。
| Skill | Description | Metered by |
|---|---|---|
| Conditional | 条件に基づくフィルター処理、既定値の割り当て、データのマージを行うことができます。 | Not applicable |
| Document Extraction | エンリッチメント パイプライン内のファイルからコンテンツを抽出します。 | 画像抽出のための Azure AI 検索 (価格) |
| Shaper | 出力を複合型 (フル ネーム、複数行の住所、または姓と個人識別子の組み合わせに使用される可能性があるマルチパート データ型) にマップします。 | Not applicable |
| Text Merge | フィールドのコレクションからのテキストを 1 つのフィールドに統合します。 | Not applicable |
| Text Split | コンテンツを徐々に強化または拡張できるように、テキストをページに分割します。 | Not applicable |